2010/02/08

利用 DocFetcher 找尋文章內容

你有過『記得看(寫) 過一段文字,可是忘了是在哪個檔案裡』的經驗嗎?

以前你要把所有的檔案一個個開啟再慢慢的尋找,今天介紹 DocFetcher 這套軟體,讓你可以直接對每個檔案的文章內容做搜尋,幫你找出符合條件的檔案。

之前介紹利用 Everything 這套軟體找尋檔案,以及利用 Everything 分享檔案的時候有提到 Everything 祇能找尋檔案名稱,不能進行檔案內容的搜尋,不過現在這個缺撼可由 DocFetcher 彌補了!所以趕緊下載來使用吧!

軟體資訊

官方網站:DocFetcher
系統需求:需安裝 Java
下載點一:從這裡下載
下載點二:下載包含 DocFetcher 的 PStart 軟體包

將 DocFetcher 安裝好,第一次執行時會看到一個非常簡單的畫面。整個畫面劃分為三大部份,左上方為支援的檔案種類列表、左下方是可以搜尋的資料夾 (目前還是空的)、右方是搜尋結果畫面。

DocFetcher 畫面左上方條列出能支援的檔案類型。

DocFetcher 支援的類型很多,包含新舊版的 MS Office (2007 也在支援之中)、在各個國中小大力推行的 OpenOffice.org,以及,出乎意料的,pdf 檔案。無論文章內容躲在哪個檔案中,我們幾乎都有把握能把它揪出來。

建立索引資料庫 (Index)

看到 DocFetcher 支援這麼多種檔案,我馬上手癢,想試看看它的能耐。

不過現在還沒辦法進行搜尋,因為 DocFetcher 不知道要去哪邊找文章,所以我們要先指定資料夾給它。

在畫面左下方按右鍵,選擇『Create Index』就可以指定要找尋的資料夾。

在跳出的視窗中選擇想要進行搜尋的資料夾

按下確定後,DocFetcher 會再跳出一個視窗,問我們是不是要針對這個資料夾內的檔案進行搜尋。如果沒問題的話按下 Run 按鈕就可以了。

然後就可以看到 DocFetcher 開始針對資料夾裡的檔案進行索引。索引的時間依照檔案的大小、數量而定,在它進行索引時就先把電腦空著讓它忙吧。

為什麼要進行索引呢?

DocFetcher 進行索引時會把一些資料寫入自己的資料庫中,日後我們進行文章搜尋時,它就從自己的資料庫裡尋找,這可以讓搜尋的速度加快許多。

如果不做這個動作,以後我們每次要搜尋文章時,DocFetcher 就得把檔案一個個打開、搜尋、關掉、再開下一個檔案……。可是做了索引資料庫後,它祇要開啟資料庫、搜尋、把符合條件的結果呈現出來。

所以,現在短短的等待是值得的,就耐心等吧!好消息是,其實 DocFetcher 建立索引資料庫的速度很快,幾百 MB 的文件資料,3-5 分鐘就索引完成了。

如果有檔案索引失敗,那麼會在索引畫面下方出現失敗訊息,那些檔案就沒辦法進行搜尋,但是其他索引成功的檔案仍然可以進行搜索。

如果你的檔案分散在各個資料夾內,你可以逐個加入,讓 DocFetcher 對每個資料夾都建立起資料庫。

在 DocFetcher 建立好索引資料庫後,如果檔案有更動,它也會自動更新資料庫內容。不過,如果你不放心的話,也可以手動強迫它更新資料庫,隨時讓資料庫的資料都是最新的。

有了索引資料庫後,我們馬上來試看看 DocFetcher 的功力吧!

開始使用 DocFetcher 搜尋文章

不過,很多國外的程式都不支援中文,對於那樣的程式,不管功能再強,我們也祇能望之興嘆。DocFetcher 會不會祇支援英文、不支援中文呢?還有,一些人常用的日文它能不能支援呢?

為了確切瞭解 DocFetcher 的能耐,我把『聽卡通歌曲學生態保育』那篇文章中介紹的日文歌詞 copy 進 Word 檔中,待會就用 DocFetcher 找看看能不能找到我們要的資料。

在右上方的搜尋欄中鍵入想要搜尋的字詞:『大象』

按下 Enter 鍵後,馬上找到三筆資料。所以中文測試正常,DocFetcher 可以找中文的資料。不過出來的結果有點討人厭。那個第二個檔案是怎麼一回事?怎麼是空白的?難道它沒有名字嗎?

把視窗放大來看,才發現,原來 DocFetcher 把檔案名稱放在後面,前面是文件標題。不過,一般人大概都不會去設定文件標題,甚至也不知道怎麼設定。所以像第二個檔案這樣沒有文件標題的就變成空白了,看起來實在很討厭。

難道沒有其他改進的方法嗎?有的,其實在 DocFetcher 中,你可以自由決定欄位的順序。祇要用滑鼠按住欄位名稱,再拖拉至適當的地方放開滑鼠左鍵,這樣就 OK 了。

例如我要把『Filename (檔名)』這一欄拉到最前方,我祇要按住 Filename 按鈕,拉到最前面就可以了。

拉好後,Filename 欄位就顯示在第一欄了,這樣看起來習慣多了!:)

好,當我把滑鼠點在被找出來的檔案上,右下方就立即出現這個檔案的內容。

以『大象的眼睛為什麼是藍色的』這個 Word 而言,檔案中共提到『大象』這個詞 6 次,而且被找到的資料現在都已經特地用黃色標記出來,可以按上、下箭頭觀看。

嗯,這不是我要的資料,換看『學生彼此出題』這個 Word 檔的資料。

太好了,我就是要這個檔案內的資料。

要開啟原始檔案也很簡單,祇要在檔案名稱上按兩下,就可以開啟原始檔案了。比方說我在這個『學生彼此出題.doc』上按兩下。

DocFetcher 就幫我把這個 Word 檔開啟啦!我祇要在 Word 中再搜尋一次『大象』,就可以找到我要的部份了。

(ㄟ,如果 DocFetcher 可以直接開啟到我要的部份,那就太完美了。不過目前做不到。)

找中文看起來是沒問題了,那麼日文資料能不能找到呢?

一樣是 OK 的。不論這個資料是在 Word 檔或是在 pdf 檔中,都能夠正確的找出來。

由於 DocFetcher 可以支援中文,搜尋 Word 檔、pdf 檔都沒有問題,它應該能符合多數人找尋文章內容的需求。如果你曾經為了找尋『不知道在哪個檔案中的文章內容』而困擾,那就趕緊開始使用它吧。搭配 Everything 一起使用,會讓你尋找資料時更加便利。

使用時機

知道檔名:利用 Everything 尋找
不知檔名,祇知檔案的大概內容:用 DocFetcher 搜尋文章

我已經把這兩個檔案都放進 PStart 軟體包,直接下載軟體包解壓縮就可以使用。希望有了這兩個工具,我以後再也不會把檔案給遺忘了。

延伸閱讀

Technorati : , , , , , , , ,

3 則留言:

  1. 請問我輸入“緣份”,結果搜尋出有“緣”及“份”的文件,請問怎麼回事?

    回覆刪除
    回覆
    1. 你可以把字打在“”中間 就只會搜尋引號中間的字

      刪除
  2. 因為軟體的作者是外國人,沒有考慮到中文的部份,所以就會出現這類的情況。

    不過還好,還能勉強使用,總比沒有好。

    回覆刪除