現在互聯網上大大小小的搜索引擎大約有幾百個之多,而且都聲稱自己是最好的。但若隨便抓起來就用,可能會事倍功半,甚至越搜索越糊涂。所以,花一點工夫挑選恰當的搜索工具是值得的。那么,什么樣的搜索工具才稱得上恰當呢?一般來說,有以下幾條判斷標準。 (1)搜索范圍 搜索引擎的搜索范圍是否廣泛,即收集的網站(或網頁)數目大小,直接影響到搜索結果的完備性。搜索范圍分別為二十個網頁和二十億個網頁的搜索引擎,根本不存在可比性。雖然搜索范圍越廣泛越好,但是在某些特殊的檢索中,例如查詢某地的天氣情況時,信息的準確性更重要,而搜索的范圍只要包括權威的氣象機構就可以了。 (2)檢索速度 檢索速度也很重要,對于相同的檢索任務,當結果水平基本相同時,速度提高一倍相當于查全率提高一倍。 (3)查全率與查準率 查全率與查準率是評價信息檢索系統的重要標準。信息檢索的查準率,也稱為精度,是檢索結果中相關信息文檔數與查詢結果總數之比。信息檢索的查全率又叫做召回率,是實際檢索出的相關信息文檔數與信息庫中總的相關信息文檔數之比。二者之間存在著一定的互逆關系,即追求高的查全率的同時,查準率會降低,反之亦然。一般說來,想通過檢索解決一些具體問題的用戶要求查準率高一些,進行課題查新的用戶要求查全率高一些。查全率與查準率的計算公式如下。其中a和b分別為查出的相關和不相關的文獻量,c為未查出的相關文獻量。 (4)功能水平及易用性 理想的搜索引擎應該在搜集信息、匹配用戶搜索要求、搜索結果及顯示結果的各個階段具有不同程度的智能水平,既能高質量地滿足用戶需求,又易于用戶使用。在目前的技術環境下,最起碼應是圖形界面,并帶有選項功能的下拉菜單,可以使用像等操作符來連接詞或詞組,這樣可以縮小搜索范圍,甚至可以限定日期、位置、數據類型等。在功能上還有一些其他具體的考慮,比如漢字碼的轉換和匹配、全文搜索等功能能否實現等。 目前國內的搜索引擎大都能同時提供GB碼、BIG5碼兩種漢字的檢索界面。尤其是悠游,它具有漢字內碼的自動轉換和跟蹤功能。如果用戶使用的漢字環境與正要查看的網頁代碼不同,它會自動地插入一個中文網頁過濾器,保證用戶屏幕上出現正確的代碼,甚至一直追蹤用戶的漫游路線,直至用戶離開中文區域。一般的搜索引擎均能支持關鍵詞的簡單查詢,而全文式搜索引擎則更增加了一些高級查詢功能,即通過對關鍵詞的各種修飾限制,來使檢索的結果更加精確。一般來說,越是優秀的搜索引擎,提供的查詢限制功能越多、越合理。 |