中文搜索网站介绍与比较

作者:马林

  
  中文网站并不多,与英文网站比起来,前者的数量不及后者的百分之一。但中文搜索网站并不少,目前已经有几十个。当英文网站处在中文网站目前的发展阶段的时候,还没有什么东西能帮助人们在网上搜来搜去。这一切要归功于Yahoo!等公司,他们在商业上的成功,以及他们在建设搜索网站方面的经验,对中文搜索网站有莫大的影响。要知道,有不少中文搜索网站都把“成为中国的Yahoo!”作为自己的目标。

  本文对众多的中文搜索网站进行介绍和比较,如果能帮助读者选择适合自己的中文搜索网站,那是再好不过了。退而求其次,能提供一些中文搜索网站的网址,也是一件有苦劳的事。

  本文介绍的中文搜索网站都支持简体中文(国标码,GB),当然其中一些搜索网站同时还支持繁体中文(大五码,BIG5)和英文及其他语种。那些仅支持繁体中文的搜索网站没有包含在本文中,其中有一些是值得称道的搜索网站,如“哇塞!”。

  我们介绍中文搜索网站时,部分网站的下面有一段“自我评价”,都是从各自的网页上得来,只代表该搜索网站的观点,并不代表我们的意见。

  中文搜索网站的发展速度非常快,简直是一日千里。我们这次的比较是始于1998年6月上旬,终于6月中旬,所以本文只反映这段时间中文搜索网站的状况。


  雅虎中文(Yahoo!)

  gbchinese.yahoo.com


  自我评价:收录了全球资讯网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,只要是好的中文网站,你都可以在这里找到。

  Yahoo!是目前最火爆的搜索目录网站,它不久前开设了中文网站:雅虎中文。和其他支持中文的国外搜索网站比较,雅虎中文的突出特点是进行了彻底汉化,整个页面几乎都是中文,中文页面大大方便了不熟悉英文的使用者。

  雅虎中文和Yahoo!英文一样提供主题式分类目录。如果你有确定的搜寻主题,雅虎中文是一个很好的选择。如检索框键入想要找的主题词,按Search键(这个关键的地方竟然没有翻译成中文),雅虎中文搜寻引擎就会在自己的分类类目和资料库中搜寻符合条件的网站。由于Yahoo!采用这种工作方式,搜索结果返回的速度要快一些。和国内搜索网站比较,雅虎中文的速度是一个优势。

  检索结果先列出符合条件的雅虎中文类目,接着是符合条件的相关网站。你可以选择浏览雅虎中文类目内的网站或直接点选相关网站连结进行浏览。

  雅虎中文有一些特定的进阶检索格式用来获得更精确的检索结果:例如,利用双引号查询完全符合关键字串的网站,键入“中文输入”,会找出包含中文输入的网站,却会忽略包含“中文形声输入”的网站。又如,在关键字前加“t: ”,搜索到的只是网站名称,而在关键字前加“ u: ”,只能得到网址 (URLs)。

  雅虎中文可以用英文搜索中文站点。


  Excite

  www.excite.com


  Excite没有为中文用户提供专门的中文页面,其主页上也没有任何信息告诉人们:它支持中文搜索。我们是带着一丝怀疑往搜索框中键入中文的。

  Excite在每一个搜索结果的下面都提供“搜索同类文件(Search for more documents like this one)”的链接,如果使用者找到了合适的结果,可以利用这个链接扩大战果。

  用Excite搜索英文关键词,得到搜索结果之后,在搜索框的下面,还给出一些提示词(Select words to add to your search...),使用者可以选择其中一些词加入参加搜索,以增加搜索的精确度。但在使用Excite搜索中文关键词时,就不能看到这个功能。

  用Excite搜索英文,其结果是按照新闻、目录和站点分类列出的。而用Excite搜索中文,搜索结果是混杂在一起的。显然,Excite中文搜索的功能还不能和它的西文搜索相比较。

  Excite现在也提供个人起始页服务,使用者可以定制自己需要的新闻、金融信息。Excite的个人起始页没有Yahoo!做的那么老练,但由于它的中英文搜索使用同一个页面,中国用户可以在个人起始页就开始中文搜索,这点要比Yahoo!方便一些。


  AltaVista

  altavista.digital.com


  自我评价:AltaVista搜索服务的能力、范围和速度都是无与伦比的。不断改进的AltaVista是寻找网页信息的无价工具。最近AltaVista在翻译方面取得成功,能把单词、短语甚至整个网站翻译成不同的语言。类似的革新使我们的搜索服务成为数百万Internet用户的选择。

  Altavista的突出特点是翻译功能。使用者可以用英文词搜索中、英文站点,也可以用中文词搜索中、英文站点。确切地说,可以用各种语言搜索各种站点。

  一开始,我们在Altavista英文页面(altavista.digital.com)的搜索框键入中文进行搜索,没有结果。我们又选择了搜索框上边的“Search the Web for documents in Chinese(搜索中文站点)”,仍是一无所获。后来才在Altavista页面的最下方发现一排细小的选项,其中有“Set your Preferences(设置你的参数)”,在参数设置页的Encoding(编码)项选择GB码,确认之后(点击页面下方的Set Preferences按钮),才可以自由地使用中文搜索。

  用Altavista搜索中文网站,要先选择搜索框上面的“Search the Web for documents in Chinese(搜索中文站点)”。如果用英文进行搜索,得到的结果是用英文显示的,网页的名字、说明都是英文;当然,点击这些英文说明的中文站点,用户最终进入的是中文网页。而用中文词搜索的中文网页,得到的搜索结果就是用中文显示的。

  Altavista有一个中文页面(altavista.digital.com/av/oneweb/query_euccn.html),要找到中文页面,需要经过一段曲折的路途。先在Altavista的英文页面(altavista. digital. com)上找到“International(国际)”,然后选择其中的“Search in Chinese(用中文搜索)”,进入Altavista的亚洲页面,再选择这页上的GB码,就进入Altavista的中文页面,这里可以用中文搜索中文网站的页面。中文页面非常干净,没有任何枝节,只有一个搜索框,上面有“在网上查找中文文件”的中文字样,告诉你可以搜索中文。


  悠游中文搜寻引擎(Goyoyo)

  www.goyoyo.com


  自我评价:一个极具高度智慧的中文搜索器,随时带你畅游全球40万个中文互联网网页,自动为你转换繁、简体字,让你悠游其间,乐也融融!假如读者不懂任何中文输入法,也可以使用分类检索,而找到自已心目中所喜爱的文章;更可借着相关网页的索引,进入其他相关的网址,而绝不费神!

  Goyoyo所说的“智慧型搜寻”指的是:超智能Robot(机器人)按时主动地寻找新网页资料,自动地在网页文章内找出关键字或词,作精细的区分。在按使用者要求进行搜索时,能把合适的文章和有关连性的文章一并找出。如:读者要找有关“音乐会”的文章,Robot会把有关“演奏会”、“演唱会”、“钢琴演奏会”、“莫扎特”等内容的文章也找出来。Goyoyo还说,“用户无需使用空格把词分开,可完全按照书写习惯输入检索请求,方便易用”。

  但机器人的“智慧”毕竟有限。搜索简单而常见的词它一般没什么问题,如果稍稍复杂一些,它就会手足无措,并且会自作主张地替你拆分词汇。我们搜索“欧洲杯”时,搜索器确认有效的关键词是“欧洲”,“杯”字无效,得到的2000 个相关网页当然惨不忍睹。此外,不管搜索什么,Goyoyo总要拼凑2000个搜索结果给使用者,让人不胜其烦。Goyoyo还有“匹配型搜寻”,即严格按照字面进行搜索。

  Goyoyo的页面上共有3种搜索方式:“键入”、“选项”和“其他”。智慧型搜寻”和“匹配型搜寻”是第一种。

  第二种搜索方式是为了照顾不会中文输入的人,提供14类选项供用户选择。点击这些选项,等同于键入相应的搜索词,因此,其结果和第一种同样不妙。我们选择“人文科学”类的“历史”,得到的是以“庙中情缘” 和“酒井法子”开头的2000个杂乱的网页。

  Goyoyo搜寻器的第三种搜索方式是“其他”。它收录了6个英文搜寻器Yahoo、Infoseek、Altavista、Excite、HotBot和Lycos,用Goyoyo查不出中文,干脆去查英文!

  Goyoyo标榜“自动转换繁、简体字”,但它实际处理各种文字编码的能力让人不敢恭维。使用者得到搜索结果后,满心欢喜地点击那些网站,会发现Goyoyo独具特色的缺陷。搜索结果只要涉及到文码切换问题,就会看到一个提示信息:“这个网页是经过悠游搜索引擎GoYoYo处理的。如果这个网页有问题, 请从http:/XXX取得原始网页。”使用者还要从相应的网址出发,才能达到目的。


  美国世页(Globepage)

  www.globepage.com


  自我评价:独特的技术革新满足了当今网络用户的需要。其搜索引擎利用Java技术帮助使用者阅读网站内容,避免了安装各种中文、日文和朝鲜文的麻烦。由于有个性化的内容和服务,美国世页将成为信息提供者和信息需求者的第一网站。

  美国世页(Globepage)在页面上写了“为亚太地区服务”,这也是它可称道的地方。使用者可以在同一个页面里直接选择英文或者中文进行搜索,这一点要比AltaVista方便。美国世页有中文页面(www.globepage.com/index-gb.htm),虽然这个页面在使用某种浏览器时会出现一些破碎现象,但总算是有了中文搜索界面。

  美国世页搜索的结果可以限定在中国、韩国、日本或者美国。使用者可以利用关键字、词组或者主题词甚至整个句子搜索英语网站和中文网站。美国世页也提供了内容繁杂的搜索索引词。

  美国世页每个搜索结果都有评分,但搜索结果的排列确与这个评分毫无关系,显得杂乱无章,白白浪费了评分花费的时间。并且有一些是死链接。


  茉莉之窗(ANSeRS)

  www.jansers.org


  自我评价:茉莉之窗荣获1997年香港工业奖之香港工业总会消费产品设计优异证书。茉莉之窗向您展现 552203 个精彩的中文网页!这个系统正处于研究阶段,请留意新的特点。:-)

  茉莉之窗是香港中文大学制作的搜索网站。和Goyoyo一样,使用者可以按照书写习惯输入检索请求,无需使用空格将词分开,茉莉之窗系统将自动拆分其中有效的关键词,其拆分功能也经常自作主张。茉莉之窗的分类主题搜索要比Goyoyo清晰一些。

  茉莉之窗的搜索结果按照相关程度的分数排列,每个结果后面还有“相关网页”、“网页过滤”、“快速浏览”几项。


  中文查寻引擎

  www.searchchina.com/cgibin/chsearch


  自我评价:设计者们深信本中文查寻引擎将为中文使用者提供一个高技术、高质量、经久不衰的中文查寻系统,它强大而迅捷的查寻功能将带领您在网络中畅游!

  中文查寻引擎的数据库内容少得可怜,我们搜索“世界杯”、“核试验”等词都没有任何结果。它的表现与它“成为全世界中文网络信息查寻领域的领先企业”的志愿相差太远。


  Openfind

  www.openfind.com.tw


  自我评价:新的大型搜索引擎,第一个真正的“全球”搜索引擎,允许用户使用各种语言搜索网络资源,带有容错匹配功能。

  Openfind的突出特性是模糊匹配技术(fuzzy matching techniques):即使是包含拼写错误的搜索请求,也能被Openfind搜索到。为了尝试这一功能,我们搜索了“世界杯”,被告知要重新输入或者选择模糊搜索,选择模糊搜索后,马上就得到11个相关的搜寻结果,其中一些是与“世界杯”有关的。

  Openfind允许用户检查文件为何被选中。在每一个搜索结果的摘要中,匹配词以突出方式显示,用户可以参考匹配方式,决定每个搜索结果是否符合自己的要求。在众多的搜索引擎中,这个功能只有Yahoo!等少数网站能做到。

  Openfind提供全球多语言智能搜索,使用者能用任何语言搜索网站。

  Openfind有简单搜索、逻辑运算搜索和自然语言搜索几种工作方式,搜索结果不多,但质量较好。同类或相关的搜索结果被排在一起。


  Sinanet

  www.sinanet.com


  利用Sinanet搜索引擎自身只能找到较少的内容,没有什么值得称道的地方,并且链接上Sinanet也是件非常困难的事。

  但Sinanet可引用Excite的中文搜索(search.sinanet.com/index_gb.html),详情参见Excite的中文检索。


  华页指南

  www.c3s.org.sg


  自我评价:一个以华文为主的网页,其目的是收集世界各地有用的华文网际网络资讯,让网络使用者能通过一站点的服务,在第一时间和地点获取最新资讯。

  华页指南是新加坡不久前设立的中文搜索引擎,它搜索的结果如果是英文的,就在前面加个“英”字,如果是繁体中文的,就在前面加个“繁”字。搜索结果在形式上过于简略,只是一些网站的名称,缺少应有的描述。搜寻内容的数量也不能令人满意。

  华页指南可以流畅地使用中英文搜索。它还提供一些中文输入方法。


  搜狐(Sohoo)

  www.sohoo.com.cn


  自我评价:根据中国人的文化传统专门为中国用户度身设计推出的网络分类式搜索引擎。它的出现,填补了国内互联网发展的一项重要空白,极大地方便了中文用户。“出门靠地图,上网找搜狐”将成为1998年中文网上世界的一句口头禅。随着搜狐信息内容的不断丰富,技术力量的不断完善,搜狐吸引了越来越多的用户。

  搜狐的特点是突出的,搜狐分类搜索区拥有近5万个中文网页链接。进行一般搜索时速度很快,质量也不错。显然,它的内容太少了,

  我们搜索“核试验”、“禁毒”等词都没有收获,搜狐的内容还有待于增加。

  我们搜索一些东西,没有结果,搜狐对此没有任何提示,只是显示出带搜索框的一个白页。


  Richsurf

  www.richsurf.com/richsurf


  Richsurf的界面很漂亮,搜索速度快,搜索结果的内容不多,但质量无可挑剔。

  Richsurf在内容数量和时效性方面需要做一些工作。当我们用“核试验”作为关键词进行检索,竟然得不到结果。而我们观看Richsurf'Choices的体育新闻专栏时发现了这样一些链接:“中国奥运快讯”、“百年奥运中国页”、“1996亚特兰大奥运会实时报道”……其中有的链接竟然还能工作。


  Cseek

  www.cseek.com


  整体上看,Cseek的搜索功能还是不错的,它对每个搜索结果打分,并按照得分高低排列。但我们注意到,其中有一些重复链接。我们搜索“世界杯”时,得到大量的九八世界杯32强的网页,其中罗马尼亚、意大利、德国、智利等队反复出现。

  Cseek搜索引擎支持复杂的精确搜索,但使用者需要花些时间学习一下它独特的搜索规则。除了常见的逻辑运算符号AND、OR和NOT外,Cseek还有NEAR、PHRASE、逗号等符号,甚至还可以使用“?”、“*”等通配符进行搜索。利用这些规则可以提高查找的准确率和速度。

  我们在Cseek的帮助文件最下面发现这样一段话:“本版本是测试版,测试将在1997年11月30日结束,在此期间,ChinaByte的中文搜索引擎将逐渐完善。我们欢迎并感谢您将查询中遇到的问题及时反馈给我们。”而我们的测试时间是1998年6月9日。


  Yeah搜索引擎

  www.yeah.net


  网易公司制作的Yeah搜索引擎可以方便地搜索到大量的个人主页,一些与游戏相关的网页是它的长项。

  除了简单搜索,Yeah搜索引擎还支持逻辑查询和多词查询,并且能自动识别中英文。如果搜索没有得到任何结果,可以使用模糊查询。其搜索速度和质量还让人满意。

  Yeah的搜索结果按相关评分多少排序,并且列出文件的大小和日期。每个搜索结果的下面有“See matched lines(看匹配文字)”,使用者可以查看该网页被选中的字句,从而确定这个搜索结果是不是自己想要找的。

  Yeah搜索引擎可以放到使用者的主页里,你能方便地使用Yeah搜索引擎。


  天网

  pccms.pku.edu.cn:8000/gbindex.htm


  天网是中国教育和科研计算机网示范工程应用系统课题之一,并被列入CERNET“九五”攻关项目,由北大计算机系网络研究室设计开发。

  天网页面左侧有几个按钮,可以选择简单查询和复杂查询,在复杂查询中,增加了模糊匹配和逻辑操作等搜索方式。

  天网显然是以科学的严谨态度来制作的。其搜索结果排列得很有条理,每一个搜索结果都有最近修改时间、文件长度、相关度评分和编码类型等有用的信息。搜索结果页面上有隐藏摘要、复杂查询、简单查询等选项。

  天网说自己大约收集了60.6万个WWW页面(国内)和9.6万篇Newsgroup文章(使用news.pku.edu.cn)。它还公布了最近更新时间。它承认自己目前不支持URL名检索。


  看中国

  search.readchina.com


  号称瑞得集团公司制作的又一力作,没有更多的自我宣传,似乎颇有自知之明。总体感觉:运行速度尚可,查询结果中的网址重复不多,死链较少。但由于收集的网站不够全面,很有可能遇到搜索结果为零的情况,有待于进一步扩充。在中文搜索引擎不断涌现的形势下,“看中国”只是极为普通的一员。


  若比邻

  www.robot.com.cn


  自我评价:前身是中国导航(最早为中国人服务的Internet导航工具之一),全新设计的中文搜索引擎“若比邻”,为中文用户提供权威的中文站点及网页查询服务,具有三大特点:全、易、快。所提供的查询服务做到了查询站点全、适用面广、查询方式全、操作简便、易学易用。由于采用了先进的检索算法和对信息的合理分类,用户在查询信息时,将不再无奈地等待屏幕信息的出现。

  客观地看,“若比邻”虽然不及自我夸口的那样神乎其神,倒也算得上是值得一用的中文搜索网站。该引擎由三大部分导航系统组成:第一部分是中国上网单位导航,专为用户查询某类单位企业是否在Internet上及上网单位的相应信息,是目前唯一提供此项查询功能的中文站点。 第二部分是站点导航,根据站点提供的服务和信息归纳分类,为用户提供全方位查询模式,定期发布优秀站点推荐。 第三部分是网页导航,为用户提供最直接最基础的信息源—网页,定期发布优秀网页推荐。此外,“若比邻”接受用户自荐,并将对自荐站点、网页进行审核,情况符合会将自荐信息加入“若比邻”数据库。测试结果:速度较快,但关键词索引的划分略显生硬,我们想搜寻一些关于泰山旅游信息,输入“泰山”搜索,结果却为“泰山将军队”信息。


  网现引擎

  www.search.com.cn


  由瀛海威信息通信有限责任公司制作,提供主题式分类目录。除了帮助提示外,没有更多的自我说明,或许表明它简洁明了,但给人的感觉正像它的冷色调界面一样稍有不适。

  该引擎提供了一些可作为查询语句一部分的基本操作符,例如,AND 可寻找用该操作符连接的两个单词都包含的文档;OR可寻找用该操作符连接的两个单词至少包含一个的文档,NOT可寻找包含该操作符前的单词但不包含该操作符后的单词的文档;逗号可寻找那些至少包含一个指定单词的文档。查询以“越多越好”为评价原则。因此同查询单词匹配得越多的文档将在结果列表中列在越上面。其速度尚可忍耐,会在你耐心将尽时出现搜索结果,而大量的重复搜索则会把你剩余的耐心耗完。试着在“旅游景点”项目中输入“张家界”,得到21个搜索结果,而其中有9个是“大恒商海”同一个站点,重复率之高可见一斑。


  司南中文网上信息检索(Yippee!)

  www.yippee.com.cn


  自我评价:采用较为完善的分类体系和数据库设计,由专职人员负责登记网址,吸收了中经网信息导航、台湾的哇塞以及香港的Goyoyo等引擎的众多优点,克服了它们的不足,以特有的面貌跻身搜索引擎行列,等待广大用户的评价。

  司南的结构模仿Yahoo!,但是在内容上只收录中文信息,提供更多的介绍文字,以及通过关键词检索,共搜集了11151个站点。可提供是否包含同义词搜索的选择,如选择包含同义词,在输入关键词“电脑”进行搜索时,含有“计算机”的有关站点将会出现在搜索结果中。网点的中文名称定为司南,我们希望这个网点像古老的司南一样,成为Internet用户探索网上世界的指南针。应当承认,该搜索引擎是较为成功的,但其搜集网站的数量有待于扩充,在聊天室如火如荼的今天,司南只能为你提供5个网站。

  司南自称,除不断增加更多网址外,还计划在近期内升级服务器,采用程序自动消除死链,以及增强条件查询的功能,让我们拭目以待。


  常青藤

  www.tonghua.com.cn


  自我评价:努力发展成为中国最佳中文网站分类、检索服务的提供商,最终冲出亚太,走向世界华人区;成为网上实用的、最受欢迎的中文信息的提供商和联机服务商。

  常青藤搜索速度时快时慢,最慢可以达到让你最终不得不放弃等待搜索结果的来临。全文搜索的结果中经常会含有大量的多余信息,向你证明着被迫接受不需要的东西是一种痛苦。


  北极星

  www.beijixing.com.cn


  特点是,具有中英文对照查询功能,即可在查询框中输入中文(或英文)词后再选择中英对照查询,则返回的检索结果包括所有输入的中文词和英文词的条目。例如:输入“中国”(或china),再选中中英对照查询,则检出的结果为所有包含“中国”或“china"的条目。此外,同大多数同类站点一样平平无奇,很可能被你忽略。


  华好网景

  www.chinaok.com


  “华好网景”花哨的主页页面与查询结果的清楚整洁形成鲜明对照,如果不介意主页面的杂乱无章,你会发现它还是一个不错的引擎。查询结果基本见不到重复,且排列清晰,一目了然,没有更多的不必要说明。搜索速度也是你在目前条件下完全可以接受的。相信注重实效的人会喜欢这一类搜索网站。


  网络指南针

  compass.net.edu.cn:8010


  自我评价:网络指南针收集了中国教育和科研计算机网、ChinaNet、中国科技网、中国金桥网等网络上大量的信息资源,网页多达20万页。向用户提供中、英文信息查询服务,以及中、英文翻译和拼音转换功能,用户可以选择各种输入方法进行查询。

  网络指南针的特色在于查询方法的多种多样,有直接输入、拼音输入、英文翻译输入等,查询系统可以进行中、英文信息检索。例如,输入“足球”,查询系统就会返回与“足球”有关的中文网页;输入“football”,查到的结果是英文网页;输入“足球football”,就会得到所有与足球有关的中文和英文网页。此外,无法输入中文可以使用拼音进行查询,在拼音输入框中输入“zu qiu”,系统会列出相应的汉字,然后可以选中适当的字组成词进行查询。查询结果将列出相关页面的标题、简要描述、URL、页面大小、查询词在页面中出现的频率等信息。其系统稳定性、查找速度均为中上之选。


  Haplink

  www.haplink.com.cn


  目录分类和它的界面一样简单,不过它提供的附加功能不少,有网上购书、技术转让、免费个人主页、 医药健康等服务。

  据自己声称,它只支持以简体中文作为关键词搜索。一次可以输入多个关键词,但每个关键词之间必须以空格键分隔。

  搜索结果是先到分类目录中搜索,而后再到摘要中查询。


  视讯中文网络搜索器

  www.gdcatv.com.cn/internet_2/search/search_china/index.html


  分类目录较为详尽,但有的目录下还未来得及放入内容,例如当我们点击“电影人物”子目录,得到的结果是:“对不起,暂时没有您所需内容”,大感扫兴。此外的不足之处是无查询帮助,在限定关键词进行查找时,会让人觉得有些摸不着头脑。但总体印象尚可,查找速度适中,重复链接不多。


  中国经济信息网信息导航

  infonavi.cei.gov.cn


  自我评价:在国内起步较早,作为“金桥工程”信息部分的主体技术之一,在表层和底层技术方面均相对领先,在CEInet开放环境成功运行一年有余,证明技术先进,信息资源丰富,在国内仍以高访问率居领先地位。

  与大多中文搜索引擎相比,CEI的速度确实值得称道,搜索结果的准确度和较少的重复查询也能令人感到比较满意,缺点在于死链情况发生较多,而且出现一些英文内容的网址。


  领先搜索

  202.96.217.39


  自我评价:具有功能强大,扩容性好,易于使用等特点,在技术上与现有的网络搜索器相比,有如下优点:1)采用强大的集群式Spider(蜘蛛)搜索技术;2)快速有效的全文搜索功能;3)采用目录分类结构,提供多达十余万种分类信息。

  “领先搜索”是领先网络技术发展有限公司经历半年工作的开发成果,充分利用了线路带宽,较好地提高了搜索效率;突破了人工分词的瓶颈与限制,使用户能快速有效地对互联网上所有中文信息进行搜索;分类形式符合中国人习惯和传统,亦吸收了西文搜索引擎分类的优点,分类中的全文搜索是“领先”的一大优势。然而“领先”能否真的一路当先,要试过才知道,进入其“商业经济”分类目录感觉速度挺快,再往下点击“各国经济”并输入“中国”查询则大失所望,速度大大降低,痴痴的等待换来的却是死链。从全部范围中进行搜索测试,证明其速度缓慢、重复查询等问题还需努力解决。


  分类


  目前的搜索引擎,根据搜索方式的不同可分为以下两类:

  1.全文(网页级)检索(Full Text Search)

  用户能够对各网站的每个主页中的每个词进行搜索。

  全文搜索引擎的优点是查询全面而充分。当全文搜索引擎遇到一个网站时,会将该网站上所有的网页全部获取下来,并收入到引擎的数据库中。只要用户输入查询的"关键字"在引擎库中的某个主页中出现过,则这主页就会作为匹配结果返回给用户。

  优点:从这点上看,全文搜索真正提供了用户对Internet上所有信息资源进行检索的手段,给用户以最全面最广泛的搜索结果。

  缺点:全文搜索的缺点是提供的信息虽然多而全,但可供选择的信息太多反而会降低相应的命中率。由于没有分类式搜索引擎那样清晰的层次结构,有时给人一种繁多而杂乱的感觉,而且提供的查询结果重复链接较多。


  代表:AltaVista


  2.目录分类式(网站级)检索(Directory)

  目录分类式搜索引擎当遇到一个网站时,它并不像全文搜索引擎那样,将网站上的所有文章和信息都收录进去,而是首先将该网站划分到某个分类下,再记录一些摘要信息(Abstract),对该网站进行概述性的简要介绍。用户提出搜索要求时,搜索引擎只在网站的简介中搜索。

  优点:分类搜索引擎的优点是将信息系统地分门归类,用户可以清晰方便地查找到某一大类信息,这符合传统的信息查找方式,尤其适合那些"希望了解某一方面/范围内信息,并不严格限于查询关键字"的用户。

  缺点:目录分类式搜索引擎的搜索范围,较全文搜索引擎要小许多。


  代表:Yahoo!


  我们认为评价一个搜索引擎性能的优劣,应该至少包括以下标准:

  1. 搜索引擎收集的网站(或网页)数目,因为这直接影响到搜索结果的广泛性。

  2. 搜索引擎搜索结果的满意度,包括查询结果相关项命中数量、死链接和重复链接的数量等。

  3. 搜索引擎数据库的更新频度、时效性。

  4. 搜索引擎提供的查询功能使用便利性,如除了支持简单搜索,是否还支持逻辑查询和多词查询,多词查询是自动分词还是须加标记,是否能自动识别中英文。

  5. 对于目录分类式搜索引擎,目录分类的合理性、分类的广度和深度、限制在类别内搜索的能力也是衡量该搜索引擎性能的一个重要标准。

  如今许多搜索网页不仅提供搜索功能,还提供了许多附加功能,如可定制个人起始页、提供免费邮箱、新闻接收机、网上游戏等,这是一个优秀站点所必须的,但这不是我们这次考察的对象,因此,在这次评测中我们不予以关注。

  关于搜索引擎数据库网站(或网页)的数量,引擎管理者最有发言权,由于条件所限,我们一方面参照发表在各媒体上的有关资料,另一方面是从搜索结果来侧面感受。由我们以每个搜索引擎返回搜索结果的第一页(一般为十条链接)作为评价搜索结果满意度的基础。考察搜索引擎的更新频度和时效性,我们有了两种方法:一是先在网上申请一免费空间,建立主页,而后向各搜索引擎申请登记,一周后搜索;二是以“世界杯”、“核试验”等当前社会新闻热点作为关键词来搜索。


  我们的推荐:


  ▲Openfind

  最值得关注的中文搜索引擎:

  ▲天网(全文检索)

  ▲Yahoo!中文(目录分类式检索)

  虽然大部分人对Openfind还很陌生,但良好的查询界面,优秀的复杂查询,满意度较高的查询结果,是我们推荐它的原因。在目前的中文搜索引擎中,Openfind提供全球多语言智能搜索,使用者能方便地用任何语言搜索网站。而且,Openfind的模糊匹配技术(fuzzy matching techniques)使得即使是包含拼写的错误搜索请求,也能被Openfind搜索到。

  作为国内中国教育和科研计算机网示范工程应用系统课题之一,天网更少的商业气息,使它能实实在在地进行技术开发。提供多种查询手段,庞大的网站(页)收集数据库,良好的查询结果,使我们相信,如果未来的几年能有良好的财力支持,它定能成为中文信息的“AltaVista”。

  虽然Yahoo!是英文查询中当仁不让的最佳搜索引擎,但Yahoo!中文在目前和国内其他的目录分类式搜索引擎相比并没有多少优势,而且目前它收集的网站(页)数量还不多,这影响了它的搜索质量。但由于其目录分类数量的丰富,以及其业界经验,如果经营者对中文市场足够重视的话,我们认为在未来的一段时间,Yahoo!中文将会有更大的发展,值得大家关注。

 

Next-->page>>回上一页,看更多资料