●启动Web的搜索引擎 *本文原作者为任职于宏基的滕儒恩先生(jet@hptsdo.taiwan.hp.com)。 要教人钓鱼,把他带到海边再告诉他海里有很多鱼就够了吗?要找资料, 即使把大英博物馆搬到面前,大概也只对少数人有用。因为我们生活的20世纪 是一个信息爆炸的时代,所以不嫌信息少,倒是怕信息多得无法过滤吸收。面 对Web的信息海洋,谁有闲工夫一个站一个站地找信息? 真要这样做,恐怕胡 子白了也做不完。告诉您一个聪明有效的方法,那就是使用Web搜索引擎。 下 我们将以实际的例子示范如何使用Web搜索引擎。 当然您不用付费就可以使用 它们,而唯一要付出的就是要接收搜索引擎的商业广告,毕竟天下没有白吃的 午餐,不过这也可以让我们感受一下Internet商业化的程度。 ★搜索引擎使用实例 前不久有位大学同学来找笔者,告诉我他在一篇文章中看到:笔者的电脑 曾染上Monkey病毒,后来通过Internet解决。现在他不幸也中了这个病毒。由 于笔者对于病毒亳无兴趣,因此并未备份解毒程序,当下即兴表演搜索引擎的 使用,前后不到10分钟中就把该同学的问题解决了。 在全部的Web搜索引擎中,我只记得一个Yahoo。由于曾经中毒,因此大约 记得解Monkey病毒的工具好像是“Killmonk”。在连上Internet后,我的操作 如下: 1.执行Yahoo上的查询服务 在Yahoo的Search(查询)框内输入关键字“Killmonk”后,Yahoo即进行 查询。但Yahoo的查询失败了, 它告诉我找不到任何包含Killmonk字符串的信 息。但是在“Other Search Engines”部分,Yahoo建议我使用Lycos、Web Crawler、EINet、Galaxy等搜索引擎。 2.我听从Yahoo的建议,进入Lycos搜索引擎,Lycos的页面上有“Internet Search”的超链接,于是再度输入Killmonk关键字, 这一次Lycos搜索引擎调 用了InfoSeek这个枪手,找到了Killmonk的地址,即OAK Repository站点中的 SimTel/msdos/virus/目录下。 3.再跟着超链接到OAK Repository服务器,果然Killmnk3.zip就在那里。 不是输入“Killmonk”吗,怎么找到Killmnk3.zip? 这要感谢英明的Web搜索 引擎,它是确确实实地去搜寻所有含Killmonk字符串的信息——您可以看到在 Killmnke.zip下面有一行含“Killmonk”字符串的说明,并且笔者的大小写并 未困扰搜索工作。 4.取回档案使用 现在,笔者点选Killmnk3.zip的超链接后,即取得这个解毒软件啦! ★Web搜索引擎值多少? Yahoo( http://www.yahoo.com )这个提供Web信息目录与查询服务的服 务器是由加州史坦佛大学两位研究生: Jerrry Yang与David Filo所共同开发 的。自与Netscape Communications公司建立关系后,他们得到3百万美元的资 助,用于将Yahoo查询服务转为公司经营。Lycos( http://lycos.cs.cmu.edu ) 则是由卡奈基梅隆大学的MichaelL Mauldin博士负责。据统计,另一个著名的 搜索引擎Web Crawler( http://webcrawler.com ) 每周接受200万次以上的 查询,其作者华盛顿大学电脑系博士班学生Brian Pinkerton以100万元美元以 上的价格卖给了America Online。 既然Web上的搜索引擎如此热门,让厂商趋 之若骛,那么倒底一个搜索引擎提供那些服务?如何执行查询?查询多少信息 呢? 这些问题的答案,就在这些搜索引擎的主页,尤其是以文件为主(document -based)及表格为主(Form-based)的查询(query)上。以Lycos为例,它的 通用网关接口(Common Gateway Interface,CGI) 在笔者输入要搜寻的字符 串后,即查询该查询服务可否在本地服务器上进行,当判断无法在本地执行时 即将该查询服务向Internet上的其他Web搜索引擎发出。这也就是刚才Lycos调 用InfoSeek查询的原因。 InfoSeek在其80种电脑期刊、10000个Usenet论坛及 40万张Web页的信息中将信息通过Lycos回传给笔者的Web浏览器。 聪明的读者 一定会问我: 为什么不直接向InfoSeek( http://www.infoseek.com )查询 呢?没错,您的确可以不用Lycos,更不用Yahoo,而用Infoseek去找答案,这 样做也可以节省上Internet的时间,但是这件事可要浪费您大脑至少15字节的 空间(想不通的人请用E-mail问我 :-D)。 ★Web游侠、大蜘蛛和机器人 在Web搜索引擎出现以前, Internet上早就有了许多查询信息的工具,如 archie、gopher、veronica及WAIS等。但Web搜索引擎出现以后, 立刻打得小 地鼠(gopher)们灰头土脸,风度尽失。 到底Web搜索引擎如何分类呢?搜索引擎按照功能的不同可以分为Web游侠 (Wanderers)、大蜘蛛(Spiders)及机器人(Robots)等三种。按W3 Search Engines( http://cuiwww.unige.ch/metaindex.html )的划分,Aliweb ( http://www.cs.indiana.edu/aliweb/search )可以说是一个典型的Archie -link Web索引查询器;WebCrawler( http://www.webcrawler.com )则属于 大蜘蛛型的Web目录搜寻器;而Harvest Broker ( http://town.hall.org/Harvest/brokers/www.home.pages/query.html ) 则属于WAIS型的Web封面页查询器。 事实上,游侠、大蜘蛛或机器人并无严格 的规格加以区分, 它们的查询功能则完全视该服务器表格的制作以及CGI运用 的情况而定。以Lycos这种速度较快的机器人为例, 其搜索程序是以“广度搜 寻”(breadth-first)为主,因此其回应效率远较“深度搜寻”(depth-first) 为高。 如何才能用好各种Web搜索引擎呢?这里有两个简单的原则: 1.选择正确的服务器 以共享软件的搜索为例, 相信大家都知道CICA及SimTel两个文件储存站, 著名的Shase(共享软件搜索引擎)就是包含这两大站的正确服务器, 那么到 哪里去找正确的服务器呢?各位可以参考上面提到的Yahoo及W3 Search Engines。 2.使用正确的语法 一般来说,搜索引擎的查询语法愈复杂就愈有效,也愈准确。各服务器使 用的搜索程序不同,查询语法也不相同。比如有的搜寻引擎不支持AND/OR逻辑 语句,有的则对单词大小写要求苛刻,如bill clinton非要写成Bill Clinton 不可。不过别担心,通常搜索引擎的封面页都会有详细的帮助(HELP)信息, 指导你如何正确输入查询要求。 ★搜索引擎推荐 好东西要和好朋友分享。如果希望我推荐好的搜索引擎,那么根据笔者的 的经验,除了上面提到的Yahoo、Infoseek、Lycos等等,还可以试试下面几个: http://www.altavista.com http://www.excite.com http://www.webcrawler.com http://www.opentxt.com 此外,许多浏览器都提供了搜索功能。Mosaic在“Startin Points”中, Netscape在“What's new”及“What's cool”中为我们介绍Web站,并且Netscape 更在“Net Search”支持InfoSeek的搜索引擎服务。 好站不必多, 因为没有人会为了找一个信息而把所有Web服务器浏览完毕。 但Web搜索引擎却是大家一定要知道的, 因为它可以让您守株待兔般地获得所 需的信息。