首页 >> 网络营销知识库 >> 搜索引擎相关知识 >> 搜索引擎发展历程回顾:WWW之前的信息检索方式(1)——Archie

搜索引擎发展历程回顾:WWW之前的信息检索方式(1)——Archie


Archie是Internet上用来查找其标题满足特定条件的所有文档的自动搜索服务的工具。

(网络营销教学网站 www.wm23.com 2005-01-11)

我们现在所说的搜索引擎都是基于WWW的,也就是基于网页的检索,如我们熟知的yahoo!、google等,不过这些并不是互联网上最早的信息检索服务,如早在1990年出现的Archie就是一种文档查询索引服务之一(1993年6月网络机器手程序“WWW Wanderer”的诞生是基于玩维网搜索引擎的雏形)。本文所要介绍Archie和下一篇文章要介绍的WAIS就是互联网早期两种常用的文档查询服务。

  Archie是Internet上用来查找其标题满足特定条件的所有文档的自动搜索服务的工具。为了从匿名FTP服务器上下载一个文件,必须知道这个文件的所在地,即必须知道这个匿名FTP服务器的地址及文件所在的目录名。Archie就是帮助用户在遍及全世界的千余个FTP服务器中寻找文件的工具。Archie Server又被称作文档查询服务器。用户只要给出所要查找文件的全名或部分名字,文档查询服务器就会指出在哪些FTP服务器上存放着这样的文件。 使用Archie进行查询前提:要查找的文件名或部分文件名,知道某个或几个Archie服务器的地址。


  在整个Internet,有一些称为Archie服务器的计算机,这些服务器提供很重要的服务——帮助你找到有特殊文件或目录的匿名FTP主机的名字。为什么使用Archie这个名字?是因为它听起来象“archive(文件、档案)这个单词。我们倾向于将Archie说成是一个人,至少是一个智能化的机器人。

  当你想要检索一个匿名 FTP 文件或目录时, 你所要做的事情是告诉 Archie你要检索什么。Archie将进行检索,然后显示每一个包含有那份文件或目录的匿名FTP主机的名字。Archie还将详细地告诉你目录路径。 这样,你就可以轻易地从相应的FTP主机中取得你所需要的FTP文件。

  使用Archie服务器有三种方法。首先,你可以远程登录到Archie服务器,用Archie用户标识登录,一旦登录,一个Archie程序将自动启动。你可每一次录入一个命令,告诉Archie你要检索什么,Archie就将检索其数据库然后显示结果。如果你不能确定要检索什么,Archie将提供另外一种称为“ whatis 的服务, whatis对上千个不同的程序、数据文件和档案资料进行了描述。

  使用Archie的第二种方法是使用一个称为Archie客户机的程序,你告诉Archie 客户机程序你检索什么,客户机将自动连接一个Archie服务器,要求它完成检索,根据你的指示输出,并显示结果。一旦你懂得如何使用 Archie,使用Archie客户机就很容易并且很快。你不必象第一种方法那样进行远程通讯,也没必要记住该用什么Archie命令。

  最后一种方法,你可以给任一个 Archie 服务器发送一个电子邮件, Archie将执行你的请求,并将结果邮回来。

  Archie如何工作

  从概念上讲,Archie的工作十分简单,每隔一段时间,特殊的程序连到每一个已知的匿名FTP 主机,然后下传所有公共文件完整的目录表。这些表存贮于称为Internet Archives Database(Internet档案数据库)中。当你要求Archie检索一个文件时,所要进行的全部工作就是对该数据库进行检索。

  世界各地的各种Archie服务器都各自保持着对Internet上各匿名FTP 主机的跟踪。例如,Australian(澳大利亚)的Archie服务器就保持着对澳大利亚的匿名FTP 主机的跟踪。由于信息是共享的,所有Archie服务器都将尽可能保持最多数据。平均说来,大约一周检查一次各个匿名 FTP主机。

  Archie原先是作为加拿大蒙特利尔的McGill大学计算机学院的学生和教师自愿者开发的项目,软件是Alan Emtage和 Bill Heelan 在 Peter Deutsch的帮助下编写的。今天,Archie由加拿大蒙特利尔的 Bunyip Information System 公司经营。你可以发邮件到info@bunyip.com 与他们取得联系。

  Archie服务器的使用

  为了使用某个 Archie 服务器, 先对它进行远程登录, 然后使用“ Archie”用户标识登录(不需口令)。例如,下面的命令将对位于Rutgers大学的服务器进行远程登录:

  telnet archie.rutgers.edu

  你可以使用任何一个Archie服务器,但显然使用最靠近你的一个服务器会更快一些。

  通常,对一个Archie服务器而言,能够对其同时进行远程登录的人数是有限的。如果最近的一个Archie服务器正繁忙,可以用远的一个,或等一会再试。

  一旦用"archie"登录到服务器,你会看到一些欢迎使用方面的信息,然后出现下面的提示:

  archie>

  这时Archie服务器就为接受命令作好了准备。要停用Archie,可录入 quit命令。用help命令可显示帮助信息(后面将详细讨论有关 help命令的内容,因为有些细微差别。)

  使用Archie工具时分三步:首先按你喜欢的方式把问题提出来,然后进行实际的工作,最后退出。

  【如果有兴趣了解关于Archie的更多介绍,请参考相关文章。如 http://www.lnu.edu.cn/inter/internet_dc_13.html (本文部分内容选自该网页内容)。】

·免费电子书 《搜索引擎优化(SEO)知识完全手册》免费电子书 (无需注册直接免费下载)
·搜索引擎营销策略、方法与实用技巧系列研究文章(冯英健 原创)

更多请查看:
Archie
Archie服务 
Archie搜索引擎


来源:wm23.com(2016/1/12)

关于网络营销教学网站| 本站动态| 网站地图| 版权声明| 联系方式| 问题和建议

网络营销教学网站 版权所有