首页 >> 网络营销词典 >> 互联网基础知识FAQ >> 网络搜索引擎

网络搜索引擎[编辑]


     在网络中,搜索引擎是非常重要的,专门用来帮助人们查找存储在其他站点上的信息。搜索引擎有能力找到你文件或文档存储的准确位置。网络搜索引擎有很多种工作方式,各有不同。但是有一个显著特点却是相同的。 就是要完成一个基本任务。就是:基于关键字来搜索互联网。必须基于关键字来搜索互联网或者其中的一部分。从而生成一份索引。将寻找到的词条保存。
     网络搜索引擎的工作原理也是要详细解释的,就是使用了蜘蛛程序。以此可以生成在网站上查询到的词语列表。为了建立并维护一份有用的词语列表,搜索引擎的蜘蛛程序肯定会游历大量网页。通常起点是那些访问量非常大的服务器和热门网页。
     谈到搜索引擎,不得不提到的是元标记这个概念。这是必须提及的。网标记可以允许设定检索的关键字或概念。在网页中的词语有多个含义的时候,元标记会引导搜索引擎在这几种意思总寻找最为合适恰当的意思以供搜索者对其进行参考。当然了,虽然作用很强。但是也不能过于依赖元标记。因为这样也会容易造成一些麻烦。
     蜘蛛程序搜索数据的方法值得一提。把搜索到的数据提供给我那个罗用户使用,涉及到两个很关键的环节。第一个就是:以数据存储信息,为信息建立索引的方法。第二个就是:搜索引擎储存信息准确组合。这也是一个很不错的方法。

引擎组成

搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成:

搜索器

其功能是在互联网中漫游,发现和搜集信息;
索引器

其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;
检索器

其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;
用户接口

其作用是接纳用户查询、显示查询结果、提供个性化查询项。
robots

robots协议(也称为爬虫协议、爬虫规则、机器人协议等)也就是robots.txt,网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。Robots协议是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。因其不是命令,故需要搜索引擎自觉遵守。一些病毒如malware(马威尔病毒)经常通过忽略robots协议的方式,获取网站后台数据和个人信息。
8发展趋势自然搜索

人们的日常交流是使用自然语言而非关键(字)词,因为关键(字)词表达的意思和意图不完整不准确,反映在搜索结果上的缺陷是返回信息过多。基于自然语言搜索,符合人们的语言习惯,像人与人之间的交流一样轻松、直接、方便,这无疑给用户提供了巨大的便利。
智能搜索

基于关键词搜索是符号匹配信息,并不能处理关键词本身的语义,这就是基于关键词搜索存在一系列缺陷的原因。从这个层面上讲,搜索引擎的发展趋势是,把“语言计算技术和人工智能融合,让计算机返回的结果富有针对性,将准确信息显示在前两三项的搜索结果之中。让计算机具有人的智能和逻辑分析能力,能够理解自然语言表达的语义,使搜索结果与用户需求实现更精准的匹配,以解决问题的形式把结果返回给用户。

参考资料: 百度百科
扩展阅读:
相关词条:
合作编辑:

网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。

词条信息

浏览次数:321

编辑次数:1历史版本

创建者: 陈泓宇

最近更新:2013/11/8 9:13:33

词条分类导航

关于网络营销教学网站| 本站动态| 网站地图| 版权声明| 联系作者| 问题和建议|

版权声明:网络营销教学网站所有作品版权均归原作者所有,未经书面许可,严禁任何形式的转载/转贴、出版、篡改、汇编、编译等。