搜索引擎概述[编辑]
各个搜索引擎的网站图标搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
搜索引擎分类
1、全文索引。全文搜索是名副其实的搜索引擎,它们从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的顺序返回结果。
2、目录索引。目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。
3、元搜索引擎。元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
搜索引擎工作原理
1、抓取网页。
每个独立的搜索引擎都有自己的网页抓取程序(Spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
2、处理网页。
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。最重要的就是提取关键词、建立索引文件,还包括去除重复网页、分析超链接、计算网页的重要度。
3、提供检索服务。
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎组成
搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成;
搜索器 其功能是在互联网中漫游,发现和搜集信息;
索引器 其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;
检索器 其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;
用户接口 其作用是接纳用户查询、显示查询结果、提供个性化查询项。
网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。