搜索器[编辑]

众所周知，一个seoer需要对搜索引擎的结构和工作原理有一定的了解。目前关于搜索引擎结构和工作原理的中文资料不是很丰富。即使有一些文献，大多阅读起来比较苦涩枯燥。但是一个优秀的seoer是需要了解和理解的，根据个人的阅读研究经验，现把搜索引擎体系结构中的搜索器通俗分享如下：
　　1、搜索器概念
　　搜索器是搜索引擎体系结构中比较重要的一部分，它的功能是在浩瀚的互联网海洋里不停的抓取网页，搜集信息。从而为以后其它各部分的工作铺好垫。搜索引擎的搜索器一般叫做网络爬虫，目前网民普遍称为“网络蜘蛛”或者简称为“蜘蛛”(蜘蛛的英文为：spider)。通过它的字面意思我们不能理解它的功能，它在“爬行”时要又快又广又多地搜集各种各样的新信息;
　　2. 搜索器反映
　　当我们在浏览网页时候，会发现一个网站的内容经常会更新，并且频率一般比较高，因为一些信息具有实时性，超过一段时间后就会成为过时无用的垃圾信息，因此蜘蛛需要在规定的周期去抓取网页里面的内容，同时还要判别那些网页是更新过的，那些页面的内容已经陈旧，没有更新了，那些页面里面的链接是死链接，哪些页面已经是不需要再“爬行”等等。
　　3. 搜索器工作原理
　　那么搜索器是如何搜集网站的相关信息了?一般是用下面的方法：“蜘蛛”从一个URL开始，顺着这个URL的超链接，利用各种方式在互联网中的网站之中发现信息，然后不断重复，于此同时搜索器也要把搜集到的所有网页存储起来。
　　4. 搜索器重要技术
　　通过上面的介绍相信你对搜索引擎的搜索器有了一定的认识。接着分析的是搜索器的一项比较重要技术，那就是网页内容提取技术。
　　网页内容提取技术首先要了解的是搜索引擎建立索引，目前搜索引擎处理的对象只是文本文件。但是一般一个网站有若干网页组成，并且每张网页上会有不同格式的文件，如图片，flash，pdf，word，多媒体等等丰富多彩的格式。上面说过搜索引擎处理的是文本文件，那么索引器就会把网页里面的文本文件提取出来。
　　最后希望大家能够把一些seo技术与理论结合起来，这样不仅可以快速理解掌握seo各项技术，而且可以以一种发散思维去面对各种seo，做到举一反三，真正的成为一名seo的领航者。

参考资料： http://abc.wm23.com/ldy983592935

扩展阅读： http://abc.wm23.com/ldy983592935

相关词条：

合作编辑：

分享到：

网络营销词典内容均由网友提供，仅供参考。如发现词条内容有问题，请发邮件至info # wm23.com。

词条信息

浏览次数：140

编辑次数：0历史版本

创建者：刘端阳

最近更新：2011/7/5 17:04:58

词条分类导航

网络营销术语及概念网络营销与电子商务书籍网络营销研究及案例知名网络营销公司网络营销服务市场互联网工具及软件特色网站介绍最新网络热词及事件电子商务网购与网商互联网基础知识FAQ 互联网及网络营销人物网络热销及新奇特产品时尚电子数码产品网络视频及网络游戏移动互联网与APP 知名品牌企业及官网电子商务网络营销教师网络营销能力秀区县政府学校网站1 其他类别

最受关注词条