首页 >> 网络营销词典 >> 互联网工具及软件 >> 搜索器

搜索器[编辑]


众所周知,一个seoer需要对搜索引擎的结构和工作原理有一定的了解。目前关于搜索引擎结构和工作原理的中文资料不是很丰富。即使有一些文献,大多阅读起来比较苦涩枯燥。但是一个优秀的seoer是需要了解和理解的,根据个人的阅读研究经验,现把搜索引擎体系结构中的搜索器通俗分享如下:
  1、搜索器概念
  搜索器是搜索引擎体系结构中比较重要的一部分,它的功能是在浩瀚的互联网海洋里不停的抓取网页,搜集信息。从而为以后其它各部分的工作铺好垫。搜索引擎的搜索器一般叫做网络爬虫,目前网民普遍称为“网络蜘蛛”或者简称为“蜘蛛”(蜘蛛的英文为:spider)。通过它的字面意思我们不能理解它的功能,它在“爬行”时要又快又广又多地搜集各种各样的新信息;
  2. 搜索器反映
  当我们在浏览网页时候,会发现一个网站的内容经常会更新,并且频率一般比较高,因为一些信息具有实时性,超过一段时间后就会成为过时无用的垃圾信息,因此蜘蛛需要在规定的周期去抓取网页里面的内容,同时还要判别那些网页是更新过的,那些页面的内容已经陈旧,没有更新了,那些页面里面的链接是死链接,哪些页面已经是不需要再“爬行”等等。
  3. 搜索器工作原理
  那么搜索器是如何搜集网站的相关信息了?一般是用下面的方法:“蜘蛛”从一个URL开始,顺着这个URL的超链接,利用各种方式在互联网中的网站之中发现信息,然后不断重复,于此同时搜索器也要把搜集到的所有网页存储起来。
  4. 搜索器重要技术
  通过上面的介绍相信你对搜索引擎的搜索器有了一定的认识。接着分析的是搜索器的一项比较重要技术,那就是网页内容提取技术。
  网页内容提取技术首先要了解的是搜索引擎建立索引,目前搜索引擎处理的对象只是文本文件。但是一般一个网站有若干网页组成,并且每张网页上会有不同格式的文件,如图片,flash,pdf,word,多媒体等等丰富多彩的格式。上面说过搜索引擎处理的是文本文件,那么索引器就会把网页里面的文本文件提取出来。
  最后希望大家能够把一些seo技术与理论结合起来,这样不仅可以快速理解掌握seo各项技术,而且可以以一种发散思维去面对各种seo,做到举一反三,真正的成为一名seo的领航者。

参考资料: http://abc.wm23.com/ldy983592935
扩展阅读: http://abc.wm23.com/ldy983592935
相关词条:
合作编辑:

网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。

词条信息

浏览次数:135

编辑次数:0历史版本

创建者: 刘端阳

最近更新:2011/7/5 17:04:58

词条分类导航

关于网络营销教学网站| 本站动态| 网站地图| 版权声明| 联系作者| 问题和建议|

版权声明:网络营销教学网站所有作品版权均归原作者所有,未经书面许可,严禁任何形式的转载/转贴、出版、篡改、汇编、编译等。