首页 >> 网络营销词典 >> 互联网工具及软件 >> deep web

deep web[编辑]


概述
深网(Deep Web、Dark Web,又称、不可见网、隐藏网)是指互联网上那些不能被标准搜索引擎索引的非表面网络内容。

  迈克尔·伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,巨量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息是须通过动态请求产生的网页信息,而标准的搜索引擎却无法对其进行查找。传统的搜索引擎“看”不到,也获取不了这些存在于深网的内容,除非通过特定的搜查这些页面才会动态产生。于是相对的,深网就隐藏了起来。据估计,深网要比表面网站大几个数量级。

命名

  迈克尔·伯格曼引用法兰克·加西亚在1996年1月的一篇文章指出,早在1994年的时候,吉尔.艾尔斯沃夫曾经使用“不可见网络”这一术语表示那些没有被任何搜索引擎索引注册的网站

  “这些网站可能已经被合理地设计出来了,但是他们却没有被任何搜索引擎编列索引,以至于事实上没有人能找到他们。我可以这样对这些不可见的网站说,你们是隐藏了的。”

  早期使用“不可见网络”这一术语的是一家叫做“个人图书馆软件”公司的布鲁斯·芒特(产品开发总监)和马修·B·科尔(首席执行官和创建人),当他们公司在1996年12月推出和发行的一款软件时,他们对深网工具的有过这样的一番描述。

  不可见网络这一术语并不准确,它描述的是那些在深网中可被搜索却又不能被标准搜索引擎索引和查询的内容,而这对于知道如何或有权进入、访问这些内容的人来说,它们又是相当可见的。

  在2001年伯格曼的研究中第一次使用了深网这一特定术语。

深网资源

  动态内容未被链接内容私有网站Contextual Web被限制访问内容脚本化内容非HTML/文本内容

抓取深网内容

  研究人员探寻了如何自动抓取深网内容。

  2001年, Sriram Raghavan 和 Hector Garcia-Molina 发明了一个从用户请求界面表格收集关键词的深网抓取模型并且抓取深网资源。加利福尼亚大学洛杉矶分校的 Alexandros Ntoulas、Petros Zerfos和Junghoo Cho创建了一个自动生成有意义的查询词的程序。

  商业搜索引擎已经开始使用以上两种方法之一抓取深网。Sitemap协议(始创于Google)和mod oai是允许搜索引擎和其他网络服务探索深网解决方法。以上两种解决方法允许网络服务主动公布网址,这对于他们来说是容易的,因而允许自动探寻资源而不直接通过网络表面的链接。Google的深网探寻系统预先计算每个 HTML 表单并且添加结果 HTML 页面到 Google 搜索引擎索引。在这个系统里,使用三种方法计算提交词: (1) 为输入搜索选择关键词允许的输入值、(2) 确定是否只接受特定的值(例如时间)和 (3) 选择少量的组合生成适合纳入网站的搜索索引网址。

参考资料: http://zh.wikipedia.org/wiki/%E6%B7%B1%E7%BD%91
扩展阅读:
相关词条:
合作编辑:

网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。

词条信息

浏览次数:88

编辑次数:0历史版本

创建者: 蔡亲宇

最近更新:2015/3/26 0:29:44

词条分类导航

关于网络营销教学网站| 本站动态| 网站地图| 版权声明| 联系作者| 问题和建议|

版权声明:网络营销教学网站所有作品版权均归原作者所有,未经书面许可,严禁任何形式的转载/转贴、出版、篡改、汇编、编译等。