当前位置: 首页 > 图文教程 > 网站运营 > 网站优化 > 追溯互联网搜索引擎的发展史起源

网站优化
学习seo的注意事项
同样内容的网站放在不同的域名对你有帮助吗
SEO 关键词的选择
网站真实流量分析方法
锚文本对于SEO的重要性
SEO技术 google pr值算法浅谈
搜索引擎优化的一些方法和排名技巧
2009年影响网站搜索引擎排名的重要因素小结
SEO 实战 关键词排名还很重要吗?
SEO教程 网站地址URL规范化技巧
SEO实例分享 关键词和网站流量
所有SEO策略需要站在运营和产品角度
SEO工具 五款免费的死链接检测工具
网页图片该如何优化
SEO切不可把 内容为王 奉为圣经而不知变通
选择一个适合SEO的CMS系统的分析
Google 任何时间段的网页结果查看方法
Google明令禁止的十大SEO黑帽技术小结
SEO作弊方法和SEO作弊认定准则分析
博客从谷歌获得较高的PR值的方法分析

网站优化 中的 追溯互联网搜索引擎的发展史起源


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-10-17   浏览: 74 ::
收藏到网摘: n/a

  搜索引擎的发展史

  1990年以前,没有任何人能搜索互联网。 所有搜索引擎的祖先,是1990年由Montreal(加拿大的蒙特利尔)的McGill University学生 Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie( Archie FAQ )。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。

  由于Archie深受欢迎,受其启发,Nevada(美国的内华达州) System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ )搜索工具Veronica(Veronica FAQ )。Jughead是后来另一个Gopher搜索工具。

  Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider( Spider FAQ )程序。世界上第一个Spider程序,是MIT Matthew Gray 的Worldwide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。

  与Wanderer相对应,1993年10月 Martijn Koster 创建了 ALIWEB (Martijn Koster Annouces the Availability of Aliweb ),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。

  随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm )、NASA的Repository-Based Software Engineering (RBSE) spider。JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。

  Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile 。目前Excite隶属于Ask Jeeves公司。)

  1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy (Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。