被遗忘的互联网搜索引擎之父

浏览:937 发布日期:2013/09/06 分类:业界资讯 关键字: 互联网

年度过15岁生日的Google早已成了“互联网搜索引擎”的代名词,但是互联网搜索引擎并非Google首创——早在20年前,英国年轻人乔 纳森•弗莱彻(Jonathon Fletcher)就在一所大学的计算机实验室里做出了世界上第一个使用爬虫技术的搜索引擎,而这项技术是当今Google、必应、雅虎和其他各大搜索工 具的基础。

弗莱彻多年来一直默默无闻,就连他自己也没有意识到自己就是“互联网搜索引擎之父”,直到几年前有研究人员发现了他的成就。BB C日前对他进行了专门报道,以下为文章主要内容:

首次触网

在1993年,互联网刚刚对公众开放,第一款大受欢迎的Web浏览器Mosaic也刚刚问世——它的界面与我们如今使用的各种浏览器非常相似。在当时,全球总共只有数以千计的网页,如何在Web上查找信息是个有待解决的问题。

Mosaic有个“What’s New”(新鲜事)页面能对新建的网站加以索引,但网站创建者要想让Mosaic的开发者注意到自己的网站,就必须给Mosaic开发团队所在的伊利诺伊 大学香槟分校(University of Illinois Urbana-Champaign)的美国国家超级计算机应用中心(NCSA)写信。

那时候,乔纳森•弗莱彻是斯特灵大学(University of Stirling)的一名研究生,正准备去格拉斯哥大学(University of Glasgow)攻读博士学位,前途一片光明。

但是,弗莱彻还没去格拉斯哥大学,那边的科研项目经费就被砍了,于是他一下子无事可做了。迫于生计,他回到斯特灵大学找了一份技术类工作——正是这份工作,让他首次接触万维网和Mosaic的“What’s New”页面。

改进索引

在为斯特灵大学构建一台Web服务器时,弗莱彻意识到“What’s New”页面存在重大缺陷——网站都是人工添加至列表的,因此网站内容变化是无法追踪的,于是很多链接会很快过时或者被加上错误的标签。如果想知道网站内容有何变化,就只能回到网站上查看一番。

弗莱彻觉得一定有更好的方法,于是他决定发挥计算机专业科班出身的特长、写点能帮自己查找信息的东西——这个东西,其实就是世界上第一个Web爬虫软件。

弗莱彻给自己的发明取名“JumpStation”。他汇总出一个能被Web爬虫软件搜索的网页索引,而爬虫会访问它遇到的每一个网页上的每一个连接并对它们建立索引——整个流程自动进行,直到爬虫没有东西可访问为止。

10天之后,也就是在1993年12月21日,JumpStation没有东西可以访问了。此时,它已经对2.5万个网页建立了索引。

而今天,谷歌已经对超过1万亿个页面建立了索引。

引擎问世

弗莱彻很快为网页索引建立了一个容易操作的搜索工具,然后把自己的网站放在了Mosaic的“What’s New”页面上——世界上第一个现代化的搜索引擎就这样运行起来了。

澳大利亚皇家墨尔本理工大学(RMIT)的马克•桑德森(Mark Sanderson)教授是一位研究信息检索历史的学者,他认为弗莱彻是“Web搜索引擎之父”。桑德森指出,虽然电脑上的搜索技术早已有之,但弗莱彻是创造现代搜索引擎雏形的第一人。

但是,谷歌创始人谢尔盖•布林(Sergey Brin)和拉里•佩奇(Larry Page)的名字早已家喻户晓,如今生活在香港的弗莱彻却默默无闻,没什么人知道他对互联网发展的贡献。

JumpStation越做越大,需要的投资也越来越多——后来斯特灵大学就不愿继续为它提供资金了。“它在一台共用服务器上运行,磁盘空间并不充裕,而且那时候的磁盘又小又贵。”弗莱彻解释道。

无奈放弃

到了1994年6月,JumpStation已经对27.5个网页建立了索引。迫于空间限制,弗莱彻只能给网页标题和导语建立索引,而无法顾及全部网页内容,但是尽管如此,JumpStation还是不堪重负。

不堪重负的还有弗莱彻——毕竟,他的本职工作是维护实验室、管理系统和处理技术方面的琐事,不是运作JumpStation。

后来,他有了一个去东京工作的好机会,而斯特灵大学也没有对他和他的JumpStation多做挽留。“我显然没能成功说服他们相信它的潜力。”弗莱彻说道,“在当时,我做了我认为正确的事情;但是这20年来,我也曾多次回想起昔日时光。”

斯特灵大学计算机科学与数学学院的院长莱斯利•史密斯(Leslie Smith)教授向BBC表示,他记得弗莱彻和“超前问世”的JumpStation。他还表示,斯特灵大学的同事们对弗莱彻的成就开始被世人所知深感欣慰。

展望未来

弗莱彻虽然并不如意,但是他开创的技术为后来所有的Web搜索引擎奠定了基础。

桑德森教授指出,JumpStation在1993年到1994年的互联网圈子里无人不知,而谷歌直到1998年才问世。

几周前,弗莱彻在都柏林的一次会议上引起了关注——作为特邀嘉宾,他与来自微软、雅虎和谷歌的代表同台发言。但是,他在演讲中谈到了未来。

“我认为,Web不会永久存在,但是查找信息的问题不会消失,人们搜索内容和查找信息的欲望与媒介无关。”他向听众们如是说道。

他的后继者如今已经赚得盆满钵满,但是他并不后悔。“我的父母为我自豪,我的妻子为我自豪,我的孩子们也为我自豪——这对我来说相当珍贵,所以我很幸福。”

本文转载自: 搜狐IT
评论( 相关
后面还有条评论,点击查看>>