乔纳森·弗莱切:鲜为人知的搜索引擎之父
Google迎来了它的15岁生日,它成为了信息检索的代名词。可能许多人都没有听说过Jonathon Fletcher 这个名字,如果将它键入Google 的搜索框,没有直接的结果会告诉你他在万维网历史中所发挥的作用,以及他作为现代搜索引擎之父的角色。但正是在20 年前,他在苏格兰斯特灵大学的一个计算机实验室里发明了世界上第一个采用网络爬虫技术的搜索引擎——该技术奠定了今天Google、Bing、Yahoo 等搜索工具的基础。
1993 年,网络刚刚起步。历史上首款大众浏览器Mosaic 才出现不久,而网页的总数量也仅有数千个,人们还不知道如何在网上检索信息。Mosaic 当时推出了一个叫做What's New 的页面,可以对新创建的网站进行索引。问题是,这些站长若要Mosaic 的开发者获知其新网站,须向Mosaic 所在的国家超级计算机应用中心(NCSA)写信通知。
在同一时期,Jonathon Fletcher 刚刚以优异成绩从斯特灵大学毕业,并获得了格拉斯哥大学提供的PhD 学习机会。不幸的是,格拉斯哥大学终止了PhD 研究经费,他顿时无事可做。“突然间我非常想去找一份工作,”他回想道:“所以我回到了母校,在那里得到了在科技部门工作的机会。”正是这份工作让他第一次接触到了万维网,以及Mosaic。
在建设一个网络服务器的过程中,Jonathon 意识到Mosaic 的What's New 页面是存在本质缺陷的。由于需要手动添加网站到What's New 的列表上,网站内容的变动无法被追踪,最终导致的后果是,许多列表上的链接很快就会过时,或者被错误标注。“如果你想知道发生了什么变化,你必须亲自回到网站上去查看,”他说:“我拥有计算机科学学位,认为应该有更好的解决方式,我决定编写一个程序来帮助我进行查看。”而这一程序正是世界上首个网络爬虫(web crawler)。
Jonathon 将他的发明取名为JumpStation,他将一些网页放在一起,提供给一个网络爬虫进行搜索,接下来它会自动对经过的所有网页上的所有链接进行访问和索引,直到访问完所有内容。十天之后,也就是1993 年的12 月21 日,JumpStation 完成了它的任务,总共索引了25000 个页面。Google 到目前为止页面索引量已逾万亿。
很快Jonathon 就为索引创建了一个易于使用的搜索工具,并将之置于Mosaic 的What's New 页面,世界上首个现代搜索引擎诞生了。“我认为他是网络搜索引擎之父,”研究信息检索历史的Mark Sanderson 教授说:“很长一段时间里,都是由计算机完成搜索工作,在网络出现前肯定也有搜索引擎,但Jonathon 的发明第一次具备了现代搜索引擎的所有要素。”同Google 一样,其创始人塞吉布林和拉里佩奇的名字家喻户晓,而现居香港的Jonathon Fletcher 却没有为其在互联网发展历史所发挥的作用得到应有的认可。这可能也与他的项目被最终抛弃有关系。随着JumpStation 的成长,它需要越来越多的投资——而斯特灵大学当时并无此意愿。“它在一台共享服务器上运行,”Jonathon 解释道:“当时没有很多磁盘空间,而且那时候磁盘空间小、造价昂贵。”
到1994 年6 月,JumpStation 页面索引量达到了27.5 万个。由于存储空间限制,Jonathon 无法对页面的所有内容进行索引,只能退而求其次,对标题和页眉进行索引。即便如此,JumpStation 依然不堪重负。Jonathon 也开始觉得力不从心。“那不是我的本职工作,”他说:“我的工作是维持学生实验室运行,做些系统管理和技术方面的零工。”来自日本的一份工作邀请也让他难以拒绝,斯特灵大学方面对他也无意挽留。JumpStation 也没有引起足够的重视,“显然我没有成功说服他们JumpStation 所具的潜力,”Jonathon 说:“那时候我做了我认为对的决定,但在过去20 年里,我也曾数次回首那段往事。”斯特灵大学计算机科学和数学主任Leslie Smith 教授承认JumpStation 事后被证明“领先于时代”,她说“大学的同事很高兴看到Jonathon 正在获得他应得的认可”。
尽管JumpStation 的最终结果让人唏嘘,但Jonathon 的这一发明依然是随后很多网络搜索引擎的基础。“1993 年时的网络社区规模还很小,”Sanderson 教授说:“当时任何与网络沾边的人都知道JumpStation。到1994 年中,大家逐渐意识到网络搜索引擎将变得非常重要,Google 直到1998 年才出现,而Jonathon 在1993 年就在干这事儿了。”
Jonathon 在数周前作为嘉宾参加了在爱尔兰都柏林举办的一个会议,与他同座的是来自微软、雅虎和Google 的代表,他在演讲中谈论了未来。“以我的观点,网络总有一天会消亡,”他说:“但搜寻信息的难题将一直存在。从内容中搜索和发现信息的需求并不受媒介的限制。”
许多搜索引擎正是在他发明的技术基础上发展和崛起来的,对此他没有后悔:“我父母以我为荣,我妻子以我为荣,我的孩子们也以我为荣。这些对我来说很重要,所以我很快乐。”