乐读窝

重生之科技崛起

乐读窝 > 现代小说 > 重生之科技崛起

第二百二十四章:Yout

书籍名:《重生之科技崛起》    作者:紫雨涵


        好消息啊,老板。”一见面任正飞就对着张国栋毫无形象的大喊大叫,如果不是看着张国栋那戒备的眼神,说不定还想冲上来给他一个热情的拥抱,张国栋有些好奇,从部队里面出来的任总可是很沉稳的啊。

        “从此以后我们又多了一项在全世界吸血的工具了,盛田昭夫刚刚亲自打电话来向我们通报了此事,明天将是我们的CD-I标准正式推广的日子,目前已经有三十几家企业加入了我们的压缩联盟。”从ZIP格式获得大量利润的任正飞当然知道标准的好处了,所以听到索尼的消息后还是会忍不住高兴,不过心里还是有点感慨,不知道什么时候中国人能够独立的申请一项国际标准就好了,现在却不得不与小日本合作,想想西方国家对社会主义国家的防治,他又忍不住摇摇头,看来老板上次说要加大对创新公司的投入是非常正确的。

        “哦,这的确是个不错的消息,不过我也有个好消息要和你分享,世界上第一个搜索引擎已经由我们中国人首先发明出来了,昨天龚定雨他们已经去登记了专利号了,发明人是我们中国的一个留学生,很难得的他的国籍还是中国。”相比于必然的收获,张国栋显然对这个偶然的成果更加满意,以前他都已经忘记历史上1990年,加拿大麦吉尔大学(UniversityofMcGill)计算机学院的师生开发出Archie。当时,万维网还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息。提供查找分别在各个FTP主机中的文件。用户必须输入精确地文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。

        然而现在由于龙腾的贡献,万维网已经出现,网络上最大最多的资源也是HTML网页,而留学美国斯坦福大学的赵维均在博士攻读阶段,发现同学们非常喜欢去彼此地个人网站去凑热闹。但是有的同学在看了一个很漂亮的网页后想介绍给别人时不得不繁琐的记下该站得网址,要知道网址要链到某个具体网页的时候有可能会非常地长,所以他忍不住想到,能不能做一个工具将网络上所有的网页都抓取下来,然后存在自己的服务器中。当人们输入一定的关键将某个具体的资源返还给人们呢。大学地研究还不像公司,公司开发一款产品往往会进行大量的市场

        调查,然后还要考虑是否盈利,而大学生做产品往往是灵光一闪。赵维均也是这样。做这个产品他没有告诉任何人,经过长达四个多月地编程实现。赵维均得到了一款比较满意的产品。随后他前去美国专利局进行注册,产品名Yout。可能注定着世界上要多一家伟大的公司,那天龚定雨和几个公司的技术专家也去专利局去申请两项专利,由于总公司和香港分公司专利都在不断增加,给了美国分公司很大的压力,所以龚定雨是为了摆个姿态。就一起去了,结果赵维均正好排在他们后面。得知龚定雨竟然是中国龙腾公司的人。赵维均非常佩服,毕竟他用地很多计算机产品都是龙腾生产的。可以说龙腾是整个中国人地骄傲。

        而龚定雨也不愧拥有鬼神之智,竟然一眼就瞧出了赵维均手上专利的价值。随后就隆重邀请赵维均加盟了,能加盟自己心目中地大公司,赵维均其实也非常满意,他博士也快毕业了,只剩下最后论文答辩,本来他最近就一直在犹豫要加入哪个公司。不过当他听说龙腾还有一个创业投资基金后,他就觉的有点心动了,开始龚定雨见他婉拒还以为是给地条件不够吸引人,所以咬咬牙一再的提高筹码,搞得那两个技术人员都是脸一阵阵抽动。不过当他得知赵维均是想自己创业时,失落的心情又好了一点点。

        和Archie不同,由于有了互联网,赵维均的Yout拥有世界上第一个Spider程序。Spider指自动抓取网页内容的机器人Robots,是搜索引擎用来访问Internet上网页的自动程序。spiders根据html的语法和格式,对读取的页面进行代码过滤,收入相关的文字内容。爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。

        可以说Yout已经具备了后世搜索引擎的一些特征了,虽然还比较毛糙,在切词计算词之间距离的方面做得还不是那么完善,但是作为世界上第一个诞生的网页搜索器,Yout仍然具备光辉的前景。没能将这一项目握在自己手上的张国栋还有些遗憾,不过旋即又开心起来,毕竟这第一的荣誉好歹也是中国人自己的了,于是张国栋马上自己炮制了一份PageRank算法的论文寄给了英国自然杂志。

        历史上PageRank(网页级别),取自Google的创始人LarryPage。它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页地等级重要性的一种方法。是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。

        级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的网站了。Google把自己地网站的PR值定到10,这说明Google这个网站说这个网站非常重要。

        PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Googl创始人之一拉里佩奇(LarryPage)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名地。而现在张国栋毫不怀疑自己的这篇论文能够引起学术界的关注。毕竟作为HITS并举的链接分析算法,在HITS还没有出现之前能够有效的对网页做出基本公平地排名还是非常重要的。这两年随着互联网地兴起已经有越来越多的专家学者将自己的注意力转移到这上面来了。

        反正自己叫它PageRank别人也只会以为是页面排序的意思。本来龙腾也可以做一个搜索引擎的,毕竟以龙腾在软件方面的实力和权威性,做出来地搜索引擎可能比Yout更加先进,但是张国栋却并不准备让龙腾在每一个产业上都有所突出。毕竟太过于庞大的公司可能在西方有些事情不方便做。目前地Yout还只能够搜索英文,也就是只开发了英文版本。其它语言都还没有做,但是这毕竟是一个公司由小到大的过程,不能什么事情都替人家做了,那样就没什么不知道是鉴于张国栋地威名还是怎么的,毕竟现在张国栋随着ZIP格式和CD-I两项压缩标准已经成为了世界上唯一一个不是PHD地压缩权威,所以对于他的文章自然杂志自然非常重视。很快就给予了刊登,而且还加上了重点推荐。PageRank算法已经发表。马上引起了学术界方面的讨论。张国栋也趁此机会为PageRan申请了专利,虽然还没有批下来。不过申请的是国际专利,不怕别人再搞鬼。

        有了PageRank算法在手。张国栋让龚定雨去和赵维均谈判,也不知道杨柳这个丫头哪里得知的消息,反正对于张国栋看好的生意她都要插上一脚,结果就变成了两股资金对同一个公司注资的事情。最后龙腾以技术加资金入股占了49%的股份,杨家用资金入股占了30%的股份,赵维均这个公司的创始人占了21%的股份,他也比较满意了,毕竟以公司目前3000万的投资来看,他白捡600多万,还有什么不满意的呢。

        就在Yout成立之后的第三天,加拿大的三位同学就发表了Archie,很险,差一点世界第一个搜索引擎的称呼就被拿走,张国栋也是暗乎侥幸,当然,Archie肯定没有Yout的生FTP基本上都要密码,搜索的内容比较狭隘。虽然龙腾不会进入通用搜索引擎,但是垂直搜索张国栋还是不愿意放过,毕竟再怎么说Yout也不可能占领整个世界的市场。所以随着张国栋一声令下,整个龙腾的软件组又动了起来。(未完待续,如欲知后事如何,请登陆78。Com,章节更多,支持作者,支持正