返回

第二百二十四章:You

首頁
關燈 護眼 字體:
書架 上一章 目錄 下一章

“好消息啊,老闆。”一見面任正飛就對着張國棟毫無形象的大喊大叫,如果不是看着張國棟那戒備的眼神,說不定還想衝上來給他一個熱情的擁抱,張國棟有些好奇,從部隊裏面出來的任總可是很沉穩的啊。

“從此以後我們又多了一項在全世界吸血的工具了,盛田昭夫剛剛親自打電話來向我們通報了此事,明天將是我們的cd-i標準正式推廣的日子,目前已經有三十幾家企業加入了我們的壓縮聯盟。”從zip格式獲得大量利潤的任正飛當然知道標準的好處了,所以聽到索尼的消息後還是會忍不住高興,不過心裏還是有點感慨,不知道什麼時候中國人能夠獨立的申請一項國際標準就好了,現在卻不得不與小日本合作,想想西方國家對社會主義國家的防治,他又忍不住搖搖頭,看來老闆上次說要加大對創新公司的投入是非常正確的。

“哦,這的確是個不錯的消息,不過我也有個好消息要和你分享,世界上第一個搜索引擎已經由我們中國人首先發明出來了,昨天龔定雨他們已經去登記了專利號了,發明人是我們中國的一個留學生,很難得的他的國籍還是中國。”相比於必然的收穫,張國棟顯然對這個偶然的成果更加滿意,以前他都已經忘記了搜索引擎這回事兒了。

歷史上1990年,加拿大麥吉爾大學(universityofmcgill)計算機學院的師生開發出archie。當時。萬維網還沒有出現,人們通過ftp來共享交流資源。archie能定期蒐集並分析ftp服務器上地文件名信息,提供查找分別在各個ftp主機中的文件。用戶必須輸入精確的文件名進行搜索,archie告訴用戶哪個ftp服務器能下載該文件。雖然archie蒐集的信息資源不是網頁(html文件),但和搜索引擎的基本工作方式是一樣的:自動蒐集信息資源、建立索引、提供檢索服務。所以,archie被公認爲現代搜索引擎的鼻祖。

然而現在由於龍騰地貢獻,萬維網已經出現。網絡上最大最多的資源也是html網頁,而留學美國斯坦福大學地趙維均在博士攻讀階段。發現同學們非常喜歡去彼此的個人網站去湊熱鬧,但是有的同學在看了一個很漂亮的網頁後想介紹給別人時不得不繁瑣的記下該站得網址,要知道網址要鏈到某個具體網頁的時候有可能會非常的長,所以他忍不住想到,能不能做一個工具將網絡上所有地網頁都抓取下來,然後存在自己的服務器中,當人們輸入一定的關鍵字後進行自動匹配。從而將某個具體的資源返還給人們呢。大學的研究還不像公司,公司開發一款產品往往會進行大量的市場

調查,然後還要考慮是否盈利,而大學生做產品往往是靈光一閃。趙維均也是這樣,做這個產品他沒有告訴任何人,經過長達四個多月的編程實現,趙維均得到了一款比較滿意的產品。隨後他前去美國專利局進行註冊,產品名yout。可能註定着世界上要多一家偉大地公司。那天龔定雨和幾個公司的技術專家也去專利局去申請兩項專利,由於總公司和香港分公司專利都在不斷增加,給了美國分公司很大的壓力,所以龔定雨是爲了擺個姿態,就一起去了,結果趙維均正好排在他們後面。得知龔定雨竟然是中國龍騰公司的人。趙維均非常佩服,畢竟他用的很多計算機產品都是龍騰生產的,可以說龍騰是整個中國人地驕傲。

而龔定雨也不愧擁有鬼神之智,竟然一眼就瞧出了趙維均手上專利的價值,隨後就隆重邀請趙維均加盟了,能加盟自己心目中的大公司,趙維均其實也非常滿意,他博士也快畢業了,只剩下最後論文答辯,本來他最近就一直在猶豫要加入哪個公司。不過當他聽說龍騰還有一個創業投資基金後。他就覺的有點心動了。他想要創業!

開始龔定雨見他婉拒還以爲是給的條件不夠吸引人,所以咬咬牙一再的提高籌碼。搞得那兩個技術人員都是臉一陣陣抽動。不過當他得知趙維均是想自己創業時,失落的心情又好了一點點。

和archie不同,由於有了互聯網,趙維均的yout擁有世界上第一個spider程序。spider指自動抓取網頁內容的機器人robots,是搜索引擎用來訪問inter上網頁的自動程序。spiders根據html地語法和格式,對讀取地頁面進行代碼過濾,收入相關的文字內容。爬蟲從一個或若幹初始網頁地url開始,獲得初始網頁上的url,在抓取網頁的過程中,不斷從當前頁面上抽取新的url放入隊列,直到滿足系統的一定停止條件。有被爬蟲抓取的網頁將會被系統存貯,進行一定的分析、過濾,並建立索引,以便之後的查詢和檢索;對於聚焦爬蟲來說,這一過程所得到的分析結果還可能對以後的抓取過程給出反饋和指導。

可以說yout已經具備了後世搜索引擎的一些特徵了,雖然還比較毛糙,在切詞計算詞之間距離的方面做得還不是那麼完善,但是作爲世界上第一個誕生的網頁搜索器,yout仍然具備光輝的前景。

沒能將這一項目握在自己手上的張國棟還有些遺憾,不過旋即又開心起來,畢竟這第一的榮譽好歹也是中國人自己的了,於是張國棟馬上自己炮製了一份pagerank算法的論文寄給了英國自然雜誌。

歷史上pagerank(網頁級別)。取自google地創始人larrypage。它是google排名運算法則(排名公式)的一部分,是google用於用來標識網頁的等級/重要性的一種方法,是google用來衡量一個網站的好壞的唯一標準。在揉合了諸如title標識和keywords標識等所有其它因素之後,google通過pagerank來調整結果,使那些更具“等級/重要性”的網頁在搜索結果中另網站排名獲得提升,從而提高搜索結果地相關性和質量。

級別從1到10級,10級爲滿分。pr值越高說明該網頁越受歡迎(越重要)。例如:一個pr值爲1的網站表明這個網站不太具有流行度。而pr值爲7到10則表明這個網站非常受歡迎(或者說極其重要)。一般pr值達到4,就算是一個不錯地網站了。google把自己的網站的pr值定到10。這說明google這個網站是非常受歡迎的,也可以說這個網站非常重要。

pagerank是google算法的重要內容。2001年9月被授予美國專利,專利人是google創始人之一拉裏※#8226;佩奇(larrypage)。因此,pagerank裏的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇來命名的。而現在張國棟毫不懷疑自己地這篇論文能夠引起學術界的關注,畢竟作爲與hits並舉的鏈接分析算法。在hits還沒有出現之前能夠有效的對網頁做出基本公平的排名還是非常重要的。這兩年隨着互聯網的興起已經有越來越多的專家學者將自己地注意力轉移到這上面來了。

反正自己叫它pagerank別人也只會以爲是頁面排序的意思。本來龍騰也可以做一個搜索引擎的,畢竟以龍騰在軟件方面的實力和權威性,做出來的搜索引擎可能比yout更加先進,但是張國棟卻並不準備讓龍騰在每一個產業上都有所突出,畢竟太過於龐大的公司可能在西方有些事情不方便做。目前地yout還只能夠搜索英文,也就是隻開發了英文版本,其它語言都還沒有做,但是這畢竟是一個公司由小到大的過程。不能什麼事情都替人家做了,那樣就沒什麼意義了。

不知道是鑑於張國棟的威名還是怎麼的,畢竟現在張國棟隨着zip格式和cd-i兩項壓縮標準已經成爲了世界上唯一一個不是phd的壓縮權威,所以對於他的文章自然雜誌自然非常重視,很快就給予了刊登,而且還加上了重點推薦。pagerank算法已經發表。馬上引起了學術界方面的討論。張國棟也趁此機會爲pagerank申請了專利,雖然還沒有批下來,不過申請的是國際專利,不怕別人再搞鬼。

有了pagerank算法在手,張國棟讓龔定雨去和趙維均談判,也不知道楊柳這個丫頭哪裏得知的消息,反正對於張國棟看好的生意她都要cha上一腳,結果就變成了兩股資金對同一個公司注資地事情。最後龍騰以技術加資金入股佔了49地股份,楊家用資金入股佔了30的股份,趙維均這個公司地創始人佔了21的股份。他也比較滿意了。畢竟以公司目前3000萬的投資來看,他白撿600多萬。還有什麼不滿意的呢。

就在yout成立之後的第三天,加拿大的三位同學就發表了archie,很險,差一點世界第一個搜索引擎的稱呼就被拿走,張國棟也是暗乎僥倖,當然,archie肯定沒有yout的生存能力強,畢竟ftp基本上都要密碼,搜索的內容比較狹隘。雖然龍騰不會進入通用搜索引擎,但是垂直搜索張國棟還是不願意放過,畢竟再怎麼說yout也不可能佔領整個世界的市場。所以隨着張國棟一聲令下,整個龍騰的軟件組又動了起來。!~!

..

上一章 目錄 下一章 存書籤
熱門推薦
冷王棄妃
都市陣法師
沉淪
陣師
帝少的千億寵兒
帝國從來沒有的黃昏
卡亞那的樹
偷香竊玉
獨寵甜妻
鐵血軍魂
浴血兵鋒
萬道龍皇
不科學的人間大炮
我修的可能是假仙