Re: [問題] 有人寫過PageRank嘛?(Google搜尋引擎技術)
※ 引述《PsMonkey (痞子軍團團長)》之銘言:
: ※ 引述《kians (臨兵鬥者皆陣列在前)》之銘言:
: : 如題,Google利用頁面分析+PageRank技術達成了搜尋引擎霸主的地位
: : PageRank就是給予每一個網頁一個value啦,用google自己發展的PageRank演算法
: : 用在搜尋後的網頁排序,越重要的網頁會放在越前面
: : 最近對PageRank滿有興趣的,要如何讓電腦對數以億計的網頁進行運算
: : 一般的電腦根本不可能達成吧,有點想知道演算法是怎麼寫的
: ^^^^^^^^^^^^^^^^^^^^^^^^^^ ?
: 一般的電腦能不能計算目前所有網頁的 PageRank?
: 可以... 只是算完可能一個月過去了
: : 還是說關鍵在硬體? 用multiprocess的方式達成?
: ^^^^^^^^^^^^ ?
: : 有人用java寫過PageRank的演算法嘛?
: 有,在固定某個 test data 量下,我就寫過
: : 希望能找到範例來參考一下,想對手邊有的幾十萬筆的連結資訊算出所有url的PageRank值
: : (格式(txt): url1->url2
: : url1->url3
: : url2->url3
: : .
: : .
: : . )
: : 不知道有沒有辦法辦到,先謝謝各位囉
: 有
: ==== 好了,回答完問題,以下是個人喇賽區,不爽不要看 ====
: 不考慮效率問題
: 只要寫的出演算法,為甚麼要問某某語言可不可以寫得出來?
: (問題是,原 po 是不是真的知道 PageRank 演算法的基本式子?)
: 如果要問如何平行處理
: 請去找平行計算 or 分散式系統的書、或是到專版討論
: 除非要問到 Java 有哪些平行處理的 framework 或是 library
: 那請另起標題,不然,就這篇文章而言...
: 好吧... 這是介在作業文與「與版面無關文」的中間
: 說白了,版規沒辦法做什麼
: 只是個人很討厭這種文章
來,
page rank 的中文式子
http://zh.wikipedia.org/wiki/PageRank
英文解釋網頁
http://www.ianrogers.net/google-page-rank/
當年他們的paper
http://infolab.stanford.edu/pub/papers/google.pdf
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.229.145.157
推
11/02 12:45, , 1F
11/02 12:45, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 6 篇):