Re: [問題] 有人寫過PageRank嘛?(Google搜尋引擎技術)
※ 引述《kians (臨兵鬥者皆陣列在前)》之銘言:
: 如題,Google利用頁面分析+PageRank技術達成了搜尋引擎霸主的地位
: PageRank就是給予每一個網頁一個value啦,用google自己發展的PageRank演算法
: 用在搜尋後的網頁排序,越重要的網頁會放在越前面
: 最近對PageRank滿有興趣的,要如何讓電腦對數以億計的網頁進行運算
: 一般的電腦根本不可能達成吧,有點想知道演算法是怎麼寫的
^^^^^^^^^^^^^^^^^^^^^^^^^^ ?
一般的電腦能不能計算目前所有網頁的 PageRank?
可以... 只是算完可能一個月過去了
: 還是說關鍵在硬體? 用multiprocess的方式達成?
^^^^^^^^^^^^ ?
: 有人用java寫過PageRank的演算法嘛?
有,在固定某個 test data 量下,我就寫過
: 希望能找到範例來參考一下,想對手邊有的幾十萬筆的連結資訊算出所有url的PageRank值
: (格式(txt): url1->url2
: url1->url3
: url2->url3
: .
: .
: . )
: 不知道有沒有辦法辦到,先謝謝各位囉
有
==== 好了,回答完問題,以下是個人喇賽區,不爽不要看 ====
不考慮效率問題
只要寫的出演算法,為甚麼要問某某語言可不可以寫得出來?
(問題是,原 po 是不是真的知道 PageRank 演算法的基本式子?)
如果要問如何平行處理
請去找平行計算 or 分散式系統的書、或是到專版討論
除非要問到 Java 有哪些平行處理的 framework 或是 library
那請另起標題,不然,就這篇文章而言...
好吧... 這是介在作業文與「與版面無關文」的中間
說白了,版規沒辦法做什麼
只是個人很討厭這種文章
--
侃侃長論鮮窒礙 首頁:http://www.psmonkey.idv.tw
眾目睽睽無心顫 Blog:http://ps-think.blogspot.com
煢居少聊常人事
殺頭容易告白難 歡迎參觀 Java 版(@ptt.cc)精華區 \囧/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.136.152.117
推
11/01 20:26, , 1F
11/01 20:26, 1F
推
11/01 23:12, , 2F
11/01 23:12, 2F
→
11/02 17:02, , 3F
11/02 17:02, 3F
推
11/02 23:53, , 4F
11/02 23:53, 4F
推
11/09 13:07, , 5F
11/09 13:07, 5F
討論串 (同標題文章)