看板 [ java ]
討論串[問題] 抓取網頁時所產生的問題...
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓12(12推 0噓 11→)留言23則,0人參與, 最新作者Gitangan (周大貓)時間17年前 (2008/04/16 11:36), 編輯資訊
0
0
1
內容預覽:
上次寫了這個之後,. 為了抗拒server的問題. 寫了幾個sleep,讓他跑一跑就睡一下... 躲過server block IP 的機制.... 現在我總共要在這個server抓取資料. 他的網址是以流水號去命名,共有4000萬筆…. 而且並不是所有的編號網址裡面都有資料. 可能4000萬筆裡面
(還有205個字)

推噓2(2推 0噓 3→)留言5則,0人參與, 最新作者Gitangan (周大貓)時間18年前 (2008/03/26 17:47), 編輯資訊
0
0
1
內容預覽:
最近寫一個java,. 抓取網頁上的內容,. 再來處理,擷取html裡的內容文字,. 可是在抓取網頁時,. 抓了幾些時間,譬如說10分鐘 or 1小時後,. 就會出現. Exception in thread "main" java.io.IOException: Server returned H
(還有130個字)
首頁
上一頁
1
下一頁
尾頁