Re: [問題] 檢查檔案問題
※ 引述《ted66 (ted)》之銘言:
: 例如說 http://www.google.com.tw/ 的網站檢查所有連結是否有問題
這句話看不太懂,google 的網站檢查所有連結?
google 的網站?還是說 google 檢查網站?
: 我是想過用抓取網頁方式檢查,如果超過一定的時間就當作失敗
: 表示說那張圖或是超連結是壞損的
404, 403 等等回應,算是壞的嗎?
但如果你的壞掉定義是沒有回應,那也只能用 timeout 了
: 但是好像會有問題,而且似乎會太慢(如果檔案太多)
: 請問有指令可以跟所有檔案做連結嗎?
: (就單純連接上所有檔案的連結看是否有傳送資料)
你可以用 HTTP HEAD 去看 server 是否會回應,
然後設個 timeout, 超過一定時間沒有回應就算不存在。
如果說「太慢」是個問題,那就沒辦法了,因為你一定得等 server 回應。
解決辦法是,同時處理 1000 個 URL, 找個 thread safe 的
http lib 吧,聽說 Net::HTTP 沒有 thread-safe.
--
「行け!Loki!」(rocky ロッキー)
-Gurumin ぐるみん 王子? XD
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.135.28.18
→
09/14 00:00, , 1F
09/14 00:00, 1F
討論串 (同標題文章)