[問題] 網頁爬蟲

看板java作者 (季)時間13年前 (2013/03/01 22:48), 編輯推噓0(001)
留言1則, 1人參與, 最新討論串1/1
我想要抓取露天拍賣"寵物"的拍賣結果 抓取如下網頁 http://search.ruten.com.tw/search/s000.php?searchfrom=searchf&k=%C3d%AA%AB&t=0 (縮址:http://goo.gl/ICioT ) 但發現他似乎有些地方是用javascript跑的 所以直接抓html會抓不到 後來我試著用HtmlUnit 直接模擬瀏覽器 抓到的仍是沒有商品項目的網頁 請問為什麼會這樣呢 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.34.140.123

03/01 23:23, , 1F
hint : enable javascript
03/01 23:23, 1F
我有webClient.setJavaScriptEnabled(true); ※ 編輯: sbshank 來自: 114.34.140.123 (03/01 23:42)
文章代碼(AID): #1HCB_7ow (java)