[問題] 使用selenium爬蟲被偵測為機器人
各位前輩大家好!
我日前使用selenium寫爬蟲時
遇到網頁偵測為機器人而跳出
需要寫認證碼阻擋,而我自己使用
time.sleep()去延遲下載時間
好像也沒法阻止機器人偵測
請問這個原因是?
請問一下有其他解決方法嗎?
下圖為我遇到的狀況
http://imgur.com/CyfWI5k
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.106
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1467259128.A.3AA.html
→
06/30 12:07, , 1F
06/30 12:07, 1F
→
06/30 12:08, , 2F
06/30 12:08, 2F
→
06/30 12:38, , 3F
06/30 12:38, 3F
→
06/30 12:38, , 4F
06/30 12:38, 4F
→
06/30 12:38, , 5F
06/30 12:38, 5F
→
06/30 12:44, , 6F
06/30 12:44, 6F
→
06/30 12:45, , 7F
06/30 12:45, 7F
→
06/30 13:03, , 8F
06/30 13:03, 8F
→
06/30 13:03, , 9F
06/30 13:03, 9F
→
06/30 13:17, , 10F
06/30 13:17, 10F
→
06/30 15:41, , 11F
06/30 15:41, 11F
→
06/30 18:43, , 12F
06/30 18:43, 12F
→
06/30 22:21, , 13F
06/30 22:21, 13F
→
06/30 22:21, , 14F
06/30 22:21, 14F
→
07/04 19:20, , 15F
07/04 19:20, 15F