[問題] 以requests登入網站

看板Python作者liquidbox (樹枝擺擺)時間6年前 (2019/07/01 17:37)推噓1(1推 0噓 11→)

留言12則, 5人參與討論串1/1

我遇到一個網站，一進入就會prompt，提醒需要輸入帳密，我可以用selenium連上 https://username:password@xxxx.com.tw，並取得我想要爬取的資料但selenium實在太慢了，所以我想回歸原本使用requests+lxml，卻無法使用 https://username:password@xxxx.com.tw 的方式登入，會一直引發ConnectionError(err, request=request) 我想試著用requests.get(url,auth=(username,password)) 也一樣會引發ConnectionError 想請問像這類的網站是否可直接利用requests登入？謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.111.96 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1561973826.A.9F5.html

→

TakiDog

07/01 20:09, 6年前 , 1^F

07/01 20:09, 1^F

→

s860134

07/01 23:46, 6年前 , 2^F

07/01 23:46, 2^F

→

liquidbox

07/02 06:54, 6年前 , 3^F

07/02 06:54, 3^F

→

coeric

07/02 10:22, 6年前 , 4^F

07/02 10:22, 4^F

→

TakiDog

07/02 16:21, 6年前 , 5^F

07/02 16:21, 5^F

→

TakiDog

07/02 16:21, 6年前 , 6^F

07/02 16:21, 6^F

謝謝分享，我單純認為，也許requests針對https://username:password@host會有通用的處理方法加上網站不便提供，所以沒辦法進一步清楚結果跟爬蟲怎麼爬一樣，這件事得見招拆招，證實這件事比我原先想的更複雜先前試了網路上幾種方法都沒能成功，只好等日後技能點齊一點再來想辦法但我還是學到了requests有解，但我功力不夠這件事，至少方向出來了，謝謝分享 ※ 編輯: liquidbox (61.230.111.96 臺灣), 07/02/2019 17:51:48

推

ssivart

07/04 00:36, 6年前 , 7^F

07/04 00:36, 7^F

→

ssivart

07/04 00:36, 6年前 , 8^F

07/04 00:36, 8^F

→

ssivart

07/04 00:36, 6年前 , 9^F

07/04 00:36, 9^F