[問題] 爬蟲請益

看板Python作者 (肝爹)時間4年前 (2020/05/14 23:44), 編輯推噓4(4013)
留言17則, 5人參與, 4年前最新討論串1/2 (看更多)
各位好: 想請教我在爬台大醫院網頁 我想從依醫事人員姓名掛號頁面中的掛號連結在爬到網路預約掛號的頁面 圖一是我已經爬完得到的結果 終極目標希望可以完成辨識直接掛號 因為要圖像辨識這部分我還不會 想請問: 是否可以從圖二的結果爬完的結果 (我的作法是直接用request硬解,如圖五) 得知圖三的掛號連結 目前看到的資訊: 我想圖三的地方需要用到圖二的cookie應該還有醫生姓名診別資訊 但這部分我猜需要用到回傳的那些ID但不知道要怎麼兜 剛初學對這類動態的產生的網頁不太會看,又不知道是不是要用webdriver 而selenium又是我不太熟的部分orz..再請各位指導,感謝 https://imgur.com/a/2sgGp0e -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.167.131.117 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1589471088.A.B79.html

05/15 01:46, 4年前 , 1F
你好像只有一張圖耶
05/15 01:46, 1F

05/15 01:57, 4年前 , 2F
Selenium 會不會比較合用?到時候掛號送出一個超長form
05/15 01:57, 2F

05/15 01:57, 4年前 , 3F
data,request就爆了
05/15 01:57, 3F

05/15 04:11, 4年前 , 4F
我覺得Selenium是不太優的爬蟲解法,對沒有複雜js或複雜
05/15 04:11, 4F

05/15 04:11, 4年前 , 5F
的反爬,requests很萬用
05/15 04:11, 5F

05/15 04:15, 4年前 , 6F
先確定好需要request哪些資料,哪些資料又是由哪個網頁
05/15 04:15, 6F

05/15 04:15, 4年前 , 7F
產生的
05/15 04:15, 7F

05/15 07:53, 4年前 , 8F
我把一些截圖全部放同一張,有間隔分開,由上到下有五張
05/15 07:53, 8F

05/15 07:55, 4年前 , 9F
手機看有點小,下次還是分開貼,不好意思
05/15 07:55, 9F

05/15 07:56, 4年前 , 10F
你用session 你的cookie就會往下帶了
05/15 07:56, 10F

05/15 08:00, 4年前 , 11F
我可能看不懂你的問題,你在圖二找到帶有你圖三的資料的
05/15 08:00, 11F

05/15 08:00, 4年前 , 12F
封包,丟過去後看要不要parse
05/15 08:00, 12F

05/15 08:11, 4年前 , 13F
t 大你好,我的問題簡單說如何從圖二掛號連結再轉到圖三,
05/15 08:11, 13F

05/15 08:11, 4年前 , 14F
謝謝
05/15 08:11, 14F

05/15 08:14, 4年前 , 15F
你只是需要同一份cookie ,可以看看requests session
05/15 08:14, 15F

05/15 08:16, 4年前 , 16F
好的,我再來試試,謝謝
05/15 08:16, 16F

05/15 18:23, 4年前 , 17F
我也不喜歡selenium 都用request硬解
05/15 18:23, 17F
文章代碼(AID): #1UlMTmjv (Python)
討論串 (同標題文章)
文章代碼(AID): #1UlMTmjv (Python)