[問題] 卦板用request取得之原始碼不合

看板Python作者 (丹明)時間6年前 (2018/01/26 17:28), 6年前編輯推噓1(103)
留言4則, 4人參與, 6年前最新討論串1/1
大家好, 我目前剛開始藉Su Billy大大的簡單爬蟲教學video初學python爬蟲 遇到有個小問題, 就是我用request抓卦板的原始碼時 - res = request.get('https://www.ptt.cc/bbs/Gossiping/index.html') print(res.text) - 印出的原始碼跟實際卦板網頁的原始碼對不上, 而是顯示像是PTT入口頁面的內容 如下圖 https://imgur.com/gmTQFY9
BUT! 我用Salary, Tech_job跟表特等其他板測試, 卻都沒有問題@@ 想請問卦板的內容有何特殊之處嗎? 我對前端的html和CSS等語言完全不熟, 只學過基礎的python 望大家指教,謝謝板友Orz -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.234.94 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1516958933.A.B85.html ※ 編輯: DaKyu (140.112.234.94), 01/26/2018 17:30:43

01/26 17:31, 6年前 , 1F
Session 問題, 你 request 裡面沒按過那個 18 禁按鈕
01/26 17:31, 1F
謝謝u大提醒! 有google到相關解法了, 真的很謝謝你~~ ※ 編輯: DaKyu (140.112.234.94), 01/26/2018 17:54:54

01/27 17:14, 6年前 , 2F
貌似模擬Google爬蟲可繞過那個按鈕
01/27 17:14, 2F

01/29 14:25, 6年前 , 3F
可以用Selenium去點那個按鈕
01/29 14:25, 3F

03/06 04:36, 6年前 , 4F
03/06 04:36, 4F
文章代碼(AID): #1QQlJLk5 (Python)