[問題] 關於爬網頁的新手問題

看板Python作者 (Eduardo)時間4年前 (2019/10/02 17:38), 編輯推噓2(209)
留言11則, 6人參與, 4年前最新討論串1/1
看了一些網路上的教學之後開始練習抓資料 PTT跟yahoo有固定的html 格式的可以抓到了 不過巴哈姆特的排行榜卻很奇怪 https://forum.gamer.com.tw/?page=1&c=21 我看他的資料都在 Javascript裡面 這樣要怎麼處理...有沒有可以指點一下 >_<" 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.61.134.145 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1570009100.A.FFB.html

10/02 21:34, 4年前 , 1F
我之前有用過一種作法是把資料從 js 找出來 然後加
10/02 21:34, 1F

10/02 21:34, 4年前 , 2F
上一段轉成 json 的 code 再整個拿去給 nodejs 跑
10/02 21:34, 2F

10/02 21:35, 4年前 , 3F
跑完有就 json 了 不過這樣其實挺麻煩的
10/02 21:35, 3F

10/02 21:35, 4年前 , 4F
就有
10/02 21:35, 4F

10/03 09:12, 4年前 , 5F
用regex把整段js存起來 再找能直譯js的lib
10/03 09:12, 5F

10/03 09:21, 4年前 , 6F
好的,謝謝兩位,來試試看
10/03 09:21, 6F

10/03 18:49, 4年前 , 7F
去看js 內容有辦法抓出來改寫成python?
10/03 18:49, 7F

10/03 19:47, 4年前 , 8F
花時間改寫不如丟給nodejs跑比較快
10/03 19:47, 8F

10/10 22:17, 4年前 , 9F
不就直接call他的api就好了嗎!?
10/10 22:17, 9F

10/10 22:18, 4年前 , 10F

10/14 18:26, 4年前 , 11F
看到了,感謝指點,已經成功爬回來寫入檔案
10/14 18:26, 11F
文章代碼(AID): #1Tb70C_x (Python)