[問題] 抓取 Google Play 評分內容

看板Python作者 (ChaN)時間5年前 (2019/05/07 13:34), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
各位好,請教一個爬蟲的問題,以 facebook app 為例 https://play.google.com/store/apps/details?id=com.facebook.katana https://i.imgur.com/toqUOYV.png
這是我原本撈取的部分,86,815,373 total 這個數字之前會分散在右邊 1-5 的區塊 可以個別抓取不同等級的個別數量,但前兩天發現 Google 把數字移除了 取而代之的是將他放在 HTML JS 那邊成為變數計算 bar 的寬度 檢視 source code 的時候會發現 https://i.imgur.com/GHvkbmh.png
紅色為 total,是藍色部分的總和,依照比例推敲藍色部分就代表 1-5 我目前是使用 urllib + pyquery 爬網頁,查過文章有看過用 split 來擷取 JS variable 的內容 感覺上是有點風險,不知道有沒有什麼比較穩定的方式或套件可以達到這個目的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.234.173 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1557207246.A.6C5.html
文章代碼(AID): #1SqHZER5 (Python)