[問題] midjourney 爬蟲問題請教

看板Python作者 (totte)時間10月前 (2023/07/07 21:31), 編輯推噓1(100)
留言1則, 1人參與, 10月前最新討論串1/1
大家好 目前我寫的 midjourney 爬蟲遇到問題,想請教一下如何解決 環境是租來的 vps (主機在美國) os 是 ubuntu 22.04 爬取的步驟是先透過 get 程式如下 https://gist.github.com/HankChangGSS/8e45d1e2b836923c30118e762a59f530 透過上述回傳的 html 拆解出 form id="challenge-form" 其中的 action 位置 以及 input 發出請求的程式如下 https://gist.github.com/HankChangGSS/c0732ba1e85e8ed3c5e86af2389b1fed 但是此段程式的回傳不符預期 我期望得到的回傳是能夠像人工開啟瀏覽器,訪問 https://www.midjourney.com/showcase/recent/ 其中會有回傳以下區段 <script id="__NEXT_DATA__" type="application/json"> 以便後續能剖析 json 裡面的資料 但目前用程式來發送請求,不知程式的寫法哪裡有問題, 導致 server 回傳上述的 json 資料? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.245.121.125 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1688736680.A.0B8.html

07/08 07:02, 10月前 , 1F
“上述的json資料”忘記附?
07/08 07:02, 1F
文章代碼(AID): #1ag1Ee2u (Python)