[問題] 爬蟲程式如何判斷某些連結的檔名

看板Python作者martinqqq321 (蓋棉被開冷氣)時間5年前 (2021/03/01 21:17)推噓0(0推 0噓 2→)

留言2則, 1人參與討論串1/1

我寫的程式會先用googlesearch.search去找我想要下載的檔案，之後會用 r = request.get(url) with open(name,’wb’) as f: F.write(r.content) 的方式把檔案存下來最麻煩的地方主要是name的部分，我目前是直接從網址去判斷存下的檔名和副檔名但有時候google search會出現以下的結果： Http://www......./index.php?Action=downloadfile&file=............ 問題就在downloadfile&file後面都是無法辨識的亂碼，請問要如何去偵測這種網址的檔名和檔案類型呢如果直接從chrome去打開這些網址的話，會直接跳到下載檔案的畫面 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.154.176 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1614604647.A.044.html

→

zerof

03/02 02:01, 5年前 , 1^F

03/02 02:01, 1^F

→

zerof

03/02 02:05, 5年前 , 2^F

03/02 02:05, 2^F

‣ 返回看板[ Python ] 程設

‣ 更多 martinqqq321 的文章

文章代碼(AID): #1WFEbd14 (Python)