[問題] 國圖標準中心爬蟲

看板Python作者 (inch446)時間6年前 (2017/12/10 21:42), 6年前編輯推噓0(005)
留言5則, 3人參與, 6年前最新討論串1/1
小弟第一次接觸Python爬蟲, 目前需要寫一個程式爬國家圖書館標準圖書中心的資料, http://isrc.ncl.edu.tw/search_result_isrc.aspx 即是用一首音樂的ISRC(類似音樂的身分證字號), 去抓該首音樂的資料,如中文歌名、歌、曲、詞等, 直接在該網站搜尋的結果如下圖, https://i.imgur.com/gQnrkbS.png
但小弟在網路上都找不到類似的專案, 請問各位大大該如何下手是好?謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.35.8.54 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1512913321.A.827.html

12/10 23:23, 6年前 , 1F
這個很簡單啊 去google requests的get用法吧
12/10 23:23, 1F

12/11 00:19, 6年前 , 2F
先理解一下http 運作吧
12/11 00:19, 2F

12/12 03:15, 6年前 , 3F
正好是用GET方法,把url最後的"search_string="改成
12/12 03:15, 3F

12/12 03:16, 6年前 , 4F
你要的字串就好。 這樣應該可以收到HTML。
12/12 03:16, 4F

12/12 03:17, 6年前 , 5F
剩下只要解析HTML的資料就好。
12/12 03:17, 5F
謝謝各位大大~已經成功抓到資料了 ※ 編輯: inch446 (114.35.8.54), 12/12/2017 13:32:23
文章代碼(AID): #1QBJcfWd (Python)