[問題] 爬蟲資料格式及處理
大家好,初學爬蟲
透過以下程式抓到文字資料
https://imgur.com/mGAOY9I


想問一下這是哪種資料類型阿?
有像html之於BeautifulSoup的library可以處理嗎?
感恩!
import requests
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5)'
headers = {'User-Agent': user_agent,
'Referer':'http://www.family.com.tw/marketing/inquiry.aspx'}
response = requests.get("http://api.map.com.tw/net/familyS"
"hop.aspx?searchType=ShopList&type="
"&city=%E5%9F%BA%E9%9A%86%E5%B8%82"
"&area=%E4%BB%81%E6%84%9B%E5%8D%80&"
"road=&fun=showStoreList&key=6F30E8"
"BF706D653965BDE302661D1241F8BE9EBC"
, headers=headers)
response.text
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.49.4
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1508940751.A.DCD.html
→
10/25 22:23,
8年前
, 1F
10/25 22:23, 1F
推
10/25 22:23,
8年前
, 2F
10/25 22:23, 2F
→
10/25 22:25,
8年前
, 3F
10/25 22:25, 3F
推
10/25 22:27,
8年前
, 4F
10/25 22:27, 4F
→
10/26 00:39,
8年前
, 5F
10/26 00:39, 5F
→
10/26 00:40,
8年前
, 6F
10/26 00:40, 6F
→
10/26 00:41,
8年前
, 7F
10/26 00:41, 7F
→
10/26 00:41,
8年前
, 8F
10/26 00:41, 8F
推
10/26 08:41,
8年前
, 9F
10/26 08:41, 9F
→
10/26 08:49,
8年前
, 10F
10/26 08:49, 10F
推
10/26 15:13,
8年前
, 11F
10/26 15:13, 11F
把showStoreList去掉就可順利讀取,感恩!
fun的部分有storeTownList和showStoreList
一個列出有店點的行政區;一個是店點資料
key的部分目前看似乎都長一樣
https://imgur.com/DVCqwNu


※ 編輯: unhumanWu (220.136.49.4), 10/26/2017 20:43:07