[問題] 台銀網頁爬蟲
各位前輩大家好
最近練習爬蟲寫BeautifulSoup
主要是只想要抓取台銀網頁,貨幣及現金匯率(本行賣出)就好
目前是可以抓到資料,但是貨幣那欄的值一直都是置中
但是我只想要單純的文字就好,不要置中QQ
以下是code,還請各位前輩幫忙指教
import requests
from bs4 import BeautifulSoup
res = requests.get('http://rate.bot.com.tw/xrt?Lang=zh-TW')
soup = BeautifulSoup(res.text,'html.parser')
Currency = soup.find_all(class_='hidden-phone print_show')
Rate = soup.find_all(class_='rate-content-cash text-right print_hide')
for x in range(0,18):
print(Currency[x].text)
print(Rate[x*2+1].text)
輸出結果:
美金 (USD)
30.572
港幣 (HKD)
3.953
英鎊 (GBP)
38.89
澳幣 (AUD)
23.35
加拿大幣 (CAD)
23.17
新加坡幣 (SGD)
22.01
瑞士法郎 (CHF)
30.61
(列出幾行參考結果....)
另外想請問大家一個問題
抓取網頁時 .content / .string / .text有什麼不同呢?
目前還是新手,如果問題很爛,還請大家多多包涵
謝謝大家
※ 編輯: fealing (125.227.157.49), 04/14/2017 17:56:18
推
04/14 18:02, , 1F
04/14 18:02, 1F
→
04/14 23:06, , 2F
04/14 23:06, 2F
→
04/14 23:10, , 3F
04/14 23:10, 3F
→
04/15 13:02, , 4F
04/15 13:02, 4F
推
04/15 15:36, , 5F
04/15 15:36, 5F
→
04/15 15:37, , 6F
04/15 15:37, 6F
→
04/15 15:38, , 7F
04/15 15:38, 7F
推
04/16 16:25, , 8F
04/16 16:25, 8F