Re: [問題] 爬蟲 如何爬指定資料
※ 引述《a856479 (thebelief)》之銘言:
: 大家好,由於我沒有程式語言的基礎
: 最近試著爬網頁資料時遇到一個問題不知道怎麼解決
: 請求各位協助幫忙,謝謝!
: 目標網址:https://goo.gl/02M292
: 目標資料:只要"今日十全戰法偏多"裡面出現的股票名稱
: 問題:我找不出"今日十全戰法偏多"的class或能定義它的方式,
: 導致只能抓取到網頁內所有的股票名稱...
: ----------以下是我目前的寫法----------
: import requests
: from bs4 import BeautifulSoup
: res = requests.get("http://www.sohowgood.com/TwStock/PowerKLine.aspx")
: soup = BeautifulSoup(res.text, "lxml")
: stocks = soup.find_all('li')
: for stock in stocks:
: meta = stock.find('a')
: stockid = meta.getText().strip()
: print(stockid)
: 請問我該如何修改才能抓取到我需要的部分? 謝謝大家
我用了 PyQuery
https://pypi.python.org/pypi/pyquery
from pyquery import PyQuery as pq
d = pq(url="http://www.sohowgood.com/TwStock/PowerKLine.aspx")
lis = d('h2:contains("今日十全戰法偏多") ~ ul li a')
for li in lis:
print(li.attrib['title'])
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 221.224.213.130
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1487406657.A.C6C.html
→
02/18 22:31, , 1F
02/18 22:31, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 3 篇):