[問題] 用beautifulsoup find_all沒找齊對應資料

看板Python作者 (nujabes)時間6年前 (2017/11/17 14:19), 編輯推噓1(104)
留言5則, 2人參與, 6年前最新討論串1/1
使用python 3.5版本 最近想摸一下beautifulsoup的功能 所以想爬broadway的網站,寫個簡易查詢時刻表等功能 問題是這樣的 先附上code url= 'https://www.nyc.com/broadway_tickets/' html = urllib.request.urlopen(url).read() soup BeautifulSoup(html, 'html.parser') dramaName = soup.find_all('h2') dramaList = [] for i in dramaName: Print(i.string) dramList.append(i.string) 劇名是放在h2 底下,但我用find_all去找body底下的h2標籤 只能找出局部的資訊,沒辦法找出所有的劇名 爬了一下stackflow, 有看到有些網站支援問題 有嚐試把html.parser換成lxml,但問題還是存在 想請問有可能朝哪個方向去解決這問題呢? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 173.56.84.230 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1510899599.A.4E3.html

11/17 14:31, 6年前 , 1F
用developer panel可以看得出來他有query
11/17 14:31, 1F

11/17 14:31, 6年前 , 2F
www.nyc.com/broadway_ticketselements/?page=2 ~page=12
11/17 14:31, 2F

11/17 14:51, 6年前 , 3F
我是用developer tool看 想說看起來都在同一頁底下
11/17 14:51, 3F

11/17 14:52, 6年前 , 4F
但剛剛看了一下page source 好像真的就那些資訊
11/17 14:52, 4F

11/17 14:52, 6年前 , 5F
謝謝你 我再試試看
11/17 14:52, 5F
文章代碼(AID): #1Q3d-FJZ (Python)