Re: [問題] 爬蟲表格的問題

看板Python作者 (幫王)時間8年前 (2017/08/08 01:02), 編輯推噓0(001)
留言1則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《ptoyhawinf (沉睡的毛利小五郎)》之銘言: : 各位前輩好 : 小弟最近試著爬一些設備端的網頁,想取得設備目前運作狀態 : (snmp竟然沒辦法取得我想要的資訊) : 試著用bs及pyquery來實作 : 但在table這卡關,希望有經驗的前輩可以解惑一下 : html如下 : <table> : <thead> : <tr> : <th> : 欄位1</th> : <th> : 欄位2</th> : <th>欄位3</th> : <th>欄位4</th> : <th>欄位5</th> : <th> : 欄位6</th> : </tr> : </thead> : <tbody> : <tr> : <td rowspan="2"> : AB</td> : <th>a0</th> : <td class="bold green_border">a1<br></td> : <td class="grey">a2</td> : <td class="grey">a3</td> : <td rowspan="2">ab4</td> : </tr> : <tr> : <th>b0<br></th> : <td class="bold">b1</td> : <td class="grey">b2<br></td> : <td class="grey">b3</td> : </tr> : <tr> : <td rowspan="2"> : CD</td> : <th>c0</th> : <td class="bold">c1</td> : <td class="grey">c2</td> : <td class="grey">c3</td> : <td rowspan="2">cd4</td> : </tr> : <tr> : <th>d0<br></th> : <td class="bold green_border">d1</td> : <td class="grey">d2</td> : <td class="grey">d3</td> : </tr> : </tbody> : </table> : 大致上,是要取得class = green_border的值,但也要取得它前後的一些欄位 : 但因為有的td rowspan =2,所以不管是直接filter green_border,再往前後取得值 : 或是取得tr後,再find,好像都拿不到rowspan的值 : 比如我要找的值是d1(欄位3),但我要怎麼拿到CD(欄位1)或cd4(欄位6)的值呢? : 麻煩有經驗的前輩指導一下,謝謝你們了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.229.169 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1502125368.A.650.html

08/08 04:12, , 1F
沒有內容??
08/08 04:12, 1F
文章代碼(AID): #1PY9quPG (Python)
討論串 (同標題文章)
文章代碼(AID): #1PY9quPG (Python)