[問題] 該如何靠一個定位點抓取上層資料？

看板Python作者KeyBoardKill (✩鍵✩盤✩戮✩)時間7年前 (2018/06/03 18:38)推噓2(2推 0噓 5→)

留言7則, 3人參與討論串1/1

各位好，做爬蟲又遇到了個問題...基本上來源會有 ID 跟 Number ，我必須靠Number 來追蹤到ID，目前已經能做到追蹤到Number但ID跟Number不同行，我不懂該如何提取能給我點提示嗎？謝謝範例:..... str = ''' <li><a href="123.html" target=_blank class="Observe24"> 十分鐘資料</a></li> ''' 如果是整行同一行我就有辦法使用split來抓到並清洗出我要的123.html 但現在如果分行了，我只能抓到唯一識別值：十分鐘資料，我不知道應該怎麼回推從我在原始碼找到十分鐘的資料後，往上一行獲取到 123.html 這個值懇請指點謝謝 -- ◢ ◣ ● █≡◥◣ ◢ ◣ 】。 \。【這個板需要更高竿的酸民 ● //﹀\\● ◥ ◤ 】 ╰═╯【 ◤ ◢◥ ◤◣ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.158.30.145 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1528022314.A.E65.html

推

ringlwe

06/03 18:56, 7年前 , 1^F

06/03 18:56, 1^F

→

ringlwe

06/03 18:56, 7年前 , 2^F

06/03 18:56, 2^F

→

ringlwe

06/03 18:56, 7年前 , 3^F

06/03 18:56, 3^F