[問題] HTML parser的問題

看板Web_Design作者Echizen (想飛的小孩)時間13年前 (2012/12/13 15:51)推噓2(2推 0噓 7→)

留言9則, 5人參與討論串1/1

大家好我現在想寫一個可以簡化網頁的程式所以需要分析所有網頁的內文TAG 可是每個網頁的HTML TAG格式都不一樣 ex:在PIXNET和無名小站的主要內文TAG分別是<div class="articla">及 <div class="innertext"> 想請問各位大大網頁的HTML TAG是否有共通點讓我擷取內文或是我的解決方法是不是往錯誤的方向去想? 麻煩知道或是有研究過的人給點提示或是解決方向感激不盡!!!!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.39.205

推

mervynW

12/13 17:27, , 1^F

12/13 17:27, 1^F

推

LaPass

12/13 17:44, , 2^F

12/13 17:44, 2^F

→

Echizen

12/13 18:16, , 3^F

12/13 18:16, 3^F