看板 [ java ]
討論串[問題] HTML PARSER出包了,還是我使用方法錯了?
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 4→)留言4則,0人參與, 最新作者mahoihei (Alvar)時間13年前 (2011/06/11 21:28), 編輯資訊
0
0
1
內容預覽:
先給上我要解析的網站. http://goo.gl/FXmDR. 用的是html parser 1.6版本. 我的想法是用TagNameFilter,過濾出<ul>TAG的nodelist. ,再找出nodelist的第一個NODE <ul class="archiver_forumlist">.
(還有335個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者cklonger (22)時間13年前 (2011/06/12 00:55), 編輯資訊
0
0
0
內容預覽:
先給上我要解析的網站. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 116.49.240.161. 有起始tag 就要有結束tag. 不然就是單一的<XXX/> tag. 總之就是寫網頁的人tag亂寫. 你要的話就抓li自己再過濾. 寫htmlparser 的人怎麼可能會知
(還有4個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者mahoihei (Alvar)時間13年前 (2011/06/12 19:56), 編輯資訊
0
0
1
內容預覽:
用了HTMLCLEANER,可是出來的結果都是一樣. code:. public static void main(String args[]) throws IOException {. URL url = new URL("http://www.discuss.com.hk/archiver/"
(還有494個字)
首頁
上一頁
1
下一頁
尾頁