討論串(共3篇) - [問題] HTML PARSER出包了,還是我使用方法錯了? - 看板java

看板 [ java ]

討論串[問題] HTML PARSER出包了,還是我使用方法錯了?

共 3 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] HTML PARSER出包了,還是我使用方法錯了?

推噓1(1推 )留言1則，0人參與作者mahoihei (Alvar)時間14年前 (2011/06/12 19:56)資訊

內容預覽:

用了HTMLCLEANER,可是出來的結果都是一樣. code:. public static void main(String args[]) throws IOException {. URL url = new URL("http://www.discuss.com.hk/archiver/"

(還有494個字)

Re: [問題] HTML PARSER出包了,還是我使用方法錯了?

推噓1(1推 )留言1則，0人參與作者cklonger (22)時間14年前 (2011/06/12 00:55)資訊

內容預覽:

先給上我要解析的網站. --. ※ 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 116.49.240.161. 有起始tag 就要有結束tag. 不然就是單一的<XXX/> tag. 總之就是寫網頁的人tag亂寫. 你要的話就抓li自己再過濾. 寫htmlparser 的人怎麼可能會知

(還有4個字)

[問題] HTML PARSER出包了,還是我使用方法錯了?

推噓0(0推 )留言4則，0人參與作者mahoihei (Alvar)時間14年前 (2011/06/11 21:28)資訊

內容預覽:

先給上我要解析的網站. http://goo.gl/FXmDR. 用的是html parser 1.6版本. 我的想法是用TagNameFilter,過濾出<ul>TAG的nodelist. ,再找出nodelist的第一個NODE <ul class="archiver_forumlist">.

(還有335個字)

首頁

尾頁