[問題] 如何把HTML轉成XML?

看板java作者 (jonesking)時間14年前 (2010/02/08 12:49), 編輯推噓2(205)
留言7則, 6人參與, 最新討論串1/1
小弟目前遇到的問題是 在Java中parser HTML讓他產生dom tree 都會有沒有清完的tag之類的 所以我就想說把它轉成XML 來被parser 然後看了一下 請問一下Java要用什麼jar可以把yahoo那種首頁 也可以轉成XML呢? 所以想問 1.大家都是怎麼用Java parser html的? 如果可以告訴我範例和Source code 那真是感激不盡 2. HTML轉XML如果要用Java做 請問大家如何實作呢? 如果有大大願意完整解答 小弟願意出5000p幣報答 Orz 不是用這帳號寄 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.129.20.18

02/08 12:53, , 1F
你要不要先搞清楚 html 跟 XML 差在哪邊...
02/08 12:53, 1F

02/08 13:07, , 2F
也許你應該先Google一下"htmlparser"
02/08 13:07, 2F

02/08 13:27, , 3F
02/08 13:27, 3F

02/08 13:28, , 4F
只能說最近心腸比較好,以前的話,大概就作業文條款掰了
02/08 13:28, 4F

02/08 14:50, , 5F
怎麼不乾脆用html tidy清成xhtml 好了 @_@
02/08 14:50, 5F

02/08 15:18, , 6F
parser是名詞, parse 才是動詞...
02/08 15:18, 6F

02/08 15:58, , 7F
他有問要用什麼jar檔 雖然不是直接問要用哪個lib...
02/08 15:58, 7F
文章代碼(AID): #1BRvV1nD (java)