Re: [問題] html parser功能一問
※ 引述《conan99 (Edison)》之銘言:
: 想請教JAVA前輩
: 最近我要寫一個程式上網抓網頁的特定部份的資料
: 比如標籤:
: <div id="contentBlock">
: <div id="articleBlock">
: 內的連結或顯示文字
: HTML PARSER能幫我方便地找到該特定資料嗎?
: 還有,HTML檔需要先抓下來嗎?
: 還是可以線上讀取,只抓特定資料
: 謝謝
: ==================================================
: 囧了,我沒有犯規的意思~~請饒命
: 只是都還不解,想請人解惑^^
: 充實內容....還在摸索中不知道怎麼充實..
: 提供一下HTML Parser的連結
: 網站:http://htmlparser.sourceforge.net/
: 版本:2.0
如果你要問可不可以,有規律的網頁,是一定可以處理的
(沒規律的... 就先不用考慮了.....)
所以,就你的問題,回答一句「可以」就結案了
這樣的討論沒啥意義,我想你也獲得不了什麼東西
請你充實內容,這個「充實內容」是在一個基礎上
就是你已經開始用 HtmlParser 去處理你要的 html
然後問你無法做到 or 不知道如何做到的功能
(當然,class 不會用,這勉強也可以問,但是要作更多功課)
你的文章看下來,就我的感覺
你可能連 HtmlParser 是圓是扁都還不知道
不知道不是罪,只是這樣子就上來問,不太負責任也不會有啥好結果
所以才有那個「警告」
以上
====
最後,有沒有抓 HTML 存成檔案,不影響 fetch 資料
只是我的實做經驗來講,存成檔案,重複使用起來會比較快樂
--
侃侃長論鮮窒礙 首頁:http://www.psmonkey.idv.tw
眾目睽睽無心顫 Blog:http://ps-think.blogspot.com
煢居少聊常人事
殺頭容易告白難 歡迎參觀 Java 版(@ptt.cc)精華區 \囧/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 58.114.208.48
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 5 篇):