Re: [請益] 請問網頁掃描軟體開發

看板CodeJob作者 (Jason)時間16年前 (2007/09/18 12:36), 編輯推噓3(300)
留言3則, 3人參與, 最新討論串4/4 (看更多)
我有寫過類似的東西 也是把網頁的資料抓下來分析,塞DB 我是使用vb.net。分析的部份是用正則表示式來達成。 正則表示式讓你事半功倍。 ※ 引述《yangfan (小羊)》之銘言: : ※ 引述《tristone (tristone)》之銘言: : : 在詳細一點 我想要能夠分析出 這兩個網頁針對同一個新聞的反應時間 : : 所以不能手動reload 我希望此軟體可以自動reload 並且擷取頭條新聞入data base : : 有人可以幫忙嗎? : VB.NET JAVA C# 都可以辦到 : 資料庫看是用 ACCESS 或是 MYSQL 都行 : 流程是先將網頁的原始碼抓回來 : 再來濾掉HTML碼 : 拆出新聞的位置 : 記下抓取時間 : 塞資料庫 : 收工 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.223.249.73

09/18 12:40, , 1F
是正規表示式吧...
09/18 12:40, 1F

09/18 12:56, , 2F
Crawler + Parser + analysis
09/18 12:56, 2F

09/18 14:50, , 3F
正則、正規都有人用。原文是Regular Expression
09/18 14:50, 3F
文章代碼(AID): #16xrMmdI (CodeJob)
文章代碼(AID): #16xrMmdI (CodeJob)