[問題] VS2010 C#的免費html parser

看板C_Sharp作者 (Conan)時間14年前 (2011/04/02 23:55), 編輯推噓3(309)
留言12則, 8人參與, 最新討論串1/1
我是用Visual Studio 2010 C# 想要對網頁進行parsing 之前用C++時,有用一個parser還不錯用 可以直接搜尋node 不知c#有沒有免費的parser? google的結果,Winista.HtmlParser.dll找不到可下載的載點 或者其它是下載後是專案檔,不知道怎麼轉成DLL直接參照 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.104.148.195

04/03 00:03, , 1F
你之前C++是用哪一個parser?
04/03 00:03, 1F

04/03 00:13, , 2F
cpp是XML的parser才對,但是忘了哪個了,許久沒用了
04/03 00:13, 2F

04/03 00:14, , 3F
java是HTML的,但也忘了哪個,這個還有一個介面可以測試
04/03 00:14, 3F

04/03 00:47, , 4F
如果是XML的話,C#有內建的可以直接使用
04/03 00:47, 4F

04/03 00:49, , 5F

04/03 01:13, , 6F
04/03 01:13, 6F

04/03 09:48, , 7F
前陣子有遇過相同問題,後來使用Html Agility Pack
04/03 09:48, 7F

04/03 15:31, , 8F
想問個問題:可以拿「XML PARSER」parsing 「HTML」嗎?XD
04/03 15:31, 8F

04/03 15:34, , 9F
如果是XHTML的話應該可以...?
04/03 15:34, 9F

04/03 15:49, , 10F
那我了解了,再找時間來試試^^謝謝各位
04/03 15:49, 10F

04/04 09:00, , 11F
可以用HTML Agility Pack 在MSDN上可以下載 還有說明
04/04 09:00, 11F

04/06 18:17, , 12F
如果html不是well-formed, 可以使用Tidy處理成xhtml
04/06 18:17, 12F
文章代碼(AID): #1DbqRZyz (C_Sharp)