[.NET] 如何解析HTML碼?

看板Visual_Basic作者 (我的生命因你而發光)時間15年前 (2011/01/01 23:35), 編輯推噓2(203)
留言5則, 3人參與, 最新討論串1/1
目前有擷取到網頁的原始碼,但要如何擷取我要的資訊呢? Dim web As New System.Net.WebClient() web.Headers.Add("Content-Type", "application/x-www-form-urlencoded") Dim d As Byte() = System.Text.Encoding.GetEncoding("Big5").GetBytes("syear=20100908") Dim res As Byte() = web.UploadData("http://www.tai.asp", "POST", d) MsgBox(System.Text.Encoding.GetEncoding("Big5").GetString(res)) res為擷取到的網頁原始碼 那我假設要網頁原始檔裡面<TD align=right class="12bk">8817</TD>的8817 不知道接下來還要怎樣處理呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.71.218.129

01/02 00:30, , 1F
字串處理嗎?
01/02 00:30, 1F

01/02 07:49, , 2F
是的~ res已經是網頁的原始碼了,但要擷取要的字串如何做?
01/02 07:49, 2F

01/02 08:20, , 3F
正規化可以寫成~抓取<TD> </TD>的方式嗎?這樣子改為其他
01/02 08:20, 3F

01/02 08:21, , 4F
如<span></span>的方式也可以適用,只是這要如何寫呢?
01/02 08:21, 4F

01/02 12:27, , 5F
先抓"<TD",然後在搜尋">"~這樣才是完整的判斷
01/02 12:27, 5F
文章代碼(AID): #1D7qcp42 (Visual_Basic)