[問題] 抓網頁的幾個小問題

看板C_Sharp作者 (~KYO~)時間9年前 (2014/11/25 21:47), 9年前編輯推噓4(404)
留言8則, 3人參與, 最新討論串1/1
WebClient wc = new WebClient(); wc.Encoding = Encoding.UTF8; string result = wc.DownloadString(htmlStr); textBox1.Text = result; 很簡單的幾句而已 想把網頁的資料抓下來 成功把HTML抓下來了 想解析的時候發現抓下來的HTML有些DIV 裡的TR 跟 TD 都不見了 只看的到 <div id="m"><div id="table01"> (消失的TR跟TD) </div> <br></div> 可是要的值都在消失的TD裡面 想了整天不知道怎麼解.... 想求大大們提點一下小弟 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.11.132 ※ 文章網址: http://www.ptt.cc/bbs/C_Sharp/M.1416923228.A.655.html ※ 編輯: kyo0010 (39.15.11.132), 11/25/2014 21:47:47

11/26 08:32, , 1F
你要說的是table吧?div底下怎麼會直接放tr和td?
11/26 08:32, 1F

11/26 08:32, , 2F
另外回回歸問題,我猜那是因為那些資料是js產生的
11/26 08:32, 2F

11/26 08:33, , 3F
你抓的資料大概是網頁剛產生的狀態,所以沒有動態內容
11/26 08:33, 3F

11/26 08:37, , 4F
我是不太清楚純靠c#自己刻要怎麼做...
11/26 08:37, 4F

11/26 08:38, , 5F
我的話只會想到靠其他東西來完成,如phantomjs之類的
11/26 08:38, 5F

11/26 10:09, , 6F
你可能要在找一下,我猜你要的內容是Ajax做出來的
11/26 10:09, 6F

11/26 10:10, , 7F
找他call的回傳資料的網址
11/26 10:10, 7F

11/28 15:50, , 8F
開瀏覽器監視一下HTTP活動,應該蠻容易找到問題點的
11/28 15:50, 8F
文章代碼(AID): #1KT8XSPL (C_Sharp)