[請益] crawler and API?
想問下各位前輩
目前要開發擷取網頁的技術
一個是有API 直接讓C#去讀取XML資料
一個是不提供 API 直接用crawler方式 去抓
但是crawler方式 似乎無法跟讀取 XML節點一樣
有效整理我所要的擷取內容
crawler似乎只能傳一堆網站資料進來
但我如何用crawler技術有效擷取我所要的資訊
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.129.46.206
※ 文章網址: http://www.ptt.cc/bbs/Soft_Job/M.1403776201.A.7C2.html
推
06/26 17:57, , 1F
06/26 17:57, 1F
→
06/26 17:57, , 2F
06/26 17:57, 2F
推
06/26 18:00, , 3F
06/26 18:00, 3F
→
06/26 18:00, , 4F
06/26 18:00, 4F
→
06/26 18:01, , 5F
06/26 18:01, 5F
推
06/26 19:36, , 6F
06/26 19:36, 6F
推
06/26 20:35, , 7F
06/26 20:35, 7F
→
06/27 02:28, , 8F
06/27 02:28, 8F
→
06/27 02:29, , 9F
06/27 02:29, 9F
推
06/27 03:57, , 10F
06/27 03:57, 10F
→
06/27 03:58, , 11F
06/27 03:58, 11F
推
06/27 09:28, , 12F
06/27 09:28, 12F
→
06/27 09:29, , 13F
06/27 09:29, 13F
推
06/27 12:10, , 14F
06/27 12:10, 14F
那到底該用Html Agility Pack 還是 正規表示法? 如果無解我能去科技板 或是對岸
專業論壇找答案... PTT C#很少人...
※ 編輯: njpp (36.231.153.10), 06/27/2014 12:38:23
→
06/27 16:03, , 15F
06/27 16:03, 15F
→
06/27 16:04, , 16F
06/27 16:04, 16F
→
06/27 16:05, , 17F
06/27 16:05, 17F
→
06/27 16:06, , 18F
06/27 16:06, 18F
→
06/27 16:09, , 19F
06/27 16:09, 19F
→
06/27 16:10, , 20F
06/27 16:10, 20F
→
06/27 16:11, , 21F
06/27 16:11, 21F
→
06/27 16:13, , 22F
06/27 16:13, 22F
→
06/27 16:15, , 23F
06/27 16:15, 23F
推
06/28 01:41, , 24F
06/28 01:41, 24F
→
06/28 01:42, , 25F
06/28 01:42, 25F
推
06/28 15:36, , 26F
06/28 15:36, 26F
→
06/28 15:37, , 27F
06/28 15:37, 27F
推
06/28 22:42, , 28F
06/28 22:42, 28F
推
06/28 23:47, , 29F
06/28 23:47, 29F