[問題] 如何抓取新聞?

看板Programming作者 (菸酒生)時間17年前 (2008/10/01 20:04), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串1/1
請問各位一下 如果今天我要抓新聞 是要連到哪個地方抓呢@@? 以下這是google news的網址: http://news.google.com.tw/nwshp?ned=tw 是直接連到這個url抓 還是他有提供特定的SERVER或是服務? 我的目的是要每天某個時段固定從google news抓取當天全部的新聞內容 ~~~~ 然後對這些新聞做處理 所以要先知道連到哪個服務或是主機 懇請解答 先說聲感謝~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.57.7

10/01 22:29, , 1F
parse整個新聞網頁太煩 走RSS卡實在
10/01 22:29, 1F

10/02 15:07, , 2F
網址後面加&output=rss就會抓到rss feed
10/02 15:07, 2F

10/02 15:08, , 3F
再用個xml parser或regexp就可以找到網址
10/02 15:08, 3F
文章代碼(AID): #18usTDzL (Programming)