Re: [問題] 抓取PTT網頁,請問此程式碼的錯誤在哪?

看板R_Language作者 (小笨)時間7年前 (2016/10/21 16:44), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
Hi,很遺憾的是你後面那部分我有點看不太懂,但可以提供另外一種方法 來做到你想要做的事情 http://pastebin.com/yEvK1FuG 只有一個小問題,就是他的本文含在一個大TAG裡面但是有其他小TAG 我找不到一個很好的方式只抓本文,因此裡面會有一些title跟日期的廢話 用xml_contents可以只抓到本文,但是它的位置很不固定,只要有例如版主 塞了一些話進去的話,他的位置就會往後,這個只能看看有沒有了解結構的人 看看有甚麼好方法解決了 下面是用到的package library(xml2) libray(httr) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.85.24 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1477039486.A.EB3.html
文章代碼(AID): #1O2TL-wp (R_Language)
文章代碼(AID): #1O2TL-wp (R_Language)