[問題] 爬蟲出網站中所有的內文
大家好
小弟目前爬蟲初學者
在目前的專案中需要用到爬蟲
但是是不知道會去爬哪個網站
應該說目標是丟入任意網址都要可以丟出該網站的內文
有點像是google搜尋引擎中
搜尋完的網站下方會出現預覽內文一樣
不知道有沒有辦法可以做到
或是github上面有神人已經寫出相關的API可以使用
因為不知道用什麼關鍵字搜尋比較好
所以找到的大部分都是只能爬出特定網站
或是只能爬出網址中的網址
跟我所想要的不太一樣
拜託各位神人大大了
謝謝!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 119.77.130.74
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1504276959.A.C92.html
噓
09/01 23:18, , 1F
09/01 23:18, 1F
→
09/02 00:11, , 2F
09/02 00:11, 2F
噓
09/02 03:20, , 3F
09/02 03:20, 3F
→
09/02 14:11, , 4F
09/02 14:11, 4F
→
09/02 14:11, , 5F
09/02 14:11, 5F
→
09/02 14:11, , 6F
09/02 14:11, 6F
→
09/02 14:11, , 7F
09/02 14:11, 7F
→
09/02 14:11, , 8F
09/02 14:11, 8F
→
09/02 14:11, , 9F
09/02 14:11, 9F
→
09/02 14:11, , 10F
09/02 14:11, 10F
→
09/02 14:11, , 11F
09/02 14:11, 11F
→
09/02 14:11, , 12F
09/02 14:11, 12F
→
09/02 15:47, , 13F
09/02 15:47, 13F
噓
09/03 11:28, , 14F
09/03 11:28, 14F
→
09/03 11:29, , 15F
09/03 11:29, 15F
→
09/03 14:33, , 16F
09/03 14:33, 16F
噓
09/04 23:38, , 17F
09/04 23:38, 17F
→
09/04 23:38, , 18F
09/04 23:38, 18F