[請益] 如果我想要手動抓下一個網站要如何開始?
請問一下
我想要把一個網站裡面的所有資訊拿下來到資料庫裡面
我要怎麼開始呢?
google 過有很多 github 的 source code
但由於是初學者,想要自己造輪子
我的構思大概是這樣
1 用 curl 去拿到 sourcecode
2 用 php 去分析內容 (regular expression or xpath or .... ?)
3 存入db
目前卡在2 的選型上面,
想請教版上的大大們
哪種方式比較好呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.75.186.160
※ 文章網址: https://www.ptt.cc/bbs/PHP/M.1499911694.A.89A.html
→
07/13 10:30, , 1F
07/13 10:30, 1F
推
07/13 11:04, , 2F
07/13 11:04, 2F
推
07/13 11:06, , 3F
07/13 11:06, 3F