[請益] 如果我想要手動抓下一個網站要如何開始?

看板PHP作者 (龍龍龍)時間6年前 (2017/07/13 10:08), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串1/1
請問一下 我想要把一個網站裡面的所有資訊拿下來到資料庫裡面 我要怎麼開始呢? google 過有很多 github 的 source code 但由於是初學者,想要自己造輪子 我的構思大概是這樣 1 用 curl 去拿到 sourcecode 2 用 php 去分析內容 (regular expression or xpath or .... ?) 3 存入db 目前卡在2 的選型上面, 想請教版上的大大們 哪種方式比較好呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.75.186.160 ※ 文章網址: https://www.ptt.cc/bbs/PHP/M.1499911694.A.89A.html

07/13 10:30, , 1F
以2而言,弄一個HTML parser應該比較方便
07/13 10:30, 1F

07/13 11:04, , 2F
2 有 simplehtmldom、phpquery 可以用,re稍累
07/13 11:04, 2F

07/13 11:06, , 3F
簡單的用getBetween就好了,php manual滿多人分享
07/13 11:06, 3F
文章代碼(AID): #1PPjOEYQ (PHP)