[請益] 請問想爬蟲應該用 python 還是 php 好?
不好意思,我是 php/java 工程師,5年經驗,
我最近想學爬蟲去爬一些電商網站,抓蝦皮或露天之類的
網站,主要是想抓某熱銷產品/某賣場全商品,可能會破千筆。
然後有點問題想請教一下:
1)看到很多關於爬蟲的書都是用 python,想問用 php 寫爬蟲
的話是會很不好寫嗎?我應該去學 python 再來爬嗎?
2)我想抓的都公開資訊,應該不會有觸法的問題吧?
看到之前文章說不把對方網站搞掛就不會有事,
但電商網站可能一次有十幾萬人在上面買東西或爬蟲,
要是真的掛的話,對方怎麼判定是不是我搞掛的?
謝謝,希望有爬蟲的前輩給一些建議 ^^"
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.5.66
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1536823701.A.CA2.html
推
09/13 15:34,
5年前
, 1F
09/13 15:34, 1F
推
09/13 15:36,
5年前
, 2F
09/13 15:36, 2F
推
09/13 15:55,
5年前
, 3F
09/13 15:55, 3F
→
09/13 15:55,
5年前
, 4F
09/13 15:55, 4F
php我平常覺得很好debug說, 你是指爬蟲的部份嗎?
推
09/13 16:02,
5年前
, 5F
09/13 16:02, 5F
感謝,那請問第二點的疑問有人知道嗎?
※ 編輯: s9503669 (114.34.5.66), 09/13/2018 16:07:07
推
09/13 16:06,
5年前
, 6F
09/13 16:06, 6F
→
09/13 16:07,
5年前
, 7F
09/13 16:07, 7F
→
09/13 16:13,
5年前
, 8F
09/13 16:13, 8F
推
09/13 16:34,
5年前
, 9F
09/13 16:34, 9F
推
09/13 16:43,
5年前
, 10F
09/13 16:43, 10F
robot.txt? 我如果是抓公開的產品資料還要確認這個嗎?
→
09/13 16:44,
5年前
, 11F
09/13 16:44, 11F
→
09/13 16:44,
5年前
, 12F
09/13 16:44, 12F
所以爬幾千筆賣場資料不會被告吧? XD
推
09/13 17:00,
5年前
, 13F
09/13 17:00, 13F
推
09/13 17:03,
5年前
, 14F
09/13 17:03, 14F
→
09/13 17:03,
5年前
, 15F
09/13 17:03, 15F
→
09/13 17:06,
5年前
, 16F
09/13 17:06, 16F
推
09/13 17:06,
5年前
, 17F
09/13 17:06, 17F
推
09/13 17:08,
5年前
, 18F
09/13 17:08, 18F
→
09/13 17:08,
5年前
, 19F
09/13 17:08, 19F
? 來研究一下XD
※ 編輯: s9503669 (114.34.5.66), 09/13/2018 17:17:39
※ 編輯: s9503669 (114.34.5.66), 09/13/2018 17:28:31
推
09/13 17:36,
5年前
, 20F
09/13 17:36, 20F
推
09/13 17:37,
5年前
, 21F
09/13 17:37, 21F
→
09/13 17:37,
5年前
, 22F
09/13 17:37, 22F
推
09/13 18:47,
5年前
, 23F
09/13 18:47, 23F
→
09/13 18:49,
5年前
, 24F
09/13 18:49, 24F
推
09/13 19:01,
5年前
, 25F
09/13 19:01, 25F
推
09/13 19:05,
5年前
, 26F
09/13 19:05, 26F
推
09/13 19:36,
5年前
, 27F
09/13 19:36, 27F
阿java有爬蟲工具喔?! 沒用在爬蟲所以不知道XD 感謝感謝
※ 編輯: s9503669 (1.200.192.147), 09/13/2018 22:26:45
推
09/13 22:29,
5年前
, 28F
09/13 22:29, 28F
→
09/13 22:37,
5年前
, 29F
09/13 22:37, 29F
→
09/14 01:16,
5年前
, 30F
09/14 01:16, 30F
推
09/14 01:43,
5年前
, 31F
09/14 01:43, 31F
→
09/14 10:20,
5年前
, 32F
09/14 10:20, 32F
推
09/14 12:37,
5年前
, 33F
09/14 12:37, 33F
推
09/14 13:52,
5年前
, 34F
09/14 13:52, 34F
→
09/14 13:53,
5年前
, 35F
09/14 13:53, 35F
→
09/14 13:55,
5年前
, 36F
09/14 13:55, 36F
→
09/14 13:57,
5年前
, 37F
09/14 13:57, 37F
推
09/14 17:00,
5年前
, 38F
09/14 17:00, 38F
→
09/14 18:38,
5年前
, 39F
09/14 18:38, 39F
推
09/15 00:09,
5年前
, 40F
09/15 00:09, 40F
推
09/16 13:04,
5年前
, 41F
09/16 13:04, 41F
→
09/21 09:09,
5年前
, 42F
09/21 09:09, 42F
推
07/18 22:36,
6年前
, 43F
07/18 22:36, 43F