[問題] 使用爬蟲抓圖的問題
不確定這樣的問題要怎麼分類
我想寫個小程式可以固定去抓某個網頁的某張圖
那個圖的位置是固定的
只是內容會隨著每次refresh改變
那邊的html程式大改長得像這樣
<img src="XXimg.php?str=code">
那個code看起來是一組hash code,就是今天的日期加上一些亂數
看起來是每次載入網頁的時候
會去跟server的一段php code要一張圖,回傳過來
這樣子的圖要怎麼抓呢?
因為網路上教的方法都是去抓「固定的一張圖」
像這種來源的圖檔要怎麼抓呢?
謝謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.37.30
※ 文章網址: http://www.ptt.cc/bbs/Web_Design/M.1406373342.A.9AF.html
→
07/26 21:05, , 1F
07/26 21:05, 1F
推
07/26 22:55, , 2F
07/26 22:55, 2F
抱歉沒說清楚,大家好像誤會我的意思
我知道regular expression可以幫上忙
不過問題是當我想要抓
<img src="" rel="nofollow">http://test.com/test.jpg">
這樣的東西就OK
可是當圖片是以上述方式呈現的時候
我就沒有辦法抓到圖片
(不是程式辨認不出來那是圖片的tag
是因為要透過php先得到圖片,所以導致程式下載下來是亂碼)
請問要怎麼辦呢?
※ 編輯: friendever (123.193.37.30), 07/26/2014 23:39:52
→
07/27 00:07, , 3F
07/27 00:07, 3F
推
07/27 02:22, , 4F
07/27 02:22, 4F
→
07/27 02:25, , 5F
07/27 02:25, 5F
→
07/27 02:25, , 6F
07/27 02:25, 6F
→
07/27 03:08, , 7F
07/27 03:08, 7F
→
07/27 03:11, , 8F
07/27 03:11, 8F
→
07/27 03:12, , 9F
07/27 03:12, 9F
推
08/03 22:23, , 10F
08/03 22:23, 10F