[請益] 抓取php網頁的html原始碼遇到頁面轉換
透過
ini_set('user_agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;
SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)');
我可以用
$url =
"http://search.ruten.com.tw/search/s000.php?searchfrom=indexbar&k=wii&t=0";
$content = file_get_contents("$url");
取得露天網站搜尋wii商品的原始碼
但是它並非完全用GET的方式傳值 懷疑用PHP的POST傳值方式
並讓頁面轉換
<script type="text/javascript" language="JavaScript">
setTimeout("location.href=
'http://search.ruten.com.tw/search/s000.php?searchfrom=indexbar&k=wii&t=0'"
,200);
</script>
這樣的方式 就無法用file_get_contents("$url");的方式取得
商品網頁的原始碼
這樣是否代表無法以PHP函數取得原始碼?
因為我們無法知道POST傳值的內容
還是說有方法可以先讓$url網頁先跑 等待一段時間再file_get_contents("")
因為我查過
http://www.php.net/manual/en/function.file-get-contents.php
裡面有一個參數是offset 字串位置的偏移量
我想會不會也有時間偏移量這種東西?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.227.100.184
→
07/12 11:49, , 1F
07/12 11:49, 1F