[請益] 網頁字串抓取分析問題
請問各位先進 當我在使用substr的方法時
碰到中文字的時候 我的位子應該要扣掉多少呢
另還有為什麼我自己寫了一個程式,可是跑要抓某些yahoo頁數的時候
他不會顯示出單純的字串出來 而會輸出含有超連結的字串
而有些頁數 卻又可以正確的顯示
我的code
$http="http://tw.search.club.yahoo.com/search/club?s=family&p=
周&ei=utf8&b=75"; //您想抓取的網址
$buffer = file($http); //將網址讀入buffer變數
for($i=0;$i<sizeof($buffer);$i++) {
$a="</font>家長";
$a=iconv("big5","UTF-8",$a);
$n1=strpos(" ".$buffer[$i],$a);
if($n1>0)
{
$b="成員";
$b=iconv("big5","UTF-8",$b);
$n2=strpos($buffer[$i],$b);
$title=substr($buffer[$i],$n1+14,$n2-$n1-38);
echo $title."<br>\n";
}}
我預期的結果是顯示
xxxxx@yahoo.com.tw
xxxxxx@yahoo.com.tw
xxxxx@yahoo.com.tw
......
但是有的時候再抓取另幾業的時候 (EX: 網址列最後的b=45 )
會跑出包含家族的超連結
請問我的code是哪邊寫錯了
先在這邊感謝各位前輩了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.44.141.154
※ 編輯: a655088 來自: 114.44.141.154 (08/31 15:20)
※ 編輯: a655088 來自: 114.44.141.154 (08/31 15:26)
※ 編輯: a655088 來自: 114.44.141.154 (08/31 15:26)