[問題] 抓基金資料的問題
各位大大好!
小弟是新手! 想利用101招的substring()來抓Data
由於只需要所需字串的前後特徵字串位置數indexOf()即可抓取目標字串!
因此在抓取 台灣加權指數 時很順利!
<tr><th><a
href="" rel="nofollow">http://tw.rd.yahoo.com/referurl/stock/index/index_chart/tw/tse_quote/*http://tw.stock.yahoo.com/s/tse.php">
上市</a></th><td class="dx">6789.77</td><td class="im"><span class="downi"><i>
^^^^^^^
跌</i></span></td><td class="chg down">142.03</td><td
class="vol"><span>1069.70億</span></td></tr> </tbody>
但當小弟想抓基金資料時
http://www.moneydj.com/Y/YA/YP081000.DJHTM
出現了兩個問題
Q1 目標字串 的前後特徵字串 有重覆現象
<td class="t3t1_rev"><a href=/y/ya/yp010000_ACSS03.asp.htm>新光福運平衡
</a></td>
<td class="t3t1_rev"><a href=/y/ya/yp020000_BFZTSA.asp.htm>新光投信</a></td>
<td class="t3n0_rev">08/18</td>
<td class="t3n0_rev">台幣</td>
<td class="t3n1_rev">12.01</td>
<td class="t3r1_rev">-0.20</td>
<td class="t3r1_rev">-1.64</td>
<td class="t3n1_rev">16.50</td>
<td class="t3n1_rev">9.64</td>
ex: t3n1_rev 過度重覆 無法運用
Q2 跟之前抓指數相比,出現了資料"換行"的問題
字串的位置都是在同一行去計算的,
不能單純靠加上"字串長度"來達成進位"換行"的效果
以上兩個小問題
說不定有比 substring();更好的解法!
如果大大們認為問題太簡單 可否指點給方向也好!
十分感謝 <(_ _)>
--
自古多情空餘恨
從來殘忍少添傷~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.124.103.220
推
08/19 09:08, , 1F
08/19 09:08, 1F
→
08/19 22:18, , 2F
08/19 22:18, 2F