[問題] 抓基金資料的問題

看板java作者 (慢慢的看清楚了...)時間16年前 (2009/08/18 23:52), 編輯推噓1(101)
留言2則, 2人參與, 最新討論串1/1
各位大大好! 小弟是新手! 想利用101招的substring()來抓Data 由於只需要所需字串的前後特徵字串位置數indexOf()即可抓取目標字串! 因此在抓取 台灣加權指數 時很順利! <tr><th><a href="" rel="nofollow">http://tw.rd.yahoo.com/referurl/stock/index/index_chart/tw/tse_quote/*http://tw.stock.yahoo.com/s/tse.php"> 上市</a></th><td class="dx">6789.77</td><td class="im"><span class="downi"><i> ^^^^^^^ 跌</i></span></td><td class="chg down">142.03</td><td class="vol"><span>1069.70億</span></td></tr> </tbody> 但當小弟想抓基金資料時 http://www.moneydj.com/Y/YA/YP081000.DJHTM 出現了兩個問題 Q1 目標字串 的前後特徵字串 有重覆現象 <td class="t3t1_rev"><a href=/y/ya/yp010000_ACSS03.asp.htm>新光福運平衡 </a></td> <td class="t3t1_rev"><a href=/y/ya/yp020000_BFZTSA.asp.htm>新光投信</a></td> <td class="t3n0_rev">08/18</td> <td class="t3n0_rev">台幣</td> <td class="t3n1_rev">12.01</td> <td class="t3r1_rev">-0.20</td> <td class="t3r1_rev">-1.64</td> <td class="t3n1_rev">16.50</td> <td class="t3n1_rev">9.64</td> ex: t3n1_rev 過度重覆 無法運用 Q2 跟之前抓指數相比,出現了資料"換行"的問題 字串的位置都是在同一行去計算的, 不能單純靠加上"字串長度"來達成進位"換行"的效果 以上兩個小問題 說不定有比 substring();更好的解法! 如果大大們認為問題太簡單 可否指點給方向也好! 十分感謝 <(_ _)> -- 自古多情空餘恨 從來殘忍少添傷~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.124.103.220

08/19 09:08, , 1F
html parser
08/19 09:08, 1F

08/19 22:18, , 2F
感謝!
08/19 22:18, 2F
文章代碼(AID): #1AYiuoc6 (java)