Re: [問題] 關於讀取檔案裡的關鍵字搜尋擷取已回收

看板MATLAB作者 (Steven)時間14年前 (2010/05/09 20:39), 編輯推噓4(407)
留言11則, 1人參與, 最新討論串2/2 (看更多)
沒找過Matlab裡是否有寫好的function 所以想到在Matlab利用Java中 java.util.regex.Pattern及 java.util.regex.Matcher兩個類別 % 目標字串 str= java.lang.String('yahoo-tw-2613-yahoo') % 搜尋yahoo pattern = java.util.regex.Pattern.compile('yahoo') matcher = pattern.matcher(str) count = 0; while ( matcher.find() ) count = count + 1; end count即為yahoo出現的次數 ※ 引述《rock666 (rock666)》之銘言: : 要讀出一個檔案(.txt或.html)裡的關鍵字 : 比方說yahoo網頁的html檔裡 : 有幾個yahoo的單字 : 印出yahoo*n : 諸如此類 : 除了用寫迴圈的方法 : 還有其他比較簡易的方法嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.167.57.44

05/10 19:59, , 1F
感謝指點迷津^^請問pattern和matcher要運用到其他工具嗎?
05/10 19:59, 1F
Pattern及Matcher是JAVA的類別 可以在Matlab中借用Java的類別來處理事情 這部份不需額外進行設定動作

05/10 20:02, , 2F
yahoo-tw-2613-yahoo意思是指檔案裡的字串或另外讀取檔案
05/10 20:02, 2F
是 將欲處理的HTML或檔案讀入 並利用Pattern類別的matcher方法後續處理 ※ 編輯: Steven0422 來自: 218.167.59.16 (05/10 21:46) ※ 編輯: Steven0422 來自: 218.167.59.16 (05/10 22:00)

05/11 22:03, , 3F
真是謝謝大大 不過我輸出是
05/11 22:03, 3F

05/11 22:04, , 4F
java.util.regex.Matcher[pattern=yahoo region=0,19 last
05/11 22:04, 4F

05/11 22:04, , 5F
match=]
05/11 22:04, 5F
這串八成是Pattern.toString()方法跑出來的東西 看不懂 不管他XD

05/11 22:05, , 6F
只是輸出的最後一行 19應該是那字串的總數 但是其他的是
05/11 22:05, 6F

05/11 22:07, , 7F
什麼意思@@還是要讀入的檔案要寫上readurl或fopen的指令嗎
05/11 22:07, 7F
1.readurl或fopen讀進一串內容 2.將讀入欲剖析的內容放到Pattern類別的matcher方法 3.while迴圈部份計算字串部份有幾個yahoo 4.count變數內容即是yahoo出現的次數 ※ 編輯: Steven0422 來自: 218.167.59.233 (05/12 00:46)

05/12 00:48, , 8F
感謝大大不厭其煩解讀^^ 我大概知道意思了 不過你上面說的
05/12 00:48, 8F

05/12 00:49, , 9F
將欲處理的html或檔案讀入 請問要用什麼方法讀入
05/12 00:49, 9F

05/12 00:51, , 10F
我用讀網頁的方法urlread('網址')跟您給的程式兜不起來
05/12 00:51, 10F
抱歉 Pattern.matcher(String)是Java的東西 傳參數要給java.lang.String型別 Matlab中urlread回傳是char 還要下列處理 我以實例 html = urlread('http://edu.uuu.com.tw'); str = java.lang.String(html); %<==剛忘了這邊 pattern = java.util.regex.Pattern.compile('</title>'); matcher = pattern.matcher(str); count = 0; while ( matcher.find() ) count = count + 1 end ※ 編輯: Steven0422 來自: 218.167.59.233 (05/12 01:06)

05/12 01:14, , 11F
感謝大大 終於run出來了 感激不盡
05/12 01:14, 11F
文章代碼(AID): #1BvgqIcw (MATLAB)
文章代碼(AID): #1BvgqIcw (MATLAB)