Re: [問題] 關於讀取檔案裡的關鍵字搜尋擷取已回收
沒找過Matlab裡是否有寫好的function
所以想到在Matlab利用Java中
java.util.regex.Pattern及
java.util.regex.Matcher兩個類別
% 目標字串
str= java.lang.String('yahoo-tw-2613-yahoo')
% 搜尋yahoo
pattern = java.util.regex.Pattern.compile('yahoo')
matcher = pattern.matcher(str)
count = 0;
while ( matcher.find() )
count = count + 1;
end
count即為yahoo出現的次數
※ 引述《rock666 (rock666)》之銘言:
: 要讀出一個檔案(.txt或.html)裡的關鍵字
: 比方說yahoo網頁的html檔裡
: 有幾個yahoo的單字
: 印出yahoo*n
: 諸如此類
: 除了用寫迴圈的方法
: 還有其他比較簡易的方法嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.167.57.44
推
05/10 19:59, , 1F
05/10 19:59, 1F
Pattern及Matcher是JAVA的類別
可以在Matlab中借用Java的類別來處理事情
這部份不需額外進行設定動作
→
05/10 20:02, , 2F
05/10 20:02, 2F
是 將欲處理的HTML或檔案讀入
並利用Pattern類別的matcher方法後續處理
※ 編輯: Steven0422 來自: 218.167.59.16 (05/10 21:46)
※ 編輯: Steven0422 來自: 218.167.59.16 (05/10 22:00)
推
05/11 22:03, , 3F
05/11 22:03, 3F
→
05/11 22:04, , 4F
05/11 22:04, 4F
→
05/11 22:04, , 5F
05/11 22:04, 5F
這串八成是Pattern.toString()方法跑出來的東西
看不懂 不管他XD
→
05/11 22:05, , 6F
05/11 22:05, 6F
→
05/11 22:07, , 7F
05/11 22:07, 7F
1.readurl或fopen讀進一串內容
2.將讀入欲剖析的內容放到Pattern類別的matcher方法
3.while迴圈部份計算字串部份有幾個yahoo
4.count變數內容即是yahoo出現的次數
※ 編輯: Steven0422 來自: 218.167.59.233 (05/12 00:46)
推
05/12 00:48, , 8F
05/12 00:48, 8F
→
05/12 00:49, , 9F
05/12 00:49, 9F
→
05/12 00:51, , 10F
05/12 00:51, 10F
抱歉
Pattern.matcher(String)是Java的東西
傳參數要給java.lang.String型別
Matlab中urlread回傳是char
還要下列處理
我以實例
html = urlread('http://edu.uuu.com.tw');
str = java.lang.String(html); %<==剛忘了這邊
pattern = java.util.regex.Pattern.compile('</title>');
matcher = pattern.matcher(str);
count = 0;
while ( matcher.find() )
count = count + 1
end
※ 編輯: Steven0422 來自: 218.167.59.233 (05/12 01:06)
推
05/12 01:14, , 11F
05/12 01:14, 11F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):