[問題] data mining的相關問題
最近在寫fp-growth的演算法
只寫到要建立Header table的地方
目前在判別transaction item的地方有點小疑問
因為我只放10筆 data在資料庫裡面
有'abcde'5個item 每筆transaction就隨機丟幾個items 例如 'abc' 'be'等等
abcde的data type是string
我目前的寫法 在判別每筆transaction的時候
是用
while(rs.next()){
String s = rs.getString(1);
if(s.contents("a")){
a_count++;
if(s.contents("b")){
b_count++;
.......
}
}
else if(s.contents("b")){
b_count++;
}
........
.....
}
a_count 是指 全部transactions中a的總數 bcde亦同 初始值為0
由此可算出每個items 'a''b''c''d''e' 各被交易的次數
這個方法太土法煉鋼了= =
自己是想過用遞迴的方式下去跑 不過還沒寫出來
況且在item數增加的情況下 不可能再這麼寫了
想請教版大們有沒有可以運用的method可以處理類似的問題??
感謝大家!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.123.216.43
→
09/02 17:36, , 1F
09/02 17:36, 1F
推
09/02 21:02, , 2F
09/02 21:02, 2F
→
09/02 21:40, , 3F
09/02 21:40, 3F
→
09/02 21:42, , 4F
09/02 21:42, 4F
→
09/04 14:26, , 5F
09/04 14:26, 5F
→
09/04 14:29, , 6F
09/04 14:29, 6F
→
09/04 20:47, , 7F
09/04 20:47, 7F
→
09/04 21:05, , 8F
09/04 21:05, 8F
推
09/05 00:04, , 9F
09/05 00:04, 9F