研究方法-資料探勘問題

看板Master_D作者 (kukky)時間10年前 (2016/02/01 16:08), 10年前編輯推噓0(007)
留言7則, 2人參與, 最新討論串1/1
假設我有1000筆資料,品項為10種 我是以人工方式根據品項的次數高低去分組, 分為A、B、C、D四個資料組, suppport為0.1, 把四組分別下去跑關聯規則, 類似多重支持度的概念。 而目前問題是想利用自動化方式去跑關聯規則, 重點是不需要以人去根據次數高低去分組, 不知道有何方法?可以自動化跑多重支持度的方式或者是以次數頻率分析的方法之類的? 麻煩大大謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.47.219 ※ 文章網址: https://www.ptt.cc/bbs/Master_D/M.1454314093.A.9F8.html

02/02 01:03, , 1F
看不太懂你想做啥 是要把1000筆資料自動分成四組?
02/02 01:03, 1F

02/02 01:06, , 2F
然後這四組分別要有高度相關性是嗎?
02/02 01:06, 2F
對就是希望能夠自動分組,每組具有高相關性的意思,只是不知道有什麼方法之類的

02/03 23:29, , 3F
單純分組的話可以參考一下cluster analysis
02/03 23:29, 3F

02/03 23:31, , 4F
不過不清楚你說的每組具有相關是指組內還是組間
02/03 23:31, 4F
指的是組內,不知道還有沒其他方法之類的?

02/05 01:07, , 5F
clustering有很多種方法啊 你try過哪些了呢?
02/05 01:07, 5F
那你可以舉一下用什麼工具或方法直接將資料拆開來嗎? ※ 編輯: jimkukky (36.229.24.205), 02/05/2016 22:22:03

02/06 02:19, , 6F
google clustering algorithm, wiki裡就一大堆
02/06 02:19, 6F

02/06 02:23, , 7F
python也有ML的package可以用 應該幾行code就可實作了
02/06 02:23, 7F
ok謝謝! ※ 編輯: jimkukky (114.45.112.134), 02/06/2016 18:32:21
文章代碼(AID): #1Mhn9jdu (Master_D)