[其他] 不同長度資料 clustering

看板Math作者 (バカ)時間12年前 (2014/02/26 14:10), 編輯推噓0(002)
留言2則, 1人參與, 最新討論串1/1
目前手上有一些標記過後的資料,每一個 column x_n 代表它的特徵值。 +--------------+ ----------> [x1 x2 x3 ...... x_m] 參考圖:http://i.imgur.com/w3JRM0f.png
我想透過 k-mean clustering 方式找出這些資料的代表中心點,但目前的問題點出 在資料長度不固定(如下所示) L1 +--------------+ m = 20 L1 +---------+ m = 10 L1 +------------+ m = 15 L2 +----------+ m = 12 L2 +---+ m = 5 L2 +------------+ m = 18 想請問一下大家,針對這種情況,有沒有什麼比較好的解決方法可參考呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 77.247.181.163

02/26 21:36, , 1F
先問一下你自己,有沒有辦法用人工方式做分類
02/26 21:36, 1F

02/26 21:37, , 2F
若連你自己都沒有答案,數據or演算法架構請砍掉重練
02/26 21:37, 2F
文章代碼(AID): #1J3OL3W2 (Math)