[其他] 不同長度資料 clustering
目前手上有一些標記過後的資料,每一個 column x_n 代表它的特徵值。
+--------------+ ----------> [x1 x2 x3 ...... x_m]
參考圖:http://i.imgur.com/w3JRM0f.png

我想透過 k-mean clustering 方式找出這些資料的代表中心點,但目前的問題點出
在資料長度不固定(如下所示)
L1 +--------------+ m = 20
L1 +---------+ m = 10
L1 +------------+ m = 15
L2 +----------+ m = 12
L2 +---+ m = 5
L2 +------------+ m = 18
想請問一下大家,針對這種情況,有沒有什麼比較好的解決方法可參考呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 77.247.181.163
→
02/26 21:36, , 1F
02/26 21:36, 1F
→
02/26 21:37, , 2F
02/26 21:37, 2F