[程式] SPSS k-means 與 stata, sklearn 不同
[軟體程式類別]: SPSS, Stata, Python_sklearn
[程式問題]: SPSS k-means 與另外兩個不同
[軟體熟悉度]: 新手
[問題敘述]:
課程助教是用 SPSS 跑 k-means,
我是用 Stata 跟 sklearn 跑,
Stata 跟 sklearn 的結果相同,
SPSS 結果不同,想知道差異在哪,
(是SPSS計算距離的方式不同??)
要如何讓三者結果相同。
[程式範例]:
Colab: https://tinyurl.com/2drtnpux
SPSS:
QUICK CLUSTER x1 x2
/MISSING=LISTWISE
/CRITERIA=CLUSTER(3) MXITER(50) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER
/PRINT INITIAL.
Stata:
cluster kmeans X1 X2, k(3) measure(L2) name(Stata) start(krandom) iterate(50)
Python:
kmeans = KMeans(n_clusters=3, max_iter=50, random_state=0)
kmeans.fit(df[['x1','x2']])
k_means = kmeans.predict(df[['x1','x2']])
df['sklearn'] = k_means # df['k_means']
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.84.253.225 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1622551499.A.C67.html
→
06/02 00:04,
4年前
, 1F
06/02 00:04, 1F
→
06/02 09:17,
4年前
, 2F
06/02 09:17, 2F
→
06/02 20:58,
4年前
, 3F
06/02 20:58, 3F