[程式] SPSS k-means 與 stata, sklearn 不同

看板Statistics作者 (Z)時間4年前 (2021/06/01 20:44), 編輯推噓0(003)
留言3則, 3人參與, 4年前最新討論串1/1
[軟體程式類別]: SPSS, Stata, Python_sklearn [程式問題]: SPSS k-means 與另外兩個不同 [軟體熟悉度]: 新手 [問題敘述]: 課程助教是用 SPSS 跑 k-means, 我是用 Stata 跟 sklearn 跑, Stata 跟 sklearn 的結果相同, SPSS 結果不同,想知道差異在哪, (是SPSS計算距離的方式不同??) 要如何讓三者結果相同。 [程式範例]: Colab: https://tinyurl.com/2drtnpux SPSS: QUICK CLUSTER x1 x2 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(50) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /SAVE CLUSTER /PRINT INITIAL. Stata: cluster kmeans X1 X2, k(3) measure(L2) name(Stata) start(krandom) iterate(50) Python: kmeans = KMeans(n_clusters=3, max_iter=50, random_state=0) kmeans.fit(df[['x1','x2']]) k_means = kmeans.predict(df[['x1','x2']]) df['sklearn'] = k_means # df['k_means'] -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.84.253.225 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1622551499.A.C67.html

06/02 00:04, 4年前 , 1F
先確定是不是隨機性造成。kmeans過程是有隨機性的。
06/02 00:04, 1F

06/02 09:17, 4年前 , 2F
還有確定一下助教是不是錯的
06/02 09:17, 2F

06/02 20:58, 4年前 , 3F
感謝兩位回復~ 我再研究研究
06/02 20:58, 3F
文章代碼(AID): #1WjYlBnd (Statistics)