[問題] SAS跑cluster
大家好
目前邊做邊學邊找資料學著跑群集分析 有些問題想請教板上先進。
目前手上有彭昭英的SAS與統計分析 以及陳順宇的多變量分析
小妹目前是用18個題目縮減成五個因素後
以FACTOR SCORE來做群集分析
參考過論文和PAPER的群集分析過程
多半先以階層式群集分析(PROC CLUSTER)並畫出樹型圖決定組數後
再以互斥群集分析的K-MEANS法分組 (PROC FASTCLUS)
但目前自己試著做 卻在決定組數時遇到一些問題
1.在PAPER上看到決定組數時有看到用agglomeration coefficient增加量來決定組數
(作者使用SPSS),但SAS在PROC CLUSTER後的報表並沒有看到沒有類似的值,只有看到
RMSSTD=1.2649,而書上寫這個值愈小群體內相似性愈高,但PROC CLUSTER只會有一個
RMSSTD值並沒有辦法看出分成幾組後RMSSTD等於多少..
2.嘗試用樹型圖判斷大略看出可分成三組,但是分成三組之後和因素之間的解釋很無趣
因為用SHEFFE事後檢定發現3個組在每個正向的因素幾乎都是1>2>3,負向的因素則是
3>2>1,只能看出最好和最差的組別,中間那一組就很難討論
3.另外有在PAPER上看過用PROC FASTCLUS在限制不同組數下的PSEUDO F及 R^2來決定
組數,只是R^2是組數愈多愈大沒甚麼參考價值,PSEUDO F在我自己RUN的結果是組數
遇大值愈小,所以也不知道怎麼判別組數的最適解
4.或者先分組完後,以區別分析或其他方式來看適切度? (這個還沒試)
請有用SAS跑過群集分析的朋友給些迷津了 感恩!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.29.76.66
推
06/10 16:19, , 1F
06/10 16:19, 1F