[問題] SAS跑cluster

看板Statistics作者YEEK (我最喜歡陳小麒)時間17年前 (2008/06/10 14:33)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串1/1

大家好目前邊做邊學邊找資料學著跑群集分析有些問題想請教板上先進。目前手上有彭昭英的SAS與統計分析以及陳順宇的多變量分析小妹目前是用18個題目縮減成五個因素後以FACTOR SCORE來做群集分析參考過論文和PAPER的群集分析過程多半先以階層式群集分析(PROC CLUSTER)並畫出樹型圖決定組數後再以互斥群集分析的K-MEANS法分組 (PROC FASTCLUS) 但目前自己試著做卻在決定組數時遇到一些問題 1.在PAPER上看到決定組數時有看到用agglomeration coefficient增加量來決定組數 (作者使用SPSS),但SAS在PROC CLUSTER後的報表並沒有看到沒有類似的值,只有看到 RMSSTD=1.2649,而書上寫這個值愈小群體內相似性愈高,但PROC CLUSTER只會有一個 RMSSTD值並沒有辦法看出分成幾組後RMSSTD等於多少.. 2.嘗試用樹型圖判斷大略看出可分成三組,但是分成三組之後和因素之間的解釋很無趣因為用SHEFFE事後檢定發現3個組在每個正向的因素幾乎都是1>2>3,負向的因素則是 3>2>1,只能看出最好和最差的組別,中間那一組就很難討論 3.另外有在PAPER上看過用PROC FASTCLUS在限制不同組數下的PSEUDO F及 R^2來決定組數,只是R^2是組數愈多愈大沒甚麼參考價值,PSEUDO F在我自己RUN的結果是組數遇大值愈小,所以也不知道怎麼判別組數的最適解 4.或者先分組完後,以區別分析或其他方式來看適切度? (這個還沒試) 請有用SAS跑過群集分析的朋友給些迷津了感恩! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.29.76.66

推

tew

06/10 16:19, , 1^F

06/10 16:19, 1^F

‣ 返回看板[ Statistics ] 統計

‣ 更多 YEEK 的文章

文章代碼(AID): #18JY1B4A (Statistics)