[問題] SAS跑cluster

看板Statistics作者 (我最喜歡陳小麒)時間17年前 (2008/06/10 14:33), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串1/1
大家好 目前邊做邊學邊找資料學著跑群集分析 有些問題想請教板上先進。 目前手上有彭昭英的SAS與統計分析 以及陳順宇的多變量分析 小妹目前是用18個題目縮減成五個因素後 以FACTOR SCORE來做群集分析 參考過論文和PAPER的群集分析過程 多半先以階層式群集分析(PROC CLUSTER)並畫出樹型圖決定組數後 再以互斥群集分析的K-MEANS法分組 (PROC FASTCLUS) 但目前自己試著做 卻在決定組數時遇到一些問題 1.在PAPER上看到決定組數時有看到用agglomeration coefficient增加量來決定組數 (作者使用SPSS),但SAS在PROC CLUSTER後的報表並沒有看到沒有類似的值,只有看到 RMSSTD=1.2649,而書上寫這個值愈小群體內相似性愈高,但PROC CLUSTER只會有一個 RMSSTD值並沒有辦法看出分成幾組後RMSSTD等於多少.. 2.嘗試用樹型圖判斷大略看出可分成三組,但是分成三組之後和因素之間的解釋很無趣 因為用SHEFFE事後檢定發現3個組在每個正向的因素幾乎都是1>2>3,負向的因素則是 3>2>1,只能看出最好和最差的組別,中間那一組就很難討論 3.另外有在PAPER上看過用PROC FASTCLUS在限制不同組數下的PSEUDO F及 R^2來決定 組數,只是R^2是組數愈多愈大沒甚麼參考價值,PSEUDO F在我自己RUN的結果是組數 遇大值愈小,所以也不知道怎麼判別組數的最適解 4.或者先分組完後,以區別分析或其他方式來看適切度? (這個還沒試) 請有用SAS跑過群集分析的朋友給些迷津了 感恩! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.29.76.66

06/10 16:19, , 1F
建議你看周文賢老師的書,他有SAS的範例
06/10 16:19, 1F
文章代碼(AID): #18JY1B4A (Statistics)