[程式] SAS集群分析
SAS
------------------------------------------------------------------------
[軟體程式類別]:SAS
[程式問題]: 集群分析應該如何選擇分群數?
[軟體熟悉度]:
低(1~3個月)
[問題敘述]:
最近要交一分多變量分析的報告
教授希望我們去my3q網站下載有足夠樣本數的問卷來做分析
(包含 主成分、因素、集群、邏輯斯、正典相關分析等)
目前做到集群分析有點瓶頸
原本是用原始資料(五點尺度)直接跑,但分析出來結果很怪
後來以先前 主成分分析 所跑出的皮爾森相關係數(只選用特徵值大於一的prin)
但是跑出來的東西又更少了,也不太確定這樣跑是否是對的
這是我跑出來的截圖:
http://ppt.cc/FJX7
原始變數有19個,依照各種判定準則,似乎分成18群較佳,但這樣幾乎是一個變數一群
希望有高手可以指點一下> <
[程式範例]:
DATA HW4;
INPUT PRIN1 PRIN2 PRIN3 @@;
CARDS;
0.14907 0.08856 0.50297
0.4745 0.19426 0.32116
0.3186 0.31734 0.55238
0.37669 0.39224 0.37109
0.41431 0.41034 0.0811
0.40646 0.45373 -0.05265
0.53019 0.22521 -0.17818
0.59204 0.3253 -0.03615
0.61975 -0.43473 0.40127
0.66779 -0.48378 0.28313
0.64692 -0.56279-0.01893
0.55725 -0.30188-0.20519
0.46894 -0.33994-0.496
0.53979 0.37133 -0.23017
0.60192 0.31222 -0.04744
0.60256 0.29473 -0.12672
0.71092 0.3257 -0.27582
0.69011 0.29939 0.01559
0.74961 0.15305 -0.13777
;
PROC CLUSTER SIMPLE NOEIGEN METHOD=CENTROID RMSSTD RSQUARE NONORM OUT=TREE;
VAR PRIN1 PRIN2 PRIN3;
PROC TREE DATA=TREE OUT=CLUS3 NCLUSTERS=3;
ID N;
COPY PRIN1 PRIN2 PRIN3;
PROC SORT; BY CLUSTER;
PROC PRINT; BY CLUSTER;
VAR PRIN1 PRIN2 PRIN3;
ID N;
RUN;
-----------------------------------------------------------------------------
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.126.25.62
推
01/14 21:22, , 1F
01/14 21:22, 1F
→
01/14 21:23, , 2F
01/14 21:23, 2F
→
01/14 21:24, , 3F
01/14 21:24, 3F
→
01/14 21:28, , 4F
01/14 21:28, 4F
→
01/14 21:30, , 5F
01/14 21:30, 5F