[程式] SAS集群分析

看板Statistics作者 (mamato)時間14年前 (2011/12/31 01:08), 編輯推噓1(104)
留言5則, 1人參與, 最新討論串1/1
SAS ------------------------------------------------------------------------ [軟體程式類別]:SAS [程式問題]: 集群分析應該如何選擇分群數? [軟體熟悉度]: 低(1~3個月) [問題敘述]: 最近要交一分多變量分析的報告 教授希望我們去my3q網站下載有足夠樣本數的問卷來做分析 (包含 主成分、因素、集群、邏輯斯、正典相關分析等) 目前做到集群分析有點瓶頸 原本是用原始資料(五點尺度)直接跑,但分析出來結果很怪 後來以先前 主成分分析 所跑出的皮爾森相關係數(只選用特徵值大於一的prin) 但是跑出來的東西又更少了,也不太確定這樣跑是否是對的 這是我跑出來的截圖: http://ppt.cc/FJX7 原始變數有19個,依照各種判定準則,似乎分成18群較佳,但這樣幾乎是一個變數一群 希望有高手可以指點一下> < [程式範例]: DATA HW4; INPUT PRIN1 PRIN2 PRIN3 @@; CARDS; 0.14907 0.08856 0.50297 0.4745 0.19426 0.32116 0.3186 0.31734 0.55238 0.37669 0.39224 0.37109 0.41431 0.41034 0.0811 0.40646 0.45373 -0.05265 0.53019 0.22521 -0.17818 0.59204 0.3253 -0.03615 0.61975 -0.43473 0.40127 0.66779 -0.48378 0.28313 0.64692 -0.56279-0.01893 0.55725 -0.30188-0.20519 0.46894 -0.33994-0.496 0.53979 0.37133 -0.23017 0.60192 0.31222 -0.04744 0.60256 0.29473 -0.12672 0.71092 0.3257 -0.27582 0.69011 0.29939 0.01559 0.74961 0.15305 -0.13777 ; PROC CLUSTER SIMPLE NOEIGEN METHOD=CENTROID RMSSTD RSQUARE NONORM OUT=TREE; VAR PRIN1 PRIN2 PRIN3; PROC TREE DATA=TREE OUT=CLUS3 NCLUSTERS=3; ID N; COPY PRIN1 PRIN2 PRIN3; PROC SORT; BY CLUSTER; PROC PRINT; BY CLUSTER; VAR PRIN1 PRIN2 PRIN3; ID N; RUN; ----------------------------------------------------------------------------- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.126.25.62

01/14 21:22, , 1F
將變數做分群??? 這各出發點有很大的問題.....
01/14 21:22, 1F

01/14 21:23, , 2F
分群的基本概念是物以類聚~~ 也就是要定義相似度
01/14 21:23, 2F

01/14 21:24, , 3F
想做變數分群 想想你該如何衡量兩變數的相似/相異度
01/14 21:24, 3F

01/14 21:28, , 4F
所以SAS的分群演算法能否支援這樣的分群目的
01/14 21:28, 4F

01/14 21:30, , 5F
可以試試看Factor analysis ^^
01/14 21:30, 5F
文章代碼(AID): #1E_U_n2x (Statistics)