[問題] 主成分分析中的成分矩陣

看板Statistics作者 (蝸牛)時間11年前 (2014/05/25 23:56), 編輯推噓0(0011)
留言11則, 3人參與, 最新討論串1/1
大家好 小弟在做主成分分析時遇到問題 問題一 小弟數據的KMO值過低 再刪除幾個變數過後提高 但有個問題 是否可以刪除變數呢? (數據為實驗數據,是很多個別實驗互不相關) 今天有人問說 可以亂刪變數嗎 但我個人想法是如果我不做這個實驗 就沒有這個變數 那就沒影響 想問各位 是否可以刪除無用變數 問題二 當我做主成分分析時 並未經過轉軸步驟 當做出的成分矩陣 將0.45以下的因素負荷量忽略 矩陣中的PC1 PC2 PC3....等 的因素負荷量並未完全區隔 EX: 成份矩陣a 元件 1 2 3 Z分數(peak10) .788 .502 Z分數(peak12) .744 .452 Z分數(peak15) .810 Z分數(peak21) .788 Z分數(peak22) -.788 Z分數(peak27) .764 Z分數(peak30) -.908 Z分數(peak8) -.569 .722 萃取方法:主成分分析。 a. 萃取了 3 個成份。 如上面 PC1與PC2的 peak10 都高於0.45 這是可以允許的嗎? 還是需要刪除 不過這樣一直刪除 我就沒變數了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.60.240.139 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1401033396.A.176.html

05/26 00:23, , 1F
變數在多個主成份有不小的負荷量從來不是問題。
05/26 00:23, 1F

05/26 08:57, , 2F
實驗資料要做降維的目的是?
05/26 08:57, 2F

05/26 22:12, , 3F
我有許多變數 利用這些變數將不同產地樣品 進行分類
05/26 22:12, 3F

05/26 22:13, , 4F
但我不知道哪些變數是有用 哪些沒用
05/26 22:13, 4F

05/26 22:14, , 5F
所以把全部變數跑主成分 刪除變數後提升KMO到標準
05/26 22:14, 5F

05/26 22:15, , 6F
最後進行判別分析 但全部都是自己摸索 所以很多疑問
05/26 22:15, 6F

05/27 00:05, , 7F
何不直接做判別分析?
05/27 00:05, 7F

05/27 00:07, , 8F
刪去「無用」的變數應該是建立在有沒有助於判別準確性上
05/27 00:07, 8F

05/27 10:06, , 9F
我刪除變數過 還有12個變數左右 我想說還是太多
05/27 10:06, 9F

05/27 10:06, , 10F
個人覺得 似乎做完主成分分析會較好判別 成功率較高
05/27 10:06, 10F

05/28 18:58, , 11F
看你判別分析的做法吧,主成份就是變數的線性組合啊。
05/28 18:58, 11F
文章代碼(AID): #1JWXAq5s (Statistics)