[分析] PCA主成份分析 協方差和相關差別
PCA 用 correlation or covariance比較
基本上我有爬文,也知道他是如何運算的
可以知道當尺度相同的時候用covariance所丟失的訊息量會最少
我的尺度相同故我先用covariance 計算得到的結果可以發現的確3個軸加起來約90%
這時候發現這些資料依照’’地區’’來區分可以明顯的分群
但如果依照種類卻結果並不是很好
接著我也做了correlation 發現資料丟失量的確滿多的 前三個加起來能解釋約66%
也很神奇地發現 使用correlation的方式可以依照’’種類’’來區隔開
想問一下各位 這樣可以兩種資料都用來討論嗎??
因為covariance可以漂亮的分出’’地區’’無法分出’’種類’’
但是相反correlation可以漂亮的分出’’種類’’,卻無法分出’’地區’’
https://i.imgur.com/5yQTP4W.jpg
左上-correlation-地區
右上-covariance-地區(good)
左下-correlation-種類(good)
右下-covariance-種類
還有如果兩個都可以解釋的話,會造成這麼剛好也是有可能的嗎??
會造成這樣的原因是因為??
有點想不透 要怎麼跟人解釋資料量變少反而有一個可以變很漂亮…
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.1.213
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1520255604.A.54B.html
→
03/05 21:17,
6年前
, 1F
03/05 21:17, 1F
→
03/05 21:17,
6年前
, 2F
03/05 21:17, 2F
→
03/05 22:19,
6年前
, 3F
03/05 22:19, 3F
→
03/05 22:24,
6年前
, 4F
03/05 22:24, 4F
→
03/05 22:27,
6年前
, 5F
03/05 22:27, 5F
→
03/05 22:27,
6年前
, 6F
03/05 22:27, 6F
→
03/05 22:29,
6年前
, 7F
03/05 22:29, 7F
→
03/05 22:38,
6年前
, 8F
03/05 22:38, 8F
→
03/05 23:49,
6年前
, 9F
03/05 23:49, 9F
→
03/05 23:49,
6年前
, 10F
03/05 23:49, 10F
→
03/06 00:01,
6年前
, 11F
03/06 00:01, 11F
→
03/06 00:01,
6年前
, 12F
03/06 00:01, 12F
→
03/06 00:01,
6年前
, 13F
03/06 00:01, 13F