[分析] PCA主成份分析 協方差和相關差別

看板Math作者 (Frederick)時間6年前 (2018/03/05 21:13), 編輯推噓0(0013)
留言13則, 2人參與, 6年前最新討論串1/1
PCA 用 correlation or covariance比較 基本上我有爬文,也知道他是如何運算的 可以知道當尺度相同的時候用covariance所丟失的訊息量會最少 我的尺度相同故我先用covariance 計算得到的結果可以發現的確3個軸加起來約90% 這時候發現這些資料依照’’地區’’來區分可以明顯的分群 但如果依照種類卻結果並不是很好 接著我也做了correlation 發現資料丟失量的確滿多的 前三個加起來能解釋約66% 也很神奇地發現 使用correlation的方式可以依照’’種類’’來區隔開 想問一下各位 這樣可以兩種資料都用來討論嗎?? 因為covariance可以漂亮的分出’’地區’’無法分出’’種類’’ 但是相反correlation可以漂亮的分出’’種類’’,卻無法分出’’地區’’ https://i.imgur.com/5yQTP4W.jpg
左上-correlation-地區 右上-covariance-地區(good) 左下-correlation-種類(good) 右下-covariance-種類 還有如果兩個都可以解釋的話,會造成這麼剛好也是有可能的嗎?? 會造成這樣的原因是因為?? 有點想不透 要怎麼跟人解釋資料量變少反而有一個可以變很漂亮… -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.1.213 ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1520255604.A.54B.html

03/05 21:17, 6年前 , 1F
應該說我要種類分群,但不太知道如何跟人解釋為什
03/05 21:17, 1F

03/05 21:17, 6年前 , 2F
麼是一定要用相關矩陣QQ
03/05 21:17, 2F

03/05 22:19, 6年前 , 3F
沒有單位問題
03/05 22:19, 3F

03/05 22:24, 6年前 , 4F
什麼意思?沒有單位問題0.0?
03/05 22:24, 4F

03/05 22:27, 6年前 , 5F
Correlation 會把單位的問題去掉呀 像是 公尺 公分
03/05 22:27, 5F

03/05 22:27, 6年前 , 6F
差別
03/05 22:27, 6F

03/05 22:29, 6年前 , 7F
沒去單位 容易被值大的變數 dominate 結果
03/05 22:29, 7F

03/05 22:38, 6年前 , 8F
這個我知道XD但我事實上單位都是一樣的...
03/05 22:38, 8F

03/05 23:49, 6年前 , 9F
去單位只是一個原因,除以標準差也會有不同的效果,
03/05 23:49, 9F

03/05 23:49, 6年前 , 10F
跟去location! 你可以想想 mahalanobis distance
03/05 23:49, 10F

03/06 00:01, 6年前 , 11F
有點有聽沒有懂哈哈,不過還是非常感謝你!目前照你
03/06 00:01, 11F

03/06 00:01, 6年前 , 12F
說的只能想成,我只看歐式距離,但如果我用其他距
03/06 00:01, 12F

03/06 00:01, 6年前 , 13F
離去解釋可能就不一樣區分群別了
03/06 00:01, 13F
文章代碼(AID): #1QdK9qLB (Math)