Re: [問題] 無法將data標準化後執行PCA已回收
※ 引述《rauf6620 (亂入)》之銘言:
: 感謝您的建議
: 這裡PCA的確是主成分分析沒錯
: 而PCA的資料前處理的確是為去除中心軌道,所以執行centering(中心化)
: 也就是只扣除平均值
: 不過我所看到的國外paper"幾乎"都一致提到,需要將資料標準化
: 我也曾單純只想將資料中心化,然後執行PCA
: 就算該行所有的值都是0,也不會產生分母為0的問題
: 但作者的操作過程是這樣寫
: 心想沒道理不能照著做
: 但做了還真的產生問題
: 另外..您後面PCA code的部份能多解釋一點嗎
: 感謝賜教
: 謝謝
PCA 是要去分解 Covarance matrix.
找 eignvector 和 eignvalue.
問題在於, 要是你的 Covarance matrix 很差,
比方說, A_{1,1} = 10^6, A_{2,2} = 10^-4,
那麼你解 eignvalue, eignvector 會出問題.
所以可以作 scaling.
不過, scaling 不要做錯了.
很多人不知為何而搞, 就開始亂搞,
然後寫出一堆不知所云的東西來..
--
趙客縵胡纓,吾鉤霜雪明。銀鞍照白馬,颯沓如流星。
十步殺一人,千里不留行。是了拂衣去,深藏身與名。
閑過信陵飲,脫劍膝前橫。將炙啖朱亥,持觴勸侯贏。
三杯吐然諾,五嶽倒為輕。眼花耳熱後,意氣素霓生。
就趙揮金錘,邯鄲先震驚。千秋二壯士,烜赫大梁城。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 128.125.20.198
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):