Re: [請益] 使用PCA在分類時的問題
※ 引述《kuan0817 ()》之銘言:
: 大家好
: 最近使用了PCA來對我資料做降維
: 因為降維後的資料是要拿來做分類的
: 也就是有train跟test
: 我想問的問題是:
: 在找尋eigenvector時, 是否可以使用train+test一起去找
: 如果是這樣做的話, 後續的分類結果是否仍然可以算outside test呢?
: 看了一些網路上的資料, 好像有些是說可以納入test, 因為是unsupervised的
: (清大張智星老師網站關於PCA的教學, 也是先對全部資料取pca, 然後再leave one out的
: 去看準確率)
: 但又覺得好像怪怪的
: 希望有人可以解惑
: 謝謝大家
I'd suggest not use train+test together during PCA.
You can check with any student who has taken my ML class and she'll tell
you that it is a typical case of "data snooping" which can bias your
estimate of the test performance.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.176.150
推
03/27 12:07, , 1F
03/27 12:07, 1F
推
03/27 21:38, , 2F
03/27 21:38, 2F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):