Re: [請益] 使用PCA在分類時的問題

看板Master_D作者 (心平氣和)時間11年前 (2013/03/26 23:07), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串2/2 (看更多)
※ 引述《kuan0817 ()》之銘言: : 大家好 : 最近使用了PCA來對我資料做降維 : 因為降維後的資料是要拿來做分類的 : 也就是有train跟test : 我想問的問題是: : 在找尋eigenvector時, 是否可以使用train+test一起去找 : 如果是這樣做的話, 後續的分類結果是否仍然可以算outside test呢? : 看了一些網路上的資料, 好像有些是說可以納入test, 因為是unsupervised的 : (清大張智星老師網站關於PCA的教學, 也是先對全部資料取pca, 然後再leave one out的 : 去看準確率) : 但又覺得好像怪怪的 : 希望有人可以解惑 : 謝謝大家 I'd suggest not use train+test together during PCA. You can check with any student who has taken my ML class and she'll tell you that it is a typical case of "data snooping" which can bias your estimate of the test performance. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.45.176.150

03/27 12:07, , 1F
老師親自出馬!
03/27 12:07, 1F

03/27 21:38, , 2F
謝謝林老師的回答
03/27 21:38, 2F
文章代碼(AID): #1HKRcLpV (Master_D)
文章代碼(AID): #1HKRcLpV (Master_D)