[問題] 關於validation sample size

看板Statistics作者 (一生懸命)時間7年前 (2017/04/12 15:27), 編輯推噓0(008)
留言8則, 2人參與, 最新討論串1/1
是這樣的 我使用了180個sample, 利用他們的三個variant,使用multiple linear regression 以及一個dependant value 得到了一個model公式 現在要用另一組data去印證這個model 比起其他已知的model 是否更加準確 問題是 要去印證(validation sample)的這組 data case number需要多大 他的power才夠呢 是要跟原來的test sample size=180個 差不多? 還是有一個至少的數量才行? 沒什麼觀念 麻煩各位高手了 感謝! 如果是跟統計軟體有關請重發文章,使用程式做為分類。 統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,擅用E做檔案編輯 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.43.152.203 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1491982065.A.688.html

04/13 06:11, , 1F
新data是收集了還是未收集?
04/13 06:11, 1F

04/13 10:49, , 2F
要用來驗證的新data還沒收集,想知道要多少量才夠 感謝
04/13 10:49, 2F

04/13 12:12, , 3F
如果不收新data,直接拿舊data做cross validation呢?
04/13 12:12, 3F

04/13 12:13, , 4F
喔你還要和別的model比較…那不行。
04/13 12:13, 4F

04/13 14:13, , 5F
不知道要多大的量才夠...@@
04/13 14:13, 5F

04/13 15:29, , 6F
我不知道,但多多益善。最重要的是母體很確定且抽樣得宜
04/13 15:29, 6F

04/13 15:30, , 7F
不要搞成原來不同model訓練的資料母體其實不一樣…
04/13 15:30, 7F

04/13 15:30, , 8F
或是訓練和驗證資料的母體不一樣…
04/13 15:30, 8F
文章代碼(AID): #1OxTRnQ8 (Statistics)