[問題] 比較樣本、非樣本與母體

看板Statistics作者 (願意感動就是一種享受)時間4年前 (2021/06/14 23:23), 編輯推噓1(1019)
留言20則, 3人參與, 4年前最新討論串1/1
通常我們比較樣本與母體的分布時是想知道樣本的代表性 比較樣本與非樣本的分布時有甚麼意義嗎? 譬如1000所學校有300所學校加入某實驗 那我們比較這300所與剩餘的700所在學校特性上的差異 這樣有意義嗎? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.86.146.132 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1623684202.A.D5D.html

06/15 03:18, 4年前 , 1F
從你舉的例回答,如果抽樣的300所跟剩餘的700所分配情形
06/15 03:18, 1F

06/15 03:18, 4年前 , 2F
差異太大,會導致外推性不足,那就不是一個好的抽樣設計
06/15 03:18, 2F

06/15 04:07, 4年前 , 3F
請問外推性是甚麼意思? generalization?
06/15 04:07, 3F

06/15 04:10, 4年前 , 4F
如果樣本分布與母體分布沒有差異但是與非樣本有差異,要
06/15 04:10, 4F

06/15 04:11, 4年前 , 5F
麼解讀呢?謝謝您
06/15 04:11, 5F

06/15 14:10, 4年前 , 6F
做了簡單t-test在同源母體的模擬。300vs700做法沒問題,
06/15 14:10, 6F

06/15 14:12, 4年前 , 7F
300vs1000(300包括在1000內)會type I error過大。
06/15 14:12, 7F

06/15 14:13, 4年前 , 8F
不過你的結果倒是反過來 XD
06/15 14:13, 8F

06/15 14:17, 4年前 , 9F
更正,會type I error過小。說反了。符合你的結果。但
06/15 14:17, 9F

06/15 14:19, 4年前 , 10F
300 vs 700才是對的方法吧。部份重覆樣本相比有問題。
06/15 14:19, 10F

06/15 14:26, 4年前 , 11F
因此,300vs1000的不顯著結果可能只是型二錯誤。
06/15 14:26, 11F

06/15 15:38, 4年前 , 12F
06/15 15:38, 12F

06/15 22:18, 4年前 , 13F
可是一般檢驗樣本代表性都是300vs1000,怎麼解讀300vs700
06/15 22:18, 13F

06/15 22:18, 4年前 , 14F
謝謝您
06/15 22:18, 14F

06/15 22:34, 4年前 , 15F
這我不清楚。或許是因為數量比例非常懸疏?
06/15 22:34, 15F

06/15 22:35, 4年前 , 16F
但我還是覺得這是有問題的。把抽不抽中視為一個因子,則
06/15 22:35, 16F

06/15 22:36, 4年前 , 17F
放在一個多因子模型中非常自然。
06/15 22:36, 17F

06/15 22:38, 4年前 , 18F
例如,1000硬幣各投一次分300|700二組,做2*2卡方不會是
06/15 22:38, 18F

06/15 22:39, 4年前 , 19F
300vs1000的正面機率而是300vs700的。
06/15 22:39, 19F

06/15 22:41, 4年前 , 20F
光是獨立樣本前題就說不過去惹。
06/15 22:41, 20F
文章代碼(AID): #1WntHgrT (Statistics)