[問題] 信賴區間 Coverage Rate 想法

看板Statistics作者hexjacal (黑麻糬)時間7年前 (2018/04/02 00:34)推噓2(2推 0噓 24→)

留言26則, 2人參與討論串1/1

小弟最近在回顧統計學信賴區間進行了些許模擬驗證，腦筋卡住了有部份疑問想請益假設 population~N(0, 1), 對 mu CI 作推論 A. Percentile Bootstrap method 1. 從 N(0,1) 生成母體樣本 X 2. 從 X 重覆抽樣生成 B 個複式樣本 BX 3. 計算多個 sample mean 4. 取 0.025, 0.975 百分位數作為 mu 的 CI 重覆 1~4 多次，Coverage Rate 大約為宣稱的 95% B. 此方法若如果從母體來進行 1. 從 N(0,1) 生成 B個母體樣本 X 2. 計算多個 sample mean 3. 取 0.025, 0.975 百分位數作為 mu 的 CI 重覆 1~3 多次，Coverage Rate --> 100% B 方法的 Coverage Rate 從理論上也合理在 iid 的前提下，每個 sample mean 正負機會各一半若「多個」sample mean 取百分位數後，作出來的 CI 都>0 P(CI_{L}>0)=1-P(CI_{L}<=0) =1-P(至少有 0.025*B 個<=0) =1-pbinom(0.025*B,B,0.5) --> 1 疑惑的是 1. A、B方法最大的差異性在哪? 2. 若要透過 B 方法來建構 CI，它需要作什麼修改? 在無母數下如果要對某個參數 theta 作 CI 且可以模擬多個 theta^{hat} 的觀察值是否有 percentile 或是可能的 formula 可以得到 theta 的近似 CI? 可能是我弄錯了什麼才會在這漩渦裡頭繞，還望版上高手指點，感謝。 2018/04/02 =================================== 感謝 r 大的回應~ 小弟疑惑的地方在於 A 方法的模擬結果，以「樣本」重覆抽樣計算 sample mean Coverage rate 真的是 90~95% 左右但 B 方法，以「母體」重覆抽樣計算 sample mean 同樣是以百分位數的方式作 CI 重覆多次作出來的 CI 範圍均值會很接近 population mean 95% CI 的數學推論結果但其 Coverage Rate，卻會接近 100%，而不是宣稱的 95% 上下為什麼? bootstrap 精神在於對樣本重覆抽樣，可望重現母體的隨機分佈樣貌那為何直接以母體重覆抽樣，卻會得到 100% coverage rate 的結果? 2018/04/03 =================================== 感謝 y 大的回應我獲益良多，我想我要補足部份在於 A(B) 方法以百分位數的方式 1. 取出來的都是 sample mean distribution 的 "涵蓋區間" 2. 它在 population mean 的 "信賴區間" 上提供了什麼資訊目前還缺少最重要 1-->2 的「數學推論」來說服自己我會繼續找尋答案的，萬分感謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.19.199 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1522600495.A.D17.html

推

recorriendo

04/02 06:01, 7年前 , 1^F

04/02 06:01, 1^F

→

recorriendo

04/02 06:02, 7年前 , 2^F

04/02 06:02, 2^F

→

recorriendo

04/02 06:03, 7年前 , 3^F

04/02 06:03, 3^F