Re: [問題] Monte carlo and bootstrap

看板Statistics作者時間19年前 (2006/09/01 08:18), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串4/5 (看更多)
※ 引述《htio.bbs@ptt.cc (htio)》之銘言: > ※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言: > : 甚麼樣的近似估計? 估計甚麼? > ^^^^^^^^^^^^^^^^^^^^^^^^ > 抱歉,我觀念模糊,就是不太懂囉.真的不太懂拉. Monte Caelo 是用在計算 (估算一個明確的量), 而不是用在估計統計上談的未知參數. > : 為甚麼? > : 先把 Monte Carlo 真正用在甚麼地方弄清楚吧! > : 也去了解一下 bootstrap 究竟怎麼做吧! > : 怎麼做的都說不清楚, 弄一堆名詞唬人? > 比如說:我們現在有一堆sample, (x1,y1),(x2,y2),(x3,y3)...(xn,yn) > 我們現在要估計R相關係數,我們當然會用樣本的r相關係數去算. > 可是我們並不知道r的抽樣分配,同時也不知道r統計量的精確度. > 我們綵取bootstrap估計. > 1:) 從原樣本(x1,y1),...(xn,yn)自重抽樣取k組,樣本數為n的樣本 > (k組boostrap sample,建議k至少是200以上) > 2:) 每組樣本算出各自的r相關係數.我們得到k個r相關係數. > 3:) 然後我們根據k個r相關係數做一個直方圖, 很好! 描述很清楚了. 但是, 如果不把這程序和目的的連 結關係弄清楚, 也是白說. > 直方圖在bootstrap 樣本夠大的時候,形成一個輿真實r抽樣分配的圖形. 錯! "樣本夠大" 是甚麼意思? n 夠大? 或 k 夠大? k "200以上" 算是夠大嗎? > 如果我們要求r的精確度,我們可以用boostrap estimate of standard error 從一個已知分布抽樣, 以估算該分布的某幾個基本特徵如 平均數及標準差, 可能 k≧200 夠了? 但若說要看這個分 布的 "真實圖形", k=200 夠嗎? 例如要看這分布在特定 範圍的比例(機率) p, 模擬結果之樣本比例相對誤差是 CV = √[(1-p)/(kp)] K=400, p=0.1 時 CV = 15% p=0.2 時 CV = 10% p=0.3 時 CV = 7.6% p=0.5 時 CV = 5% 要評估樣本分布與真實分布的差異, 總不能只看分布中心. 若希望在 p=0.1 時變異係數不超過 5%,至少要抽 k=3600 個樣本! 再者, bootstrap 方法是不可能得到統計量的正確抽樣分 布的! 即使 k=100000000, 能使模擬的分布很接近 "實際" 分布; 這裡需弄清楚 bootstrap 樣本對應的統計量(如 r) 的 "實際" 分布指的是甚麼?那是以大小為 n 的一個實際 樣本資料當群體時 r 的抽樣分布, 不是我們真正的目標! 統計量(如本例的 r)正確的抽樣分布是根據真實群體來的. 因此, 若原樣本分布 (大小為n的那個實際觀測到的樣本) 與真實的群體分布相差太多, bootstrap 根本不可能得到 接近正確抽樣分布! 因此 n 小時做 bootstrap 是很危險 的! -- │││││ 您在找統計版嗎? 竭誠邀請您加入 Statistics! ▃▅▅▆ ││││ 無名小站 telnet://wretch.twbbs.org (cat_/ ││ 成大計中站 telnet://bbs.ncku.edu.tw ▊Moon▄▂ │ 交大次世代 telnet://bs2.twbbs.org ─ _▍_ ▃▅ 盈月與繁星 telnet://ms.twbbs.org  ̄ ◢ *Mooncat~ ★未經本人同意請勿轉載; 回覆請勿全文引用! -- 夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子 之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下 矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以 喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫 之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87

09/01 11:50, , 1F
謝謝! ^^
09/01 11:50, 1F

09/01 14:42, , 2F
給原PO 有幾本是專門講bootstrap的原文書歐 可以去找來看看
09/01 14:42, 2F

09/01 14:42, , 3F
不過我不記得確切書名了 研究所論文有用到 所以有大略看過
09/01 14:42, 3F
文章代碼(AID): #14ztnE00 (Statistics)
文章代碼(AID): #14ztnE00 (Statistics)