[問題] 實務上如何用模擬來證明不偏性和有效性?

看板Statistics作者 (5566)時間7年前 (2017/02/18 02:30), 編輯推噓1(1033)
留言34則, 3人參與, 最新討論串1/1
假設我們有兩個估計量f(x1,x2,....,xn)和 g(x1,......,xn),其中x1,.....,xn為 一組來自log logistic (α,β)的樣本, 問題來了,那我們要怎麼用模擬的方式來說明, 估計量f(x1,x2,....,xn)和估計量g(x1,x2,....,xn) 是α的不偏估計量(或是說比較兩者的不偏性), 以及兩個估計量的有效性呢? 目前的想法是: 產生一組n個來自log logistic (α,β)的隨機樣本, 再用這組樣本去bootstrap分別計算出 f的標準差σ1和g的標準差σ2 建立95%的信賴區間C.I.1和C.I.2 如果C.I.1或C.I.2有蓋住α,則說明估計量f或g對於α有不偏性, 有效性則去比σ1和σ2的大小,越小越有效, 不知這樣的想法合理嗎? 還是有其他更好的作法? 跪求統計版專業的統計專家解惑?謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.18.50 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1487356259.A.147.html

02/18 04:03, , 1F
直接驗證不偏的定義啊 重複產生很多次sample
02/18 04:03, 1F

02/18 04:04, , 2F
驗證estimator平均會收斂到理論
02/18 04:04, 2F

02/18 11:44, , 3F
產生很多組樣本算出估計量平均,根據大數法則平均估計量
02/18 11:44, 3F

02/18 11:48, , 4F
機率收斂到估計量的期望值,假設叫a,看|a-α|是否為0?對
02/18 11:48, 4F

02/18 11:51, , 5F
吧?那有|a-α|有說要多小才是不偏嗎?另外好奇問一下,
02/18 11:51, 5F

02/18 11:54, , 6F
bootstrap1000次裡也1000組的估計量,直接把這1000組估計
02/18 11:54, 6F

02/18 11:56, , 7F
量算平均,可以代表估計量的平均值嗎?bootstrap算出的
02/18 11:56, 7F

02/18 11:58, , 8F
stand error去比大小,可以衡量f和g的相對有效性嗎?謝謝
02/18 11:58, 8F

02/19 03:01, , 9F
重複產生samples也可以算標準差啊 事實上他給你整個
02/19 03:01, 9F

02/19 03:03, , 10F
f或g的確切分布呢 (如果重複次數夠多的話)
02/19 03:03, 10F

02/19 03:04, , 11F
根據標準差你也可以驗證|a-α|是不是"夠小"了
02/19 03:04, 11F

02/19 03:06, , 12F
bootstrap是實地收集數據 未知母體分布時的方法
02/19 03:06, 12F

02/19 03:07, , 13F
現在是跑模擬 母體分布都已經給定 直接sample就可以
02/19 03:07, 13F

02/19 14:55, , 14F
那麼比較f和g的不偏,重複產生n組的samples一定要共用嗎?
02/19 14:55, 14F

02/19 14:57, , 15F
還是各別去產生n組samples去算不偏也行?
02/19 14:57, 15F

02/19 15:03, , 16F
該不會是重複產生n組樣本給f和g共用分別去算這n組的平均
02/19 15:03, 16F

02/19 15:04, , 17F
數和標準差,同時比較不偏和有效,而不須要用到bootstrap?
02/19 15:04, 17F

02/19 15:05, , 18F
謝謝
02/19 15:05, 18F

02/19 15:05, , 19F
說要用模擬驗證不偏其實怪怪的啦 例如: X_i~N(0,1)
02/19 15:05, 19F

02/19 15:08, , 20F
(X_1+X_2)/2 ; sum(X_i)*(1/n) i=1/n 都是X_i 的
02/19 15:08, 20F

02/19 15:09, , 21F
不偏估計量 但前者的收斂顯然很差 因為只有兩個樣本點
02/19 15:09, 21F

02/19 15:12, , 22F
那麼f和g的樣本點個數相同只是函數不同驗證不偏這樣有不
02/19 15:12, 22F

02/19 15:12, , 23F
合理的地方嗎?
02/19 15:12, 23F

02/19 15:12, , 24F
不偏的定義與n的大小無關 我個人認為應該只能用數學
02/19 15:12, 24F

02/19 15:13, , 25F
推導來驗證
02/19 15:13, 25F

02/19 15:14, , 26F
會這樣做是因為f和g函數太複雜沒法手算E(X)和V(X),只好
02/19 15:14, 26F

02/19 15:16, , 27F
用模擬來驗證,即使沒法驗證不偏,驗證漸進不偏和有效也
02/19 15:16, 27F

02/19 15:16, , 28F
ok?比較兩者的優劣
02/19 15:16, 28F

02/20 03:18, , 29F
蒙地卡羅的精神就是用重複的sample來估計期望值啊
02/20 03:18, 29F

02/20 03:21, , 30F
b大的 如果重複產生samples每次都只用兩點 最終的確
02/20 03:21, 30F

02/20 03:22, , 31F
是可以得到f是不偏但不精確(分布很廣)的結論
02/20 03:22, 31F

02/20 03:24, , 32F
回原PO的問題 蒙地卡羅的書一般都推薦共樣本來比較
02/20 03:24, 32F

02/20 03:25, , 33F
我覺得在這裡共不共樣本應該沒什麼差
02/20 03:25, 33F

02/20 13:59, , 34F
我也是這麼認為~感謝大家的意見
02/20 13:59, 34F
文章代碼(AID): #1Ofq5Z57 (Statistics)