[問題] 想請問bootstrape跑OR

看板Statistics作者 (marki)時間4年前 (2021/06/12 11:12), 4年前編輯推噓7(7019)
留言26則, 5人參與, 最新討論串1/1
各位前輩好 小弟使用R 我手上有一個Data set, 裡面有一個outcome(DV), 一個自變數(IV), 和一個調整變數 三個變數都是binary data 總共有800個觀察值 DV與調整變數沒有missing data, 但是IV有200個missing data 而在IV有值的部分400個是0, 200個是1 所以我想要用bootstrap的方式重複抽取IV的200個missing data 0與1的比例大概是0.67:0.33 然後用logistic regression的方式估算OR的estimate 抽取1000次 所以總共會有1000個OR estimate 然後看這1000個數字的2.5% and 97.5%估算95% CI 我想要請問 1) 這個方式估算estimate與95%CI是可行的嗎? 2) 請問有比較好的R package處理這件事情嗎? 3) 我猜因為那個參數的分布可能不是normal distribution, 所以沒有辦法用mean +/- 1.96SD估算95% CI, 不知道我的想法有沒有錯呢? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.220.230 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1623467568.A.162.html

06/12 12:18, 4年前 , 1F
try clopper Pearson CI?
06/12 12:18, 1F

06/12 22:48, 4年前 , 2F
看不懂bootstrap抽200個missing data是什麼作用
06/12 22:48, 2F

06/12 22:50, 4年前 , 3F
要做迴歸不是要針對1000(或800)樣本去bootstrap嗎?
06/12 22:50, 3F

06/13 10:19, 4年前 , 4F
不好意思 我可能表達的不夠清楚
06/13 10:19, 4F

06/13 10:21, 4年前 , 5F
因為IV有200個missing data, 所以我想每次從裡面
06/13 10:21, 5F

06/13 10:22, 4年前 , 6F
抽1/3的人為1, 剩下2/3為0。然後反覆抽1000次
06/13 10:22, 6F

06/13 10:23, 4年前 , 7F
每次都可以帶入logistic regression算出一個OR的估計值
06/13 10:23, 7F

06/13 10:24, 4年前 , 8F
所以我想95% CI應該可以計算這1000個估計值2.5% and 97.5%
06/13 10:24, 8F

06/13 10:25, 4年前 , 9F
我的dataset有800筆觀察值 但IV只有600筆有值
06/13 10:25, 9F
※ 編輯: marki (36.239.220.230 臺灣), 06/13/2021 10:28:16

06/13 13:09, 4年前 , 10F
你的 CI 沒考慮到部分 IV 為插補值所帶來的估計誤差
06/13 13:09, 10F

06/13 13:40, 4年前 , 11F
抱歉,更正一下
06/13 13:40, 11F

06/13 13:45, 4年前 , 12F
你的 CI 沒考慮到插補 IV 的誤差與估計 OR 的誤差之
06/13 13:45, 12F

06/13 13:45, 4年前 , 13F
間的交互作用
06/13 13:45, 13F

06/13 13:51, 4年前 , 14F
在 iid 的前提下,或許可在 bootstrap 裡改用 leave-
06/13 13:51, 14F

06/13 13:51, 4年前 , 15F
one-out logistic regression
06/13 13:51, 15F

06/13 14:51, 4年前 , 16F
leave-one-out cross-validation logistic regressio
06/13 14:51, 16F

06/13 17:13, 4年前 , 17F
謝謝。想請問我要如何用leave one out 處理誤差的交互作用
06/13 17:13, 17F

06/13 17:13, 4年前 , 18F
呢?
06/13 17:13, 18F

06/13 23:38, 4年前 , 19F
抱歉,好像沒那麼複雜,我想到我的問題去了。你的 re
06/13 23:38, 19F

06/13 23:38, 4年前 , 20F
sampling procedure 應該可以捕捉插補誤差和估計誤差
06/13 23:38, 20F

06/13 23:38, 4年前 , 21F
,只要每一次 bootstrap replication 都包含這兩個步
06/13 23:38, 21F

06/13 23:38, 4年前 , 22F
驟即可
06/13 23:38, 22F

06/15 20:22, 4年前 , 23F
可以借問一下OR指的是什麼嗎?謝謝~
06/15 20:22, 23F

06/15 21:47, 4年前 , 24F
odds ratio
06/15 21:47, 24F

06/16 09:32, 4年前 , 25F
原來如此 我一直想到operation research…XD
06/16 09:32, 25F

06/22 13:47, , 26F
謝謝各位前輩詳解
06/22 13:47, 26F
文章代碼(AID): #1Wn2Om5Y (Statistics)