[問題] 想請問bootstrape跑OR
各位前輩好
小弟使用R
我手上有一個Data set, 裡面有一個outcome(DV), 一個自變數(IV), 和一個調整變數
三個變數都是binary data
總共有800個觀察值 DV與調整變數沒有missing data, 但是IV有200個missing data
而在IV有值的部分400個是0, 200個是1
所以我想要用bootstrap的方式重複抽取IV的200個missing data
0與1的比例大概是0.67:0.33
然後用logistic regression的方式估算OR的estimate
抽取1000次 所以總共會有1000個OR estimate
然後看這1000個數字的2.5% and 97.5%估算95% CI
我想要請問
1) 這個方式估算estimate與95%CI是可行的嗎?
2) 請問有比較好的R package處理這件事情嗎?
3) 我猜因為那個參數的分布可能不是normal distribution,
所以沒有辦法用mean +/- 1.96SD估算95% CI, 不知道我的想法有沒有錯呢?
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.239.220.230 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1623467568.A.162.html
→
06/12 12:18,
4年前
, 1F
06/12 12:18, 1F
→
06/12 22:48,
4年前
, 2F
06/12 22:48, 2F
→
06/12 22:50,
4年前
, 3F
06/12 22:50, 3F
→
06/13 10:19,
4年前
, 4F
06/13 10:19, 4F
→
06/13 10:21,
4年前
, 5F
06/13 10:21, 5F
→
06/13 10:22,
4年前
, 6F
06/13 10:22, 6F
→
06/13 10:23,
4年前
, 7F
06/13 10:23, 7F
→
06/13 10:24,
4年前
, 8F
06/13 10:24, 8F
→
06/13 10:25,
4年前
, 9F
06/13 10:25, 9F
※ 編輯: marki (36.239.220.230 臺灣), 06/13/2021 10:28:16
推
06/13 13:09,
4年前
, 10F
06/13 13:09, 10F
推
06/13 13:40,
4年前
, 11F
06/13 13:40, 11F
推
06/13 13:45,
4年前
, 12F
06/13 13:45, 12F
→
06/13 13:45,
4年前
, 13F
06/13 13:45, 13F
推
06/13 13:51,
4年前
, 14F
06/13 13:51, 14F
→
06/13 13:51,
4年前
, 15F
06/13 13:51, 15F
推
06/13 14:51,
4年前
, 16F
06/13 14:51, 16F
→
06/13 17:13,
4年前
, 17F
06/13 17:13, 17F
→
06/13 17:13,
4年前
, 18F
06/13 17:13, 18F
推
06/13 23:38,
4年前
, 19F
06/13 23:38, 19F
→
06/13 23:38,
4年前
, 20F
06/13 23:38, 20F
→
06/13 23:38,
4年前
, 21F
06/13 23:38, 21F
→
06/13 23:38,
4年前
, 22F
06/13 23:38, 22F
推
06/15 20:22,
4年前
, 23F
06/15 20:22, 23F
→
06/15 21:47,
4年前
, 24F
06/15 21:47, 24F
→
06/16 09:32,
4年前
, 25F
06/16 09:32, 25F
→
06/22 13:47, , 26F
06/22 13:47, 26F