[請益] 樣本問題

看板Master_D作者 (weareyoung)時間10年前 (2015/11/05 15:38), 編輯推噓0(0012)
留言12則, 2人參與, 最新討論串1/1
ABC三個學生跑資料庫抓精神疾病 A的總樣本是全部的人50幾萬,有精神疾病的人是44% B總樣本數沒A多但應該有幾十萬,精神疾病41% (老師說差不多) C總樣本是A的樣本中擷取有職業傷害的人,樣本數三萬多,精神疾病20幾%而已。 會差那麼多是因為總樣本人數C比較少的關係嗎?還是跟總樣本無關,是比例問題? 也就是說C雖然3萬多人但應該也要跟A,B一樣是40幾% -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.157.218 ※ 文章網址: https://www.ptt.cc/bbs/Master_D/M.1446709102.A.D4C.html

11/05 16:11, , 1F
在考慮是不是也40%之前,已經排除職業傷害的影響了嗎
11/05 16:11, 1F

11/06 15:05, , 2F
以下說明只是我個人淺見,略供參酌。
11/06 15:05, 2F

11/06 15:06, , 3F
假如A和B皆是用近乎隨機取樣的方式進行抽樣(畢竟現實上
11/06 15:06, 3F

11/06 15:08, , 4F
是很難做到完美的隨機取樣),那麼接下來我會想到的是,
11/06 15:08, 4F

11/06 15:11, , 5F
C多設定了一個條件:「有職業傷害的人」,我不知道C是怎
11/06 15:11, 5F

11/06 15:12, , 6F
麼定義這個職業傷害的,因為"通常"如果疾病狀況比較嚴重
11/06 15:12, 6F

11/06 15:15, , 7F
的話,可能也因此在工作的部分會有一些困難,意思也就是
11/06 15:15, 7F

11/06 15:17, , 8F
在臨床上通常他們比較少是有工作的,所以當C多設定了
11/06 15:17, 8F

11/06 15:18, , 9F
「有職業傷害的人」這個條件時,可能就有機會把一部份確
11/06 15:18, 9F

11/06 15:19, , 10F
診,而且相對狀況比較嚴重的病人篩選掉了。
11/06 15:19, 10F

11/06 15:22, , 11F
因此我會疑惑的是,C的「有職業傷害的人」這個條件,是
11/06 15:22, 11F

11/06 15:23, , 12F
不是也同時代表著這些人在抽樣當時是有工作的?
11/06 15:23, 12F
文章代碼(AID): #1MEmTkrC (Master_D)