Re: [問題] 抽樣的問題
※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言:
: ※ 引述《jackydai.bbs@ptt.cc (P.P + Ray Allen)》之銘言:
: > 抽樣的問題
: > 假設我現在想要抽樣1068個樣本
: > 希望樣本的受訪者居住地 性別 年齡 教育程度 都符合該地母體
: > 母體資料來說 有辦法查到母體的居住地 性別 年齡 教育查不到(所以無法做加權)
: 加權其實有很大的成分只是自我安慰. 已經有偏的樣本,
: 不因加權就能修正偏誤.
: 人口統計有教育程度資料, 只是大概很難取得小地區, 且
: 按性別、年齡別交叉分類的詳細資料.
yhliu 您是認為說 加權這種東西很不真實 是在刻意放大或縮小
甚至製造受訪者的聲音嗎 如果這樣 是否代表 事前的篩選比較好
是否說 加權這種東西 能夠不要使用 就不要使用?
: > 該地區河東河西的居民 河東比河西是0.48比0.52
: > 但是在電話抽樣時 因為電話分布的關係 抽到河東比河西卻是顛倒成0.52子0.48
: 如果是兩地區電話普及率不同, 或平均每千人電話號碼數
: 不同導致樣本與群體結構不一致, 你的樣本真正代表的是
: 有電話的群體,或 "電話號碼群體". 不論人為控制樣本數,
: 或用事後加權, 都是自我安慰, 以為電話號碼群體與實際
: 目標群體之間的差異, 只在於居住地分布.
: 如果是抽樣或其他操作程序造成樣本結構與群體結構不符,
: 這樣本的可信程度令人懷疑.
: 因抽樣群體(電話號碼)與目標群體不一而衍生的加權問題,
: 究竟以控制兩地區樣本數或事後加權, 實際上兩者皆無不
: 可. 事實上若非電訪, 事先控制兩地區樣本數而兩地區獨
: 立抽樣, 理論上比事後加權好些. 但在電訪, 實際操作是
: 否能令人信賴? 其一是清單上的樣本順序是否確定隨機?
: 其次是既然能因某地區樣本已足而放棄其他同地區樣本,
: 是否也能輕易因其他理由放棄其他特性之樣本? 再者, 一
: 地區先足額而後放棄該地區其他被選中樣本, 是否能保證
: 另一地區也能完成預定樣本數?
如果jacky大大 河東河西無法獨立抽樣 但是用電訪軟體可以確保清單上順序隨機
這樣是用加權還是篩選比較好
該市河東河西只差4% 理論上 一地問完就煞車 應該可以問完另一地
因為差4% 大概差50通左右 要整個問完應該不難 那篩選還是加權好
如果河東河西人口如jacky說的48%比52% 但是電話比變成60%比40%甚至更慘的情形
這樣子是要篩選還是加權好呢
: > 請問 是不管比例顛倒 直接撥打 到時候再加權
: > 還是說 河東問到1068x0.48 = 512 時 就停下來 只問河西 問到相加成1068
: > 這段時間內 電話撥到河東的就放棄
: > 哪個比較自然 比較符合抽樣原理呢 ??
: > 統計初學 請多多指教
我在統計版常常看到您熱心回文 真是感謝您 辛苦了 !!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.169.118.187
推
07/01 14:19, , 1F
07/01 14:19, 1F
→
07/01 14:19, , 2F
07/01 14:19, 2F
→
07/01 14:21, , 3F
07/01 14:21, 3F
→
07/01 14:21, , 4F
07/01 14:21, 4F
討論串 (同標題文章)