Re: [問題] 抽樣的問題

看板Statistics作者aoishingo (拼)時間18年前 (2007/07/01 13:52)推噓1(1推 0噓 3→)

留言4則, 1人參與討論串6/8 (看更多)

※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言： : ※ 引述《jackydai.bbs@ptt.cc (P.P + Ray Allen)》之銘言： : > 抽樣的問題 : > 假設我現在想要抽樣1068個樣本 : > 希望樣本的受訪者居住地性別年齡教育程度都符合該地母體 : > 母體資料來說有辦法查到母體的居住地性別年齡教育查不到(所以無法做加權) : 加權其實有很大的成分只是自我安慰. 已經有偏的樣本, : 不因加權就能修正偏誤. : 人口統計有教育程度資料, 只是大概很難取得小地區, 且 : 按性別、年齡別交叉分類的詳細資料. yhliu 您是認為說加權這種東西很不真實是在刻意放大或縮小甚至製造受訪者的聲音嗎如果這樣是否代表事前的篩選比較好是否說加權這種東西能夠不要使用就不要使用? : > 該地區河東河西的居民河東比河西是0.48比0.52 : > 但是在電話抽樣時因為電話分布的關係抽到河東比河西卻是顛倒成0.52子0.48 : 如果是兩地區電話普及率不同, 或平均每千人電話號碼數 : 不同導致樣本與群體結構不一致, 你的樣本真正代表的是 : 有電話的群體,或 "電話號碼群體". 不論人為控制樣本數, : 或用事後加權, 都是自我安慰, 以為電話號碼群體與實際 : 目標群體之間的差異, 只在於居住地分布. : 如果是抽樣或其他操作程序造成樣本結構與群體結構不符, : 這樣本的可信程度令人懷疑. : 因抽樣群體(電話號碼)與目標群體不一而衍生的加權問題, : 究竟以控制兩地區樣本數或事後加權, 實際上兩者皆無不 : 可. 事實上若非電訪, 事先控制兩地區樣本數而兩地區獨 : 立抽樣, 理論上比事後加權好些. 但在電訪, 實際操作是 : 否能令人信賴? 其一是清單上的樣本順序是否確定隨機? : 其次是既然能因某地區樣本已足而放棄其他同地區樣本, : 是否也能輕易因其他理由放棄其他特性之樣本? 再者, 一 : 地區先足額而後放棄該地區其他被選中樣本, 是否能保證 : 另一地區也能完成預定樣本數? 如果jacky大大河東河西無法獨立抽樣但是用電訪軟體可以確保清單上順序隨機這樣是用加權還是篩選比較好該市河東河西只差4% 理論上一地問完就煞車應該可以問完另一地因為差4% 大概差50通左右要整個問完應該不難那篩選還是加權好如果河東河西人口如jacky說的48%比52% 但是電話比變成60%比40%甚至更慘的情形這樣子是要篩選還是加權好呢 : > 請問是不管比例顛倒直接撥打到時候再加權 : > 還是說河東問到1068x0.48 = 512 時就停下來只問河西問到相加成1068 : > 這段時間內電話撥到河東的就放棄 : > 哪個比較自然比較符合抽樣原理呢 ?? : > 統計初學請多多指教我在統計版常常看到您熱心回文真是感謝您辛苦了 !! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.169.118.187

推

flunk

07/01 14:19, , 1^F

07/01 14:19, 1^F

→

flunk

07/01 14:19, , 2^F

07/01 14:19, 2^F

→

flunk

07/01 14:21, , 3^F

07/01 14:21, 3^F