Re: [問題] 抽樣的問題

看板Statistics作者 (拼)時間18年前 (2007/07/01 13:52), 編輯推噓1(103)
留言4則, 1人參與, 最新討論串6/8 (看更多)
※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言: : ※ 引述《jackydai.bbs@ptt.cc (P.P + Ray Allen)》之銘言: : > 抽樣的問題 : > 假設我現在想要抽樣1068個樣本 : > 希望樣本的受訪者居住地 性別 年齡 教育程度 都符合該地母體 : > 母體資料來說 有辦法查到母體的居住地 性別 年齡 教育查不到(所以無法做加權) : 加權其實有很大的成分只是自我安慰. 已經有偏的樣本, : 不因加權就能修正偏誤. : 人口統計有教育程度資料, 只是大概很難取得小地區, 且 : 按性別、年齡別交叉分類的詳細資料. yhliu 您是認為說 加權這種東西很不真實 是在刻意放大或縮小 甚至製造受訪者的聲音嗎 如果這樣 是否代表 事前的篩選比較好 是否說 加權這種東西 能夠不要使用 就不要使用? : > 該地區河東河西的居民 河東比河西是0.48比0.52 : > 但是在電話抽樣時 因為電話分布的關係 抽到河東比河西卻是顛倒成0.52子0.48 : 如果是兩地區電話普及率不同, 或平均每千人電話號碼數 : 不同導致樣本與群體結構不一致, 你的樣本真正代表的是 : 有電話的群體,或 "電話號碼群體". 不論人為控制樣本數, : 或用事後加權, 都是自我安慰, 以為電話號碼群體與實際 : 目標群體之間的差異, 只在於居住地分布. : 如果是抽樣或其他操作程序造成樣本結構與群體結構不符, : 這樣本的可信程度令人懷疑. : 因抽樣群體(電話號碼)與目標群體不一而衍生的加權問題, : 究竟以控制兩地區樣本數或事後加權, 實際上兩者皆無不 : 可. 事實上若非電訪, 事先控制兩地區樣本數而兩地區獨 : 立抽樣, 理論上比事後加權好些. 但在電訪, 實際操作是 : 否能令人信賴? 其一是清單上的樣本順序是否確定隨機? : 其次是既然能因某地區樣本已足而放棄其他同地區樣本, : 是否也能輕易因其他理由放棄其他特性之樣本? 再者, 一 : 地區先足額而後放棄該地區其他被選中樣本, 是否能保證 : 另一地區也能完成預定樣本數? 如果jacky大大 河東河西無法獨立抽樣 但是用電訪軟體可以確保清單上順序隨機 這樣是用加權還是篩選比較好 該市河東河西只差4% 理論上 一地問完就煞車 應該可以問完另一地 因為差4% 大概差50通左右 要整個問完應該不難 那篩選還是加權好 如果河東河西人口如jacky說的48%比52% 但是電話比變成60%比40%甚至更慘的情形 這樣子是要篩選還是加權好呢 : > 請問 是不管比例顛倒 直接撥打 到時候再加權 : > 還是說 河東問到1068x0.48 = 512 時 就停下來 只問河西 問到相加成1068 : > 這段時間內 電話撥到河東的就放棄 : > 哪個比較自然 比較符合抽樣原理呢 ?? : > 統計初學 請多多指教 我在統計版常常看到您熱心回文 真是感謝您 辛苦了 !! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.169.118.187

07/01 14:19, , 1F
你誤會y大的意思了,他應該是說假如抽樣的過程已經造成樣本
07/01 14:19, 1F

07/01 14:19, , 2F
偏誤,那再加權那個偏誤的情形不會因此消失
07/01 14:19, 2F

07/01 14:21, , 3F
反過來說,如果抽樣過程是正確的,那使用事後加權未嘗不是一
07/01 14:21, 3F

07/01 14:21, , 4F
種補救的方法
07/01 14:21, 4F
文章代碼(AID): #16Xq41C3 (Statistics)
討論串 (同標題文章)
文章代碼(AID): #16Xq41C3 (Statistics)