Re: [問題] 抽樣的問題
※ 引述《jackydai.bbs@ptt.cc (P.P + Ray Allen)》之銘言:
> 抽樣的問題
> 假設我現在想要抽樣1068個樣本
> 希望樣本的受訪者居住地 性別 年齡 教育程度 都符合該地母體
> 母體資料來說 有辦法查到母體的居住地 性別 年齡 教育查不到(所以無法做加權)
加權其實有很大的成分只是自我安慰. 已經有偏的樣本,
不因加權就能修正偏誤.
人口統計有教育程度資料, 只是大概很難取得小地區, 且
按性別、年齡別交叉分類的詳細資料.
> 該地區河東河西的居民 河東比河西是0.48比0.52
> 但是在電話抽樣時 因為電話分布的關係 抽到河東比河西卻是顛倒成0.52子0.48
如果是兩地區電話普及率不同, 或平均每千人電話號碼數
不同導致樣本與群體結構不一致, 你的樣本真正代表的是
有電話的群體,或 "電話號碼群體". 不論人為控制樣本數,
或用事後加權, 都是自我安慰, 以為電話號碼群體與實際
目標群體之間的差異, 只在於居住地分布.
如果是抽樣或其他操作程序造成樣本結構與群體結構不符,
這樣本的可信程度令人懷疑.
因抽樣群體(電話號碼)與目標群體不一而衍生的加權問題,
究竟以控制兩地區樣本數或事後加權, 實際上兩者皆無不
可. 事實上若非電訪, 事先控制兩地區樣本數而兩地區獨
立抽樣, 理論上比事後加權好些. 但在電訪, 實際操作是
否能令人信賴? 其一是清單上的樣本順序是否確定隨機?
其次是既然能因某地區樣本已足而放棄其他同地區樣本,
是否也能輕易因其他理由放棄其他特性之樣本? 再者, 一
地區先足額而後放棄該地區其他被選中樣本, 是否能保證
另一地區也能完成預定樣本數?
> 請問 是不管比例顛倒 直接撥打 到時候再加權
> 還是說 河東問到1068x0.48 = 512 時 就停下來 只問河西 問到相加成1068
> 這段時間內 電話撥到河東的就放棄
> 哪個比較自然 比較符合抽樣原理呢 ??
> 統計初學 請多多指教
--
來自統計專業的召喚...
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海
討論串 (同標題文章)