Re: [問題] 抽樣的問題

看板Statistics作者時間18年前 (2007/07/01 14:50), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串7/8 (看更多)
※ 引述《aoishingo.bbs@ptt.cc (拼)》之銘言: > ※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言: > : 加權其實有很大的成分只是自我安慰. 已經有偏的樣本, > : 不因加權就能修正偏誤. > : 人口統計有教育程度資料, 只是大概很難取得小地區, 且 > : 按性別、年齡別交叉分類的詳細資料. > yhliu 您是認為說 加權這種東西很不真實 是在刻意放大或縮小 > 甚至製造受訪者的聲音嗎 如果這樣 是否代表 事前的篩選比較好 > 是否說 加權這種東西 能夠不要使用 就不要使用? 不是! 不要擴大解釋了! 我只是說: 已經有偏的樣本, 不因加權就能修正偏誤. 需知: 加權的意義在於修正權偏誤, 而其假設是: 各 "項" 是不偏的. 今假設群體只分 A, B 兩層. 若兩層各取得代表性(不偏) 樣本 s(A), s(B), 則全群體合併應取 [W(A)*s(A) + W(B)*s(B)]/(W(A)+W(B)) (*) 若樣本之權值依次為 w(A), w(B), 則 "不加權" 相當於 "以樣本權值加權", 即 [w(A)*s(A) + w(B)*s(B)]/(w(A)+w(B)) (**) 這當然是不對的! 因為它產生權偏誤; 而應以群體權值加 權如 (*). 分層抽樣之加權或 "事後分層" 都是這個意思. 但如因抽樣群體偏誤(如電訪之電話號碼含蓋率不足), 抽 樣偏誤(特別是未嚴謹執行隨機抽樣), 或調查時有未回覆 而產生有效樣本結構與設計樣本結構或群體結構不同, 因 而產生之加權需求, 如本例地區別電訪樣本比例不同於實 際群體對象比例, 則不只是權值的問題! 而是 s(A),s(B) 等樣本結果具有難以評估之偏誤的問題. 這種情形之加權, 即使其實樣本不具不偏性, 仍被假設是 不偏的. 這就是討論 missing data 處理所謂 MAR (隨機 遺失) 假設的意義. 但 "假設" 畢竟只是假設, 所以我說 那是 "自我安慰". 並不是說 MAR 假設一定不成立. 就像 它不一定成立, 當然它也不一定不成立. 問題是分析者是 否認知: 那是一個假設, 需要評估, 需要被驗證? 如本例若是因群體之電話號碼含蓋率不足且不均, 以致樣 本結構與群體結構不符 (52:48→48:52 只是湊巧,真正重 要的是 52:48≠48:52), 加權或控制兩地區訪問樣本數, 只修正了權偏. 當然有修正可能比不修正好, 但我想提醒 的是: 別以為做了這樣的修正就沒問題了! 很不幸可能有 很多應用者以為 "這是專家提出的方法, 當然沒問題!" 如果有這樣的 "以為",那是很糟糕的! 重要的偏差就因而 被隱藏. 而以為已經被修正了! 事實上, 即使只是因電話號碼含蓋率不足、不均而產生上 述樣本結構的差異, MAR 假設說: 不論在 A 或 B 區, 有無電話不影響這項調查所關心 的各項變數. 這是一個很大膽的假設! > 如果jacky大大 河東河西無法獨立抽樣 但是用電訪軟體可以確保清單上順序隨機 > 這樣是用加權還是篩選比較好 > 該市河東河西只差4% 理論上 一地問完就煞車 應該可以問完另一地 > 因為差4% 大概差50通左右 要整個問完應該不難 那篩選還是加權好 > 如果河東河西人口如jacky說的48%比52% 但是電話比變成60%比40%甚至更慘的情形 > 這樣子是要篩選還是加權好呢 我沒有做計算, 前文只是直覺地認為理論上控制兩區樣本 數 (事先分層) 比事後加權 (事後分層) 好. 但執行比數 學公式更重要! 不嚴謹的調查, 即使用了漂亮的公式, 仍 是垃圾一堆! 常見許多研究者樣本隨便取、輕易放棄, 問 得也很隨便, 卻因軟體方便套用了一些華麗、繁複的方法, 說穿了不過是自欺欺人罷了! 前文我雖有說 "事先分層理論上比事後分層好些",但我也 說了 "兩者皆可". 而那 "理論上..." 事實如前段所言, 只是直覺認為如此, 並未去做計算. > 我在統計版常常看到您熱心回文 真是感謝您 辛苦了 !! -- 嗨! 你好! 祝事事如意, 天天 happy! :) 統計專業版, 需要你的支持! :) 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) ★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。 -- 夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子 之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下 矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以 喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫 之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87

07/01 15:32, , 1F
已經有偏的樣本, 不因加權就能修正偏誤 說的好!!!
07/01 15:32, 1F

07/01 17:02, , 2F
這是最基本的吧= ="
07/01 17:02, 2F
文章代碼(AID): #16XqwX00 (Statistics)
討論串 (同標題文章)
文章代碼(AID): #16XqwX00 (Statistics)