Re: [新聞]重新認識高雄學
統計誤差的確跟如何樣本數、如何測量有關
若是算絕對/相對值 誤差 = 1.96 * 標準差 / (樣本數)^1/2
若是算比例(有或無的比例) 最大誤差 = 1.96 * (0.5*0.5) / (樣本數)^1/2
所以誤差跟樣本數及母體的標準差(可用樣本的標準差推估)有關
當樣本數越大,誤差就越小;不過,樣本越大時,成本也越高
所以樣本的大小端賴研究目的及經費而調整
經驗上來說,30個是可以接受的最低限度
可以有200個的話,解釋力就大多了
看台灣時下報紙,選舉民調多半做到800個以上(測比例)
當有800個樣本,在95%信心水準下,最大誤差為 1.7%
不過這個前提是沒有隱性選民,抽樣沒有太大的誤差,以及問卷內容沒有故意引導、造假
(看討論版說,泛綠傾向的聽到TVBS、中國報就掛電話,或說支持泛藍的)
附帶一提,中時那篇夜郎媒體的社論真是經典,真不愧是大理街的質報
回到你學長的研究
若依您的描述,光13個樣本在解釋里的狀況會有不小的誤差
即使13*3個時段= 39也要用得很小心
不過,就2000個樣本依人口數加權來解釋全國,應該沒什麼問題
若我是研究者,我會覺得就里的層次討論在研究資源限制下,意義不大
那抽樣時還不如把範圍分成23 (25)個縣市
每個縣市調查個100個左右的樣本
這樣不但解釋全國的狀況沒什麼問題
也可以就現有資料指出各縣市是否有差異(雖然誤差稍大,但可接受)
這樣可以讓資料效用發揮到最大
因為你們一定有你們的研究目的,也有資源限制
這些都是決定如何調查的重要因子,而我對這幾無所知
因此,以上只是個人意見,你看看就好,最後當然是以你們老闆的意見為依歸囉
若上述的描述有誤的話,也請大家不吝指教
最後,回歸到地理版
地理跟統計也很有關,可以用各地區人口等特性資料
用統計方法來建立這些空間特性對於應變數(如投票行為等)的影響模型
並可適度修改成運算式,來預測該應變數的空間分佈(如預測各地區地震後房屋倒塌數目)
我目前做的研究是用家戶及鄰里特性來做天然災害後住宅重建影響因子的分析。
※ 引述《aoishingo (死刑廢除之文本分析)》之銘言:
: 至於里 就是每個里抽13人 (我那次2004總統大選)
: 這13人就反映該里的 人口特性
: 而且這13人跟其各鄉鎮里的人組起來約2000 就反應全國母體特徵
: 我們訪問時 這一套名單上面13人 不會都乖乖讓我們訪問 尤其是都市化高的地方越慘
: 所以第一套樣本 13人 都市化中等地區最好情形成功大概6人
: 對每個受訪者 在不同時段跑3次 早上/下午/晚上 週1-5/週末 ...
: 我都跑7次說 ....
: 就做第二套樣本
: 到了第三套大概樣本問齊13人 但是剩下的要把他問完 所以超過13也沒關係
: 要問完是因為
: 假設 整個13 就是完整的抽樣 問完比較會跟母體契合
: (這句話我不大會表達 有沒有人可以幫我講詳細依點)
: 問卷答案大多4選1 以及0-10的光譜 1-100的打分數
: 有無加權 就是學長在做的 我不大清楚 <(_ _)>
: 政大那篇論文 階級投票 可以去看看 :)
: 講個笑話
: 以前有個訪員 住嘉義市 負責嘉義市某個里的訪問 後來跟督導抱怨
: 有個叫張博雅的 都不在家 說在台北 很少回嘉義 很難找阿
: 督導 囧 回答 = = 她是內政部長 ....
: ※ 引述《biotite (山水寄情)》之銘言:
: : 其實可以不用做得這麼複雜
: : 只要抽樣是隨機的, 樣本數夠, 在加總的層次上, 抽樣的的結果跟母體不會差太多
: : 不知道每套指的是? 是每里抽13人, 然後按照人口加權? 還是我解讀錯了?
: : 每里13人, 在解釋里的整體行為上, 還是要特謹慎
: : 若問卷採2選1(是 or 不是) 在 95% 信心水準下
: : 誤差可能會超過 20%
: : 不過, 在解釋縣市的行為, 如果有50個里以上, 95%CI 誤差為 4% 以下, 信度應該OK
: : 我不是計畫的評鑑者啦, 只是看到文章內容聯想到上研究方法課的東西
: : 提出一些可能要小心的地方
: : 若我解讀有誤的地方, 也請見諒及指教
: : 若沒記錯的話, 原題目似乎是階級投票論文之類的
: : 但裡面的變數又提到省籍, 所以我才會這麼問
: : 我可能誤會了, 若研究者將省籍當控制因子的話, 來討論其他階級特性的 beta
: : 那這樣應該沒什麼問題 (雖然我猜測省籍可能是最大的影響因子)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 128.194.76.201
※ 編輯: biotite 來自: 128.194.76.201 (12/17 01:32)
討論串 (同標題文章)