Re: [問題] 想請教一個抽樣的問題
※ 引述《logiclife (夏天好熱)》之銘言:
: 第一次在統計版發問,還懇請各位統計先進解惑,謝謝!
: 是這樣的,
: 我觀察到"抽樣"這件事情的嚴謹性,
: 似乎不是每個領域都有同樣程度的重視,
: 除了教育類的文獻比較常看到採取機率抽樣外,
: 大多研究都常採取方便取樣,收集足夠的問卷量後,就做統計分析。
: 而我一直很希望可以突破這個缺失,以便有比較好的推論性,
: 可是實際情況又無法做到真正的隨機取樣,
: 所以我想請問:
: 倘若我現在要進行一項針對台灣18-25歲青年人的調查研究,
: 我想先以"設籍所在區域"做分類,例如:北、中、南、東、離島,
: 然後再從每個不同的區域,邀請同樣數量的自願調查者填寫問卷,
: 並可能再設下如:性別、宗教信仰等資格條件,
: 而邀請方式,就是透過研究公告的招募,請受測者上網填寫或寄發問卷。
: 想請問,假如採取這樣的做法,算是能被接受的取樣方式嗎?有無可以補強之處?
: 我無法做到分層後的隨機,各層總體人數也未知,
: 有考慮叢集抽樣,但問題好像也類似,
: 因為透過招募來的自願者,就不是我抽取到他/她的,(不知看得懂我的意思嗎?)
: 這樣,是否就只能被歸類成方便取樣了呢?
分三個部份回覆你:
第一個部份:
抽樣的確很重要,然而可能要根據你的目的和所能承擔的假設而決定是否需要非常具有代表
性的樣本(我在暗示之前的研究這個部份也許不一定能算缺失)
若主要研究目標是探討關聯性,那你只要做兩個假設其實樣本代表性也不是這麼重要:
1. 無交互作用(這個關聯性在任何族群中階一致)
2. 主要自變項與任何變項都無關(如隨機分派的介入)
若無法滿足第1點,族群平均效應沒有意義,但分層後的效應估計仍是準確的
若無法滿足第2點,但有完整控制與主要自變項和依變項同時相關的變項,估計也是準確的
上面這些你先參考一下,因為樣本要具有代表性這件事情本身要付出很大的代價
第二個部份:
現在回到你所提的方法
你所提的方法即便看起來很複雜,但很遺憾的他還是方便取樣,關鍵在這:
"邀請方式,就是透過研究公告的招募,請受測者上網填寫或寄發問卷。"
你如何能確保受到邀請的人與未受到邀請的人特性完全一致?
再繼續,即便你有了全台灣的名冊,你使用隨機抽樣抽取了你的邀請對象,你又能保證拒絕受
訪的人與接受受訪的人完全一致嗎?
所以說一般研究大概都很難做到真正的隨機
第三個部份:
好吧,就算你抽到對台灣有很高代表性的樣本好了,按照你的抽樣邏輯,你的平均效應還是有
很大的機會是不能用的
若是五個地區的關聯性不一,而你的樣本在這五個地區的樣本數完全相同,他們直接合併會
符合台灣的人口結構嗎?
顯然不會,你還需要做加權處理,這時候你還需要拿到全台灣在該年齡層的人口分狀況
地區別人口還不算太難,但加上性別等因素進去呢? 你看起來好像什麼都考慮到了,但能拿
到這麼細的資訊嗎?
所以你的關聯性在不符合第一部份中的兩個假設時,平均效應還是很難是正確的
另外,平均效應的應用上其實也不是這麼好用,如果你是個觀察性研究,你還要考慮到平均效
應包含了各地區別(或更細一點)他們主要自變項的變異頻率可能不同,這點也會混雜在平均
效應之內
例外:
如果你今天主要的研究目標並非探討關聯性,而是做一個描述,舉例來說你想要描述全台灣
的平均身高+平均體重
那樣本代表性就"非常非常非常"重要
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 27.105.59.239
討論串 (同標題文章)