Re: [問題] 候選人得票率檢定

看板Statistics作者 (十口心思)時間14年前 (2009/11/11 16:35), 編輯推噓0(0011)
留言11則, 3人參與, 5年前最新討論串3/3 (看更多)
: 98年高考 抽樣方法 : 一、某次選舉甲選區共有3位候選人,現欲了解選對候選人的支持情形, : 進行了一項民調,隨機訪問了750位的選民,此次民調結果如下: : 支持1號候選人 支持2號候選人 支持3號候選人 尚未決定 合計 : : 人數 210 180 120 240 750 : : (一)試估計1號候選人的支持度p1。 : (二)在95%的信賴度下,1號候選人的支持率p1是否顯著高於2號候選人的支持率p2 ? : (三)若甲選區共有4500位選民且1號候選人是首次參選,現希望估計1號候選人 : 之支持率p1的信賴度為95%且誤差界限為0.03,則訪問750位選民是否足夠, : 若不夠需再訪問多少位選民方能達到此要求 ? : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 220.137.76.7 : → yhliu:只有一個群體, 一個樣本. 再者, 群體無所謂獨立或不獨立. 11/10 17:29 : → kroll:所以是樣本數750的比率差額嗎 ? 11/10 23:19 : → kroll:我一直卡在 "尚未決定" 11/11 04:05 : → yhliu:計算 "支持度" 是否(分母)要剔除 "尚未決定" 我不知. 11/11 09:10 : → yhliu:但第2小題應不管是否剔除 "尚未決定" 都可做...不過, 用信賴 11/11 09:12 : → yhliu:區間做(檢定問題)比較麻煩一點, 因為這是 "單一樣本". 11/11 09:13 : → yhliu:var(p1-p2) = var(p1)+var(p2)-2cov(p1,p2), 套多項分布公式 11/11 09:14 H0: p1-p2 <= 0 H1: p1-p2 > 0 用三項式分布 var(p1)= p1*q1/n var(p2)= p2*q2/n cov(p1,p2)= -p1*p2/n (自己推的... 也不知道對不對 囧rz) 不對"尚未決定"做任何假設 不剔除,取樣本=750 則var(p1-p2)=0.0006912 -> not reject H0 剔除,取樣本=510 則var(p1-p2)=0.0014931 -> not reject H0 如果假設"尚未決定"240人對3位候選人的支持相同 則 var(p1-p2)=0.0036937 -> not reject H0 如果假設"尚未決定"240人的支持狀況與已表態者相同 則var(p1-p2)= 0.0010153 -> reject H0 -- 感謝yhliu大 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.137.76.7

11/12 03:04, , 1F
後兩種解答是不合理的...既沒表態, 如何能強行設答?
11/12 03:04, 1F

11/12 03:06, , 2F
以 510 為樣本數, 即剔除 "尚未決定" 者, 隱含假設其支持狀
11/12 03:06, 2F

11/12 03:07, , 3F
況與已表態者 "本質上是一樣的", 但並沒有強行設定其回答,
11/12 03:07, 3F

11/12 03:07, , 4F
不會虛漲樣本數.
11/12 03:07, 4F

11/12 03:09, , 5F
而以 750 為樣本數, 並且只考慮實際表態支持哪個候選人的算
11/12 03:09, 5F

11/12 03:10, , 6F
法, 是容許 "不選擇". 實際投票行為, 有不投票及投廢票, 那
11/12 03:10, 6F

11/12 03:10, , 7F
就是一種 "不選擇".
11/12 03:10, 7F

11/12 12:38, , 8F
因為要做信賴區間,總覺得比例最高的 尚未決定
11/12 12:38, 8F

11/12 12:39, , 9F
隱含的干擾大到我總認為要考慮
11/12 12:39, 9F

11/12 12:42, , 10F
看來我誤解很大 orz
11/12 12:42, 10F

01/02 15:00, 5年前 , 11F
而以 750 為樣本數 https://daxiv.com
01/02 15:00, 11F
文章代碼(AID): #1A-dT9ff (Statistics)
文章代碼(AID): #1A-dT9ff (Statistics)