[爆卦] 民調計算全詳解

看板Gossiping作者 (基德)時間5月前 (2023/11/19 17:29), 5月前編輯推噓204(25551201)
留言507則, 348人參與, 5月前最新討論串1/3 (看更多)
--------------------更新一下結論啦---------------------- 有推文說兩種問題是分開的,一個受訪者只會被問一個問題,所以把這種情況的結果也更 新一下: 柯侯對賴其中一項民調變不顯著: https://imgur.com/TYCen1W.jpg
侯柯對賴剩兩項民調顯著: https://imgur.com/jlvY4Ao.jpg
也就是說好幾個民調根本不用比,就是柯勝。 -------------------------------------------------------- 下面會直接分析結果,當然有些分析實際上要有原始數據會比較好,所以算是偷懶概算。 那為什麼這次分析民調兩邊會吵成這樣,我只能說原因在於兩邊大概對統計都不熟啦,尤 民眾黨那場記者會,套用的誤差根本是連大一統計的程度都沒有,如果國民黨跟民眾黨在 吵誤差範圍時是用民眾黨呈現的誤差值在吵,那我只能說很悲哀。柯文哲整天說誤差3%就 已經體現他統計底子不夠了,結果朱立倫記者會也在回應1.5%的問題,兩邊完全搞錯民調 分析方法。 一、原始表格提到的誤差怎麼來: 首先要說,那個誤差計算適用的是白努力試驗,也就是答案只有支持或不支持、0或1的條 件下適用的。我已經算過了,就看圖吧: https://imgur.com/LRgmD6w.jpg
這個公式計算的是在一個只有兩種結果的試驗下(例如拋硬幣只有正面或反面),其中一個 可能發生機率P(例如硬幣出現正面的機率)的正負1.96倍估計標準誤(也就是一直在說得 95%信賴區間的誤差),所以他只代表了你抽樣估計比率時的分配分散情形,不能直接拿來 代表計算跟其他比率做差異比較時的誤差。而且只適用N=1時的二項式分配(白努力試驗)。 順便講一下柯一直在說得3%誤差怎麼來的。你如果要做民調而且不知道母群理論上得比率 分佈(例如50%VS50%還是30%VS70%),這時候根據以上公式(只有在2選1民調適用,其他把 這概念用到所有民調上的,那都較做誤用),在還算符合經濟效益又有在最保守估計下可 達到還算可接受的誤差範圍就是3%,在最保守估計(P與Q代0.5時,便異數會是最大值)取得 最低需要人數只要1068人,便可以在民調上確定取得估計誤差介於-3%~3%的成果。 所以這個民調通說得3%本來就只是在考量經濟效益還可接受的人為選用值,他只代表你的 估計有多少機率包含母體真實概率P,當然根據假設檢定的道理,脫離這個範圍的機率 你可以視為不屬於此樣本而認為差異顯著,但是這種判定是在判定一個個體是不是屬於一 個群體時適用,兩群體間的比率或平均數差異所使用的誤差是要轉換的。 二、單問卷內差距分析: 從新聞上分享的資訊看來,大概可以推估問卷(沒看過或聽過問卷只能推測) 施測方式:一個受訪對象回答A題:柯侯VS賴,你選誰?,然後B題:侯柯VS賴你選誰?也 就是說A和B的回答屬於一種within subject的設計。而A題和B題內因為擇1,所以兩個選 項的比率來自不同人,但是你每一個問題內不管你分成多少候選人佔比,他 都是一個封閉的一組樣本,所以重點:1.所有人的回答對支持度的影響不會完全獨立,誰 多了其他人就少、2.一般的檢定方法包含Z檢定和T檢定(與區間估計一體兩面)都是估計兩 個樣本群體的差異,不適用在單題內侯柯/柯侯對賴的差距是否顯著。 然後,昨天民眾黨說國民黨提然後國民黨否定有提出的2倍議題,這個標準只 適用在一組樣本內只有兩個選項(Pvs1-P)的差異顯著性的判斷(像這次民調有兩個都沒支 持的也不行),完全不適用在A題和B題母數的比較,因為A題和B題的差值可以用兩個樣本 群體做計算。 如果真的要照民眾黨記者會公佈的先算跟賴的差距,再比兩種情境下的對賴差距 是否顯著(差距的差距),步驟應該如下: 1.將柯侯/侯柯的民調減賴的民調 2.透過以下公式計算差值的1.96倍標準誤:(統計一般來說,講到誤差值就是標準 誤的值 所以新聞吵什麼3%變6%還是說什麼3%誤差是指整個95%信賴區間的range,我只能說兩黨候 選人和幕僚都回去翻一下大一統計課本好嗎?2倍根本不適用而且誤差值也不是指信賴區 間的range): https://imgur.com/8F1fv3t.jpg
為何用這個公式,請參考下面文章說明: https://abcnews.go.com/images/PollingUnit/MOEFranklin.pdf 推導請看這篇: https://reurl.cc/7MQboQ https://imgur.com/yCbybRb.jpg
https://imgur.com/BLV7VRs.jpg
簡而言之,你如果在單一樣本內有三種以上的分配比例,你要計算兩個候選人的差異 應該考慮用多項式分配,避免誤用過於嚴苛的顯著標準(也就是純白努力試驗下的兩倍「P 的分配的估計標準誤」。符合多項式分配的前提是取樣數相對整個母群很小的情況,例 如這次 抽樣介於1000~2000左右,只佔全台0.01%內的人數,那原本是取後不放回的試驗可以當作 取後放回來看待,所以單樣本如果跟這次民意調查一樣有三組比例分佈,那可以透過多項 函數整合算出一個結果,根據這個前提可以透過考量共變數的公式將其中兩個候選人的差 異問題變回二項式範圍處理,計算出兩候選人民調差異真正適用的標準誤。 3.計算結果確認跟賴有達到顯著差異的再來執行兩種情境的差異比較: https://imgur.com/VlxG9tE.jpg
https://imgur.com/SvV3Lo4.jpg
excel公式如下: https://imgur.com/mUkXw8H.jpg
https://imgur.com/AVcqpWU.jpg
結果顯示兩種情境柯侯和侯柯對賴都有顯著差異,但是其實從差距的效果量來看就知道 柯贏比較多啦。 三、跨情境(跨題)對比 1.民眾黨差距的差距較正確計算: https://imgur.com/wwtwfll.jpg
類似這張圖內在做藥物或處置效果對比的調整間接比較法,不過A題和B題各自內部差異是 單樣本的不同候選人支持度差異,而不是操弄組對控制組視為兩個樣本群體。 顯著檢定結果如下: https://imgur.com/fvPKiT6.jpg
我是用獨立樣本t檢定計算,公式如下(如果是我假定的抽樣方法應該要用相依樣本t檢定 會比較適合,但沒原始數據,而我有兩種情境對賴差距的期望值和變異數,所以乾脆用獨 立樣本的作法試算,在視為獨立下分析還能顯著,其實相依的方式分析也可以顯著,當 然也可以用第二段靠估計的方法算共變)。其實柯幾乎可以當作輾壓。 兩獨立樣本差異t檢定公式: https://imgur.com/Rv1QbPB
https://imgur.com/WS43GcS
Excel內公式: https://imgur.com/od3mV1n.jpg
2. 聽說國民黨的計算方式: 好像就是類似單純比較法,不過這種方法很鳥啦,根本不用討論,完全無法反應兩種情境 對賴的差距。 建議: 1.其實檢定兩種情境的比例結構,應該可以考慮Chi square 改變顯著性的延伸:Bowker' s test of symmetry。 2.明明其他項佔比超大,請不要隨意用binomial方法算誤差好嗎? 3.單樣本內不同候選人的支持度差異之標準誤計算早就有文獻在討論了,請多看。 4.題內比較一次再跨題比較,會遇到型一錯誤率膨脹的問題,應該考慮校正(此篇分析因 為懶也沒有做) 5.這種分析全部當作抽樣有代表性,但是看公佈出來的結果,兩種抽樣方法沒看到加權調 整的作法。 6.Confidence interval信賴區間實際上含意是指做無限次同樣抽樣方法和建構信賴區間 的方法,這些區間有95%機率會涵蓋到母數,簡而言之就是你對建構這個區間的信心,現 在常見的解釋「母數在這個區間的機率有95%」其實是反過來用,而且不一定牢靠,因為區 間一建構完,實際就只有包含或不包含母數其中一種情況,就像刮刮樂會宣稱中獎率,但 是你一但買了一張拿在手上,那張的結果就是確定的只有中或不中其中一個結果。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.15.1.101 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700386165.A.C72.html

11/19 17:29, 5月前 , 1F
車都開走了你還在詳解
11/19 17:29, 1F

11/19 17:29, 5月前 , 2F
Too late
11/19 17:29, 2F

11/19 17:29, 5月前 , 3F
==
11/19 17:29, 3F

11/19 17:29, 5月前 , 4F
你知道已經要寒假了嗎?
11/19 17:29, 4F

11/19 17:30, 5月前 , 5F
這話題結束了拉
11/19 17:30, 5F

11/19 17:30, 5月前 , 6F
還在帶風向阿 瑞凡
11/19 17:30, 6F

11/19 17:30, 5月前 , 7F
請以20字總結,謝謝
11/19 17:30, 7F

11/19 17:30, 5月前 , 8F
已經沒了在管
11/19 17:30, 8F

11/19 17:30, 5月前 , 9F
已經不重要了
11/19 17:30, 9F

11/19 17:30, 5月前 , 10F
這篇需要想一整天嗎?
11/19 17:30, 10F

11/19 17:30, 5月前 , 11F
= =今年是開統計學嗎
11/19 17:30, 11F

11/19 17:30, 5月前 , 12F
太長
11/19 17:30, 12F

11/19 17:30, 5月前 , 13F
還在吵民調喔,人家就沒再管統計,只想用
11/19 17:30, 13F

11/19 17:30, 5月前 , 14F
end
11/19 17:30, 14F

11/19 17:30, 5月前 , 15F
會計做出他們喜歡的數據
11/19 17:30, 15F

11/19 17:30, 5月前 , 16F
怎麼算已經沒意義了
11/19 17:30, 16F

11/19 17:30, 5月前 , 17F
KMT靠媒體說他們贏就好==
11/19 17:30, 17F

11/19 17:30, 5月前 , 18F
作業遲交算零分 準備重修喔
11/19 17:30, 18F

11/19 17:31, 5月前 , 19F
直接講重點派誰選勝率大就好
11/19 17:31, 19F

11/19 17:31, 5月前 , 20F
慢了 我們就不管了
11/19 17:31, 20F

11/19 17:31, 5月前 , 21F

11/19 17:31, 5月前 , 22F
=.= 好了沒 還要王俊多少人
11/19 17:31, 22F

11/19 17:31, 5月前 , 23F
這篇文章值1000p幣,respect!
11/19 17:31, 23F

11/19 17:31, 5月前 , 24F
也不重要了 火車出發了 自己買車票
11/19 17:31, 24F

11/19 17:31, 5月前 , 25F
講重點
11/19 17:31, 25F

11/19 17:31, 5月前 , 26F
請問現在回去選修統計還來得及嗎?
11/19 17:31, 26F

11/19 17:31, 5月前 , 27F
專業
11/19 17:31, 27F

11/19 17:32, 5月前 , 28F
下禮拜三再說
11/19 17:32, 28F

11/19 17:32, 5月前 , 29F
沒有人在意要怎麼算
11/19 17:32, 29F

11/19 17:32, 5月前 , 30F
車都開了
11/19 17:32, 30F

11/19 17:32, 5月前 , 31F
好強!
11/19 17:32, 31F

11/19 17:32, 5月前 , 32F
考試都結束了 你還在寫??
11/19 17:32, 32F

11/19 17:32, 5月前 , 33F
作業晚交就沒人看了 下次請早
11/19 17:32, 33F

11/19 17:32, 5月前 , 34F
教授都走了你才交卷 你要被當了
11/19 17:32, 34F
※ 編輯: Psytoolkid (39.15.1.101 臺灣), 11/19/2023 17:32:42

11/19 17:32, 5月前 , 35F
認真推 慢慢看QQ
11/19 17:32, 35F

11/19 17:32, 5月前 , 36F
太慢了吧 昨天大家都交券了
11/19 17:32, 36F

11/19 17:32, 5月前 , 37F
最後沒說重點 可惡
11/19 17:32, 37F

11/19 17:32, 5月前 , 38F
1000p 要打多久阿
11/19 17:32, 38F
還有 429 則推文
還有 14 段內文
11/20 00:26, 5月前 , 468F
看得出來這是統計內行的人寫的,但是不
11/20 00:26, 468F

11/20 00:26, 5月前 , 469F
知道做民調的人是用什麼統計方法,相信
11/20 00:26, 469F

11/20 00:26, 5月前 , 470F
會選用那些方法應該也是非常多論文證明
11/20 00:26, 470F

11/20 00:26, 5月前 , 471F
這樣比較準確/經濟
11/20 00:26, 471F

11/20 00:27, 5月前 , 472F
文組沒人看得懂 你Po太長了
11/20 00:27, 472F

11/20 00:30, 5月前 , 473F
看到這篇想到自己當初學的統計學忘
11/20 00:30, 473F

11/20 00:30, 5月前 , 474F
光光了QQ 只記得F-test t-test 拒絕
11/20 00:30, 474F

11/20 00:31, 5月前 , 475F
假設 ANOVA分析這些名詞而已QQ
11/20 00:31, 475F

11/20 00:31, 5月前 , 476F
其實放下一堆數學公式,這題的答案一般
11/20 00:31, 476F

11/20 00:31, 5月前 , 477F
人看到數據,答案柯:侯不是5:1就是3
11/20 00:31, 477F

11/20 00:31, 5月前 , 478F
:3
11/20 00:31, 478F

11/20 00:42, 5月前 , 479F
468樓,你想太多了,純粹他們統計爛
11/20 00:42, 479F

11/20 00:42, 5月前 , 480F
而已。
11/20 00:42, 480F

11/20 00:49, 5月前 , 481F

11/20 01:00, 5月前 , 482F
不明覺厲
11/20 01:00, 482F

11/20 01:06, 5月前 , 483F
終於出詳解了,推一個!
11/20 01:06, 483F

11/20 03:17, 5月前 , 484F
推專業
11/20 03:17, 484F

11/20 03:18, 5月前 , 485F
推專業
11/20 03:18, 485F

11/20 04:31, 5月前 , 486F
再推一次原po 這才是八卦應該有的樣子
11/20 04:31, 486F

11/20 05:25, 5月前 , 487F
不管怎樣 這才是ptt該有的文章啊
11/20 05:25, 487F

11/20 05:58, 5月前 , 488F
推你
11/20 05:58, 488F

11/20 09:06, 5月前 , 489F
這文是論文等級的了吧
11/20 09:06, 489F

11/20 10:03, 5月前 , 490F
嗯嗯跟我想的一樣
11/20 10:03, 490F

11/20 11:04, 5月前 , 491F
政治問題不用再統了啦
11/20 11:04, 491F

11/20 12:08, 5月前 , 492F
說中文?
11/20 12:08, 492F

11/20 13:00, 5月前 , 493F
可以幫我下結論嗎?
11/20 13:00, 493F

11/20 14:59, 5月前 , 494F
太認真了~
11/20 14:59, 494F

11/20 20:06, 5月前 , 495F
這一天,人類想起曾被統計支配的恐懼...
11/20 20:06, 495F

11/20 21:30, 5月前 , 496F
這知識水平太高了吧,文組真的有障
11/20 21:30, 496F

11/20 21:30, 5月前 , 497F
11/20 21:30, 497F

11/21 11:59, 5月前 , 498F
期末考都考完了還在統計學詳解
11/21 11:59, 498F

11/21 12:26, 5月前 , 499F
這對板上智商來說太難了
11/21 12:26, 499F

11/21 12:52, 5月前 , 500F
太認真了
11/21 12:52, 500F

11/21 18:16, 5月前 , 501F
因為選舉讓大家都上了一堂統計課~
11/21 18:16, 501F

11/21 18:30, 5月前 , 502F
PTT雖然廢文多,但總有這清流文在支撐
11/21 18:30, 502F

11/21 18:30, 5月前 , 503F
下去
11/21 18:30, 503F

11/21 18:45, 5月前 , 504F
SPSSSSSSSSS
11/21 18:45, 504F

11/21 22:31, 5月前 , 505F
推統計大師
11/21 22:31, 505F

11/22 04:53, 5月前 , 506F
ㄣㄣ 跟我想的一樣
11/22 04:53, 506F

11/22 07:36, 5月前 , 507F
柯侯-3% 侯柯勝 你們都在亂用統計 87
11/22 07:36, 507F
文章代碼(AID): #1bMTLrno (Gossiping)
文章代碼(AID): #1bMTLrno (Gossiping)