Re: [新聞] 侯友宜喊話重比民調! 柯文哲回應了:怎可能盧兩次結果變不一樣?
※ 引述《mars1985 (╰|∵|╯)》之銘言:
:
: 【記者施智齡/台北報導】總統大選登記截止日倒數3天,國民黨總統參選人侯友宜今天
: 下午親上火線,對民眾黨總統參選人柯文哲喊話明天再協商,找民調專家2對2討論先前的
: 9份民調,並全程公開直播,決定誰正誰副。柯文哲傍晚回應,明天早上再開記者會處理
: ,如果統計專家都看過了,科學就是科學,統計資料怎麼可能多盧兩次結果變不一樣?
:
: : 柯文哲說,能夠在野整合當然盡量整合,所以我們也一樣,釋出善意處理,明天上午再開
: 記者會。除非我們第一次的統計專家不入流,不然怎麼可能上一次統計不行這次統計就可
: 以?
:
: 是否拒絕明天比民調?柯文哲說稍安勿躁,明天再開記者會說明,「你們(記者)已經很辛
: 苦了」。
:
雖然統計學早已經下課
但看了各種分析
老實說都太複雜
甚至有的根本是胡扯
我看的頭好痛
如果藍白還要盧第二次
就提供我的想法給還有興趣的人參考吧
兩母體比率差之檢定就三類
第一類是獨立樣本且為大樣本
則樣本變數符合常態分配
可用信賴區間檢定、Z檢定、p-value檢定
此類應該也是大部分人在討論的
第二類是獨立樣本且為小樣本
可用齊一性檢定
第三類是配對樣本
可用McNemar檢定
以匯流的民調為例
由於沒有原始資料
故依公佈的數據推測
該民調在信賴水準為95%(1-α)的情況下
抽取樣本數(n)為2046份
研判每份抽樣問卷有兩個問題
問題一:
若柯侯 vs. 賴蕭,你支持哪組候選人?
1.柯侯 2.賴蕭 3.無意見
問題二:
若侯柯 vs. 賴蕭,你支持哪組候選人?
1.侯柯 2.賴蕭 3.無意見
若依此問卷形式,則為配對樣本
檢定應採第三類的McNemar檢定
而非第一、二類形式
將數據彙整如下
https://imgur.com/dckNODH
令隨機變數Xi為表中該情況下的人數
pi = xi / n
i=1,2,3,4
xi需有原始資料才能得知
關於藍白協議的第三點:
雙方同意,若超過統計誤差,由勝者得一點;若在統計誤差範圍內,由侯柯配得一點。
我不明白這段話為何會有爭議
文字隱含的統計意義
只要稍有統計基礎的人都能明白意思
我在此略過文字背後的統計講解
用白話翻譯就是
雙方同意,若柯侯vs.侯柯的樣本支持度〔有顯著差異〕
由樣本支持度較高者得一點
若〔沒有顯著差異〕,由侯柯得一點
(即使柯侯的樣本支持度大於侯柯,
只要沒有顯著差異,就算侯柯贏)
(上述是雙尾檢定)
另外,雖然協議書沒寫
但柯曾說過要讓侯3%
很多人在爭論3%到底是什麼
甚至延伸成1.5%、6%
其實跟統計誤差無關
我之前發文有談過,就不贅述
將3%放入協議書
用白話翻譯就是
雙方同意,若柯侯的樣本支持度〔有顯著大於〕侯柯3%
由柯侯得一點
若柯侯的樣本支持度〔沒有顯著大於〕侯柯3%,
由侯柯得一點
(即使柯侯的樣本支持度大於侯柯3%,
只要沒有顯著大於3%,就算侯柯贏)
(上述是單尾檢定)
基於大眾普遍認為柯要讓侯3%
所以採用單尾檢定
虛無假設H0:P2 - P3 <= 0.03
對立假設H1:P2 - P3 > 0.03
拒絕域:C = {Z | Z > 1.96}
P2^ - P3^ ~ N(P2 - P3 ,〔P2 + P3 -(P2 - P3)^2〕/n)
Z =(x2 - x3 - 0.03n)/ 開根號〔x2 + x3 - n(0.03)^2〕
=(x2 - x3 - 0.03*2046)/ 開根號〔x2 + x3 - 2046*(0.03)^2〕
(省略推導的過程,有興趣可google McNemar)
結論:
若Z > 1.96,則拒絕H0
表示柯侯的支持度顯著大於侯柯的支持度3%
柯侯得一點
若Z <= 1.96,則不拒絕H0
表示柯侯的支持度沒有顯著大於侯柯的支持度3%
侯柯得一點
總結:
由原始資料算出x2、x3
帶入公式求得Z,即可推估誰的支持度較高
與其花時間吵一些不是統計的統計
不如用一點時間把數字代入來驗證
畢竟我把整個檢定過程都給了
照抄並不難吧
或是如鄉民所言
重點不是統計
而是政治?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.136.86.255 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1700612761.A.A6D.html
推
11/22 08:27,
5月前
, 1F
11/22 08:27, 1F
推
11/22 08:27,
5月前
, 2F
11/22 08:27, 2F
→
11/22 08:28,
5月前
, 3F
11/22 08:28, 3F
→
11/22 08:30,
5月前
, 4F
11/22 08:30, 4F
→
11/22 08:32,
5月前
, 5F
11/22 08:32, 5F
→
11/22 08:33,
5月前
, 6F
11/22 08:33, 6F
推
11/22 08:33,
5月前
, 7F
11/22 08:33, 7F
→
11/22 08:33,
5月前
, 8F
11/22 08:33, 8F
→
11/22 08:34,
5月前
, 9F
11/22 08:34, 9F
→
11/22 08:34,
5月前
, 10F
11/22 08:34, 10F
推
11/22 08:35,
5月前
, 11F
11/22 08:35, 11F
→
11/22 08:35,
5月前
, 12F
11/22 08:35, 12F
→
11/22 08:35,
5月前
, 13F
11/22 08:35, 13F
→
11/22 08:36,
5月前
, 14F
11/22 08:36, 14F
推
11/22 08:37,
5月前
, 15F
11/22 08:37, 15F
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 08:52:03
推
11/22 08:42,
5月前
, 16F
11/22 08:42, 16F
→
11/22 08:42,
5月前
, 17F
11/22 08:42, 17F
推
11/22 08:47,
5月前
, 18F
11/22 08:47, 18F
推
11/22 08:47,
5月前
, 19F
11/22 08:47, 19F
→
11/22 08:47,
5月前
, 20F
11/22 08:47, 20F
→
11/22 08:47,
5月前
, 21F
11/22 08:47, 21F
→
11/22 08:49,
5月前
, 22F
11/22 08:49, 22F
推
11/22 08:49,
5月前
, 23F
11/22 08:49, 23F
推
11/22 08:52,
5月前
, 24F
11/22 08:52, 24F
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 08:58:02
→
11/22 08:55,
5月前
, 25F
11/22 08:55, 25F
→
11/22 08:55,
5月前
, 26F
11/22 08:55, 26F
總和是依照公佈的數據算的
不論怎麼加權
總樣本數就是2046
→
11/22 08:57,
5月前
, 27F
11/22 08:57, 27F
推
11/22 09:13,
5月前
, 28F
11/22 09:13, 28F
→
11/22 09:13,
5月前
, 29F
11/22 09:13, 29F
→
11/22 09:20,
5月前
, 30F
11/22 09:20, 30F
→
11/22 09:20,
5月前
, 31F
11/22 09:20, 31F
我猜你大概不懂McNemar
→
11/22 09:30,
5月前
, 32F
11/22 09:30, 32F
推
11/22 09:30,
5月前
, 33F
11/22 09:30, 33F
→
11/22 09:30,
5月前
, 34F
11/22 09:30, 34F
→
11/22 09:31,
5月前
, 35F
11/22 09:31, 35F
→
11/22 09:31,
5月前
, 36F
11/22 09:31, 36F
→
11/22 09:32,
5月前
, 37F
11/22 09:32, 37F
推
11/22 09:32,
5月前
, 38F
11/22 09:32, 38F
→
11/22 09:32,
5月前
, 39F
11/22 09:32, 39F
→
11/22 09:32,
5月前
, 40F
11/22 09:32, 40F
→
11/22 09:32,
5月前
, 41F
11/22 09:32, 41F
Z的推導過程被我省略,其實有扣共變異數
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 09:59:05
推
11/22 09:55,
5月前
, 42F
11/22 09:55, 42F
我只能給你87分,不能再高了
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 10:04:38
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 10:13:42
→
11/22 10:30,
5月前
, 43F
11/22 10:30, 43F
→
11/22 10:30,
5月前
, 44F
11/22 10:30, 44F
你的意思是有可能1票抵3票之類的?
我接受的統計學教育
就是一人一票,票票等值
實際上投票也不可能有一票抵n票的情況
至於加權應該是指在抽樣時
考量每個族群的特性
給予不同的權重
所以各族群的樣本數(ni)並不一定相同
那是屬於抽樣方法探討的課題
推
11/22 10:36,
5月前
, 45F
11/22 10:36, 45F
推
11/22 10:49,
5月前
, 46F
11/22 10:49, 46F
→
11/22 10:49,
5月前
, 47F
11/22 10:49, 47F
說實話,這個命題早就考爛了
我也不懂為什麼能吵到現在
只能說政治凌駕專業吧
推
11/22 11:01,
5月前
, 48F
11/22 11:01, 48F
→
11/22 11:02,
5月前
, 49F
11/22 11:02, 49F
→
11/22 11:04,
5月前
, 50F
11/22 11:04, 50F
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 11:48:15
→
11/22 14:43,
5月前
, 51F
11/22 14:43, 51F
能用統計理論說明為何是錯的嗎?
※ 編輯: doohan01 (101.136.86.255 臺灣), 11/22/2023 15:21:10
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 15 之 24 篇):