原文
http://www.economist.com/blogs/economist-explains/2016/11/economist-explains-3
翻譯
http://mlkj24.pixnet.net/blog/post/31756855
Economist Nov 9th 2016
民調發生很大的錯誤,且往最糟的那個可能性去。在美國總統前夕,全國民調顯示希拉蕊
領先約4%,而賭盤跟統計模型則將這個數字轉成70%至99%的勝率。最後走鐘:根據紐約時
報旗下網站「Upshot」的預測,希拉蕊仍可能以超過一個百分點的差距贏得普選。但在州
等級的預測,就產生了極端的錯誤。民調預測希拉蕊可以在威斯康辛州贏5%;但現在她可
能輸2.5%。民調認為川普在俄亥俄州會以2%的微小差距獲勝;但現在川普贏了超過8%。川
普在密西根州、賓州的民調都輸了4%,但看起來可在這兩州都以1%的差距獲勝。這些民調
如何出錯?
所有的調查結果都由兩種變數結合而成:選民組成、每個群體的預期投票行為。因為有些
群體 — 比如說年輕的西班牙裔男性 — 比其他群體(比如說白人女性)更不愛表態,民調
機構通常會將收到的回覆加權,以符合他們預期的選民圖像。錯誤民調的產生,可能源於
各群體中受訪者樣本的代表性不夠,也可能源於錯誤預測每種選民的投票行為。
從選舉地圖來看,解釋了為何川普能勝選。在白人選民教育程度較高的州(如科羅拉多州
跟維吉尼亞州),民調結果完美地反映了選舉結果。相反地,在一些許多白人選民未取得
大學學歷的北部州,川普推翻了民調 — 包括一些現在可能還是會輸,但差距比預期小很
多,比如說明尼蘇達州。最簡單的解釋會是,選民比民調機構所預見的還更傾向川普 —
所謂「害羞川普」現象,也就是選民對於要承認支持川普這件事,有些保留。選前的民調
,並沒有太能看出這樣的現象:民調顯示川普在這個群體(譯按:未取得大學學歷的白人
選民)取得30%的巨大領先。但值得注意的是,即便這個數字看得出來他們傾向投給川普,
全國的出口民調顯示,川普在這個群體取得的領先是39%。考慮這些選民佔了威斯康辛州
、密西根州、俄亥俄州和賓州合格選民的58%(雖然最後真正出來投票的人沒那麼多) —
九個百分點的誤差,佔了整個錯誤民調的一大部分。也有可能教育程度較低的白人,過去
比較不傾向投票,而這些人的數量比民調機構預測地多。
在川普驚愕勝利後的各種結果中,對民調這個產業所造成的影響,可以說是最不重要的。
但是應該會激勵民調業者加倍努力,進行更準確地預測,而不只是仰賴人口普查,然後把
結果丟到簡單的可能選民(like-voter)螢幕中。對外行人來說,這次的結果,是對民調不
確定性的一種毀滅性提醒,也是對民調結果過於自信的一種警告。正如物理學家波耳
(Niels Bohr)的名言,「預測是很困難的 — 尤其是針對未來」。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.241.6
※ 文章網址: https://www.ptt.cc/bbs/IA/M.1478789224.A.FD6.html
→
11/10 23:35, , 1F
11/10 23:35, 1F
→
11/11 01:14, , 2F
11/11 01:14, 2F
→
11/11 09:34, , 3F
11/11 09:34, 3F
→
11/11 10:06, , 4F
11/11 10:06, 4F
推
11/12 19:14, , 5F
11/12 19:14, 5F
→
11/12 19:48, , 6F
11/12 19:48, 6F
推
11/13 19:26, , 7F
11/13 19:26, 7F