[豪洨] 國民黨公投連署人死亡風險分析
這篇文章的目的是探討簽了國民黨的公投連署書會有什麼風險,以及死亡人數的合理性。
這裡用曾銘宗的『火力發電每 5 年減 5%』當作例子。這個案子在第一階段時共交出 4294
份連署書,其中 83 個連署人在提案前死亡,提案前死亡率 1.93%。
一個人的死亡風險可以量化為下一秒鐘死亡的機率(簡稱瞬時死亡率)。瞬時死亡率的數值
會隨著年齡而增加。我們可以用內政部戶政司 (參考資料1) 的人口統計資料來計算正常人
的瞬時死亡率,並且和國民黨連署人的瞬時死亡率做比較。這篇文章的資料來源是
"02縣市人口數按性別及年齡(8909)" 以及"10縣市死亡人口按五齡組(按發生)(96) "。所
有成年人口按照年齡被分為 20~24, 25~29, ... 95~100, 100+ 等 17 個年齡層。為了簡
化問題,我們假設:
1. 全國屬於同年齡層的人都有相同的瞬時死亡率。
2. 所有人都是在 1/1 出生,因此瞬時死亡率的數值在每年 1/1-12/31 的期間不會發生變
化。
根據 Ross (2003) 第 5 章,餘命 t 的分佈是 (參考資料2):
f(t) = m(t) * exp(-M(t)) (1)
其中 m(t) 描述瞬時死亡率隨時間的變化,M(t) 是 m(t') 從 0 到 t 的積分。假設某一
個人在時間點 s 存活,則他在時間點 t 之前死亡的機率為
P(T < t - s) = exp(-M(s)) - exp(-M(t)) (2)
設時間點 s 有 n 個同年齡的人,其中 k 人在時間點 t 之前死亡,利用 (2) 可以建立
n, k 的 log likelihood function:
L1(p) = (n - k) * log(1 - exp(-M(s)) - exp(-M(t)))
+ k * log(exp(-M(s)) - exp(-M(t))) (3)
其中 p 是瞬時死亡率。M(t) 隨時間變化會使得計算困難。為了簡化計算,我們只用 2017
年的統計資料來計算正常人的瞬時死亡率。由於沒有跨越 12/31,所有人的瞬時死亡率都
不會改變,所以 (3) 可以簡化為
L1(p) = -(n - k) * p * (t - s) + k * log(1 - exp(-p * (t - s))) (4)
最佳化 L1 可以算出某一個年齡層的瞬時死亡率。然而國民黨的連署資料裡面沒有包括連
署人的年齡層,所以我們沒辦法用 (4) 來估計連署人的 p。為了簡化問題,我們假設:
3. 連署人死後立即復活。
4. 連署人是從全國成年人口中隨機選取。
5. 所有連署都在連署期間第一秒完成。
如此一來 n 個人裡面有 k 個死亡的機率變成 Poisson distribution:
L2(p'|n, k) = P(k) = exp(-n * p' * (t - s)) * (n * p' * (t - s))^k / k!
其中 p' 是多個年齡層的平均瞬時死亡率。假設 3 使得任何時間點有可能死亡的人數增
加,假設 5 讓連署人有較多死亡時間,因此兩條假設都會造成低估瞬時死亡率的效果。
L1(p) 的最大值發生在 p=-log( (n - k) / n) / (t - s),而 L2(p') 的最大值發生在
p'=k / (n * (t - s))。2017 年有 365 天,相當於 31536000 秒。令 s=0,t=31536000
並且將內政部的統計資料代入 n, k,可以算出個別年齡層的正常人的瞬時死亡率:
age| 20~24 25~29 30~34 35~39 40~44 45~49 50~54
----------|--------------------------------------------------------------
n| 1612252 1613006 1694805 2042067 1867833 1821639 1849784
k| 708 796 1370 2528 3742 5497 8133
----------|--------------------------------------------------------------
p(from L1)|1.39e-11 1.56e-11 2.56e-11 3.92e-11 6.35e-11 9.58e-11 1.39e-10
p(from L2)|1.39e-11 1.56e-11 2.56e-11 3.92e-11 6.35e-11 9.56e-11 1.39e-10
age| 55~59 60~64 65~69 70~74 75~79 80~84 85~89
----------|--------------------------------------------------------------
n| 1803720 1595004 1236856 700641 613036 422521 272260
k| 10868 13199 14700 14163 20646 24289 26452
----------|--------------------------------------------------------------
p(from L1)|1.91e-10 2.63e-10 3.79e-10 6.47e-10 1.08e-09 1.87e-09 3.24e-09
p(from L2)|1.91e-10 2.62e-10 3.76e-10 6.40e-10 1.06e-09 1.82e-09 3.08e-09
age| 90~94 95~99 100+
----------|--------------------------
n| 114234 27646 4350
k| 16782 5475 1024
----------|--------------------------
p(from L1)|5.03e-09 6.99e-09 8.51e-09
p(from L2)|4.65e-09 6.27e-09 7.46e-09
用 L1 和 L2 估計出來的數值非常接近,可見假設 3 沒有造成太大的誤差。最後我們假設
所有連署書都沒有作假,也就是說 83 個人都是在簽了連署書以後才死亡。
假設第一階段連署花了 30 天的時間,相當於 2592000 秒。代入 s=0, t=2592000,
n=4294 以及 k=83,可以算出連署人的平均瞬時死亡率 p'=7.45729e-09。正常人的平均瞬
時死亡率為 p0=2.881751e-10 (用 L1 的估計值計算)。也就是說,假設連署人是從全國成
年人口隨機選出而且所有連署書都是真的,則簽了連署書以後會讓瞬時死亡率提高至少
25.87 倍。
令 LR = L2(p0|n, k) / L2(p'|n, k),-2log(LR) 可以用來判斷我們的假設和觀察到的
死亡人數是否符合。p0 和 p' 的差異愈大,-2 log(LR) 的數值就愈大,超過某一個臨界
值我們就可以判定假設是錯誤的。根據 Wakeley et. al (2008), -2 * log(LR) 的分佈
近似於 degree of freedom 為 1 的 chi-square distribution (參考資料3)。在顯著水
準 0.05 之下,用 chi-square distribution 可以算出 -2log(LR) 的臨界值為3.84。
令 p0=2.881751e-10,p'=7.45729e-09,得到 -2log(LR) = 380.48。如果國民黨的連署書
不會造成瞬時死亡率增加,就表示我們的假設至少有一條是錯的。修正假設 3, 5 會讓 p'
的估計值增加,導致 -2log(LR) 的數值更大,顯然沒有幫助。由於瞬時死亡率會隨著年齡
層增加,我們可以將假設 4 修正為連署書隨機從高齡人口選取。根據內政部統計資料可以
算出以下的結果:
age| 20+ 25+ 30+ 35+ 40+ 45+ 50+
---------|--------------------------------------------------------------
p0|2.88e-10 3.13e-10 3.43e-10 3.80e-10 4.36e-10 5.03e-10 5.89e-10
-2log(LR)| 380.47 367.21 352.75 336.40 314.67 292.58 268.33
age| 55+ 60+ 65+ 70+ 75+ 80+ 85+
---------|--------------------------------------------------------------
p0|7.12e-10 9.00e-10 1.20e-09 1.67e-09 2.16e-09 2.95e-09 4.03e-09
-2log(LR)| 239.71 204.96 163.95 119.46 87.51 53.58 25.78
age| 90+ 95+ 100+
---------|--------------------------
p0|5.51e-09 7.20e-09 8.51e-09
-2log(LR)| 6.87 0.09 1.51
因此,如果連署書沒有造假而且沒有特殊效果,唯一的可能是所有連署人的年齡都超過 95
歲。如果連署人是從全國成年人口隨機選取而且所有連署書都沒有造假,則簽了連署書會
讓瞬時死亡率提高至少 25.87 倍。建議愛惜生命的人千萬不要參加國民黨的連署。如果已
經超過 95 歲那就另當別論了。
參考資料
1. 內政部戶政司人口統計資料 https://www.ris.gov.tw/zh_TW346
2. S. M. Ross (2003), Introduction to probability models 8th edition.
3. D. D. Wackerly, W. Mendenhall III and R. L. Scheaffer (2008) Mathematical
Statistics with Applications 7th edition
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.108.93
※ 文章網址: https://www.ptt.cc/bbs/TigerBlue/M.1536511243.A.BBB.html
※ 編輯: zxvf (112.104.108.93), 09/10/2018 00:42:12
※ 編輯: zxvf (112.104.108.93), 09/10/2018 00:44:42
推
09/10 01:36,
5年前
, 1F
09/10 01:36, 1F
推
09/10 11:01,
5年前
, 2F
09/10 11:01, 2F
→
09/10 11:21,
5年前
, 3F
09/10 11:21, 3F
推
09/10 13:05,
5年前
, 4F
09/10 13:05, 4F
推
09/10 13:27,
5年前
, 5F
09/10 13:27, 5F
推
09/10 17:28,
5年前
, 6F
09/10 17:28, 6F
推
09/10 17:46,
5年前
, 7F
09/10 17:46, 7F
推
09/10 21:37,
5年前
, 8F
09/10 21:37, 8F
推
09/11 13:38,
5年前
, 9F
09/11 13:38, 9F
推
09/11 16:14,
5年前
, 10F
09/11 16:14, 10F
推
09/11 16:34,
5年前
, 11F
09/11 16:34, 11F
推
09/11 16:42,
5年前
, 12F
09/11 16:42, 12F
推
09/13 15:37,
5年前
, 13F
09/13 15:37, 13F
推
09/14 03:09,
5年前
, 14F
09/14 03:09, 14F
推
09/14 15:21,
5年前
, 15F
09/14 15:21, 15F
推
09/14 15:22,
5年前
, 16F
09/14 15:22, 16F
推
09/17 13:37,
5年前
, 17F
09/17 13:37, 17F
推
09/17 15:50,
5年前
, 18F
09/17 15:50, 18F
推
09/18 19:20,
5年前
, 19F
09/18 19:20, 19F
推
09/22 11:42,
5年前
, 20F
09/22 11:42, 20F
推
09/23 02:37,
5年前
, 21F
09/23 02:37, 21F
推
10/01 17:09,
5年前
, 22F
10/01 17:09, 22F
推
10/07 09:23,
5年前
, 23F
10/07 09:23, 23F
推
10/10 00:28,
5年前
, 24F
10/10 00:28, 24F
推
10/10 11:57,
5年前
, 25F
10/10 11:57, 25F
推
10/14 16:18,
5年前
, 26F
10/14 16:18, 26F
→
11/13 17:10,
5年前
, 27F
11/13 17:10, 27F
推
12/03 18:40,
5年前
, 28F
12/03 18:40, 28F