[豪洨] 國民黨公投連署人死亡風險分析

看板TigerBlue作者 (tar)時間5年前 (2018/09/10 00:40), 5年前編輯推噓26(2602)
留言28則, 28人參與, 5年前最新討論串1/1
這篇文章的目的是探討簽了國民黨的公投連署書會有什麼風險,以及死亡人數的合理性。 這裡用曾銘宗的『火力發電每 5 年減 5%』當作例子。這個案子在第一階段時共交出 4294 份連署書,其中 83 個連署人在提案前死亡,提案前死亡率 1.93%。 一個人的死亡風險可以量化為下一秒鐘死亡的機率(簡稱瞬時死亡率)。瞬時死亡率的數值 會隨著年齡而增加。我們可以用內政部戶政司 (參考資料1) 的人口統計資料來計算正常人 的瞬時死亡率,並且和國民黨連署人的瞬時死亡率做比較。這篇文章的資料來源是 "02縣市人口數按性別及年齡(8909)" 以及"10縣市死亡人口按五齡組(按發生)(96) "。所 有成年人口按照年齡被分為 20~24, 25~29, ... 95~100, 100+ 等 17 個年齡層。為了簡 化問題,我們假設: 1. 全國屬於同年齡層的人都有相同的瞬時死亡率。 2. 所有人都是在 1/1 出生,因此瞬時死亡率的數值在每年 1/1-12/31 的期間不會發生變 化。 根據 Ross (2003) 第 5 章,餘命 t 的分佈是 (參考資料2): f(t) = m(t) * exp(-M(t)) (1) 其中 m(t) 描述瞬時死亡率隨時間的變化,M(t) 是 m(t') 從 0 到 t 的積分。假設某一 個人在時間點 s 存活,則他在時間點 t 之前死亡的機率為 P(T < t - s) = exp(-M(s)) - exp(-M(t)) (2) 設時間點 s 有 n 個同年齡的人,其中 k 人在時間點 t 之前死亡,利用 (2) 可以建立 n, k 的 log likelihood function: L1(p) = (n - k) * log(1 - exp(-M(s)) - exp(-M(t))) + k * log(exp(-M(s)) - exp(-M(t))) (3) 其中 p 是瞬時死亡率。M(t) 隨時間變化會使得計算困難。為了簡化計算,我們只用 2017 年的統計資料來計算正常人的瞬時死亡率。由於沒有跨越 12/31,所有人的瞬時死亡率都 不會改變,所以 (3) 可以簡化為 L1(p) = -(n - k) * p * (t - s) + k * log(1 - exp(-p * (t - s))) (4) 最佳化 L1 可以算出某一個年齡層的瞬時死亡率。然而國民黨的連署資料裡面沒有包括連 署人的年齡層,所以我們沒辦法用 (4) 來估計連署人的 p。為了簡化問題,我們假設: 3. 連署人死後立即復活。 4. 連署人是從全國成年人口中隨機選取。 5. 所有連署都在連署期間第一秒完成。 如此一來 n 個人裡面有 k 個死亡的機率變成 Poisson distribution: L2(p'|n, k) = P(k) = exp(-n * p' * (t - s)) * (n * p' * (t - s))^k / k! 其中 p' 是多個年齡層的平均瞬時死亡率。假設 3 使得任何時間點有可能死亡的人數增 加,假設 5 讓連署人有較多死亡時間,因此兩條假設都會造成低估瞬時死亡率的效果。 L1(p) 的最大值發生在 p=-log( (n - k) / n) / (t - s),而 L2(p') 的最大值發生在 p'=k / (n * (t - s))。2017 年有 365 天,相當於 31536000 秒。令 s=0,t=31536000 並且將內政部的統計資料代入 n, k,可以算出個別年齡層的正常人的瞬時死亡率: age| 20~24 25~29 30~34 35~39 40~44 45~49 50~54 ----------|-------------------------------------------------------------- n| 1612252 1613006 1694805 2042067 1867833 1821639 1849784 k| 708 796 1370 2528 3742 5497 8133 ----------|-------------------------------------------------------------- p(from L1)|1.39e-11 1.56e-11 2.56e-11 3.92e-11 6.35e-11 9.58e-11 1.39e-10 p(from L2)|1.39e-11 1.56e-11 2.56e-11 3.92e-11 6.35e-11 9.56e-11 1.39e-10 age| 55~59 60~64 65~69 70~74 75~79 80~84 85~89 ----------|-------------------------------------------------------------- n| 1803720 1595004 1236856 700641 613036 422521 272260 k| 10868 13199 14700 14163 20646 24289 26452 ----------|-------------------------------------------------------------- p(from L1)|1.91e-10 2.63e-10 3.79e-10 6.47e-10 1.08e-09 1.87e-09 3.24e-09 p(from L2)|1.91e-10 2.62e-10 3.76e-10 6.40e-10 1.06e-09 1.82e-09 3.08e-09 age| 90~94 95~99 100+ ----------|-------------------------- n| 114234 27646 4350 k| 16782 5475 1024 ----------|-------------------------- p(from L1)|5.03e-09 6.99e-09 8.51e-09 p(from L2)|4.65e-09 6.27e-09 7.46e-09 用 L1 和 L2 估計出來的數值非常接近,可見假設 3 沒有造成太大的誤差。最後我們假設 所有連署書都沒有作假,也就是說 83 個人都是在簽了連署書以後才死亡。 假設第一階段連署花了 30 天的時間,相當於 2592000 秒。代入 s=0, t=2592000, n=4294 以及 k=83,可以算出連署人的平均瞬時死亡率 p'=7.45729e-09。正常人的平均瞬 時死亡率為 p0=2.881751e-10 (用 L1 的估計值計算)。也就是說,假設連署人是從全國成 年人口隨機選出而且所有連署書都是真的,則簽了連署書以後會讓瞬時死亡率提高至少 25.87 倍。 令 LR = L2(p0|n, k) / L2(p'|n, k),-2log(LR) 可以用來判斷我們的假設和觀察到的 死亡人數是否符合。p0 和 p' 的差異愈大,-2 log(LR) 的數值就愈大,超過某一個臨界 值我們就可以判定假設是錯誤的。根據 Wakeley et. al (2008), -2 * log(LR) 的分佈 近似於 degree of freedom 為 1 的 chi-square distribution (參考資料3)。在顯著水 準 0.05 之下,用 chi-square distribution 可以算出 -2log(LR) 的臨界值為3.84。 令 p0=2.881751e-10,p'=7.45729e-09,得到 -2log(LR) = 380.48。如果國民黨的連署書 不會造成瞬時死亡率增加,就表示我們的假設至少有一條是錯的。修正假設 3, 5 會讓 p' 的估計值增加,導致 -2log(LR) 的數值更大,顯然沒有幫助。由於瞬時死亡率會隨著年齡 層增加,我們可以將假設 4 修正為連署書隨機從高齡人口選取。根據內政部統計資料可以 算出以下的結果: age| 20+ 25+ 30+ 35+ 40+ 45+ 50+ ---------|-------------------------------------------------------------- p0|2.88e-10 3.13e-10 3.43e-10 3.80e-10 4.36e-10 5.03e-10 5.89e-10 -2log(LR)| 380.47 367.21 352.75 336.40 314.67 292.58 268.33 age| 55+ 60+ 65+ 70+ 75+ 80+ 85+ ---------|-------------------------------------------------------------- p0|7.12e-10 9.00e-10 1.20e-09 1.67e-09 2.16e-09 2.95e-09 4.03e-09 -2log(LR)| 239.71 204.96 163.95 119.46 87.51 53.58 25.78 age| 90+ 95+ 100+ ---------|-------------------------- p0|5.51e-09 7.20e-09 8.51e-09 -2log(LR)| 6.87 0.09 1.51 因此,如果連署書沒有造假而且沒有特殊效果,唯一的可能是所有連署人的年齡都超過 95 歲。如果連署人是從全國成年人口隨機選取而且所有連署書都沒有造假,則簽了連署書會 讓瞬時死亡率提高至少 25.87 倍。建議愛惜生命的人千萬不要參加國民黨的連署。如果已 經超過 95 歲那就另當別論了。 參考資料 1. 內政部戶政司人口統計資料 https://www.ris.gov.tw/zh_TW346 2. S. M. Ross (2003), Introduction to probability models 8th edition. 3. D. D. Wackerly, W. Mendenhall III and R. L. Scheaffer (2008) Mathematical Statistics with Applications 7th edition -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.104.108.93 ※ 文章網址: https://www.ptt.cc/bbs/TigerBlue/M.1536511243.A.BBB.html ※ 編輯: zxvf (112.104.108.93), 09/10/2018 00:42:12 ※ 編輯: zxvf (112.104.108.93), 09/10/2018 00:44:42

09/10 01:36, 5年前 , 1F
來人,上翻譯
09/10 01:36, 1F

09/10 11:01, 5年前 , 2F
我先推怕別人以為我看不懂
09/10 11:01, 2F

09/10 11:21, 5年前 , 3F
供三小
09/10 11:21, 3F

09/10 13:05, 5年前 , 4F
浪費才能系列
09/10 13:05, 4F

09/10 13:27, 5年前 , 5F
可以
09/10 13:27, 5F

09/10 17:28, 5年前 , 6F
懶人包:簽完了連署死亡率暴增了25倍
09/10 17:28, 6F

09/10 17:46, 5年前 , 7F
這不管理組文組都看不懂......
09/10 17:46, 7F

09/10 21:37, 5年前 , 8F
建議最後一段改放開頭,後面全部註解掉
09/10 21:37, 8F

09/11 13:38, 5年前 , 9F
你死亡系?
09/11 13:38, 9F

09/11 16:14, 5年前 , 10F
幹,笑死
09/11 16:14, 10F

09/11 16:34, 5年前 , 11F
安樂死還沒合法化的變通之道…咦?
09/11 16:34, 11F

09/11 16:42, 5年前 , 12F
到底在公三小
09/11 16:42, 12F

09/13 15:37, 5年前 , 13F
三小
09/13 15:37, 13F

09/14 03:09, 5年前 , 14F
公三小
09/14 03:09, 14F

09/14 15:21, 5年前 , 15F
沒有造假是不是該標個顏色
09/14 15:21, 15F

09/14 15:22, 5年前 , 16F
笑炸
09/14 15:22, 16F

09/17 13:37, 5年前 , 17F
三小
09/17 13:37, 17F

09/17 15:50, 5年前 , 18F
統計報告寫到累了嗎XD
09/17 15:50, 18F

09/18 19:20, 5年前 , 19F
提高死亡率的最佳方式
09/18 19:20, 19F

09/22 11:42, 5年前 , 20F
三小
09/22 11:42, 20F

09/23 02:37, 5年前 , 21F
不同形式的唬爛 我喜歡 推
09/23 02:37, 21F

10/01 17:09, 5年前 , 22F
三小
10/01 17:09, 22F

10/07 09:23, 5年前 , 23F
應該把重點加色方便有閱讀障礙的人
10/07 09:23, 23F

10/10 00:28, 5年前 , 24F
完全看不懂
10/10 00:28, 24F

10/10 11:57, 5年前 , 25F
假設復活是怎樣
10/10 11:57, 25F

10/14 16:18, 5年前 , 26F
10/14 16:18, 26F

11/13 17:10, 5年前 , 27F
論文快點做
11/13 17:10, 27F

12/03 18:40, 5年前 , 28F
文組看不懂
12/03 18:40, 28F
文章代碼(AID): #1RbKqBkx (TigerBlue)