Re: [新聞] 高雄是否要設快篩站 陳其邁:偽陽性恐高造成困擾
其實我個人對於這一個問題也是有一些看法~
不過還是針對我有興趣的問題來回覆一下。
先來說說偽陽(陰)性,基本上這一個問題有板有回覆過了,
有興趣的人可以自參照#1Weav5OP (Kaohsiung) 或是 條件機率的課題。
我想來聊聊的是"假設檢定",這是一個很有趣也很常看到的資訊但是大家確又貌似
不太了解,所以想來聊一下這一個問題,以下本文開始:
所謂假設檢定的概念其實很簡單,因為事實上我們無法真的作到普查(現在流行的用法是
普篩),所以我們只可以抽樣來看,然後猜一個可能的實際值看看有沒有機會被包含在
可能的機率範圍之中,這樣的概念就是假設檢定。
現在我們依據最熱門的一次抽樣確診者案1229的部份247(無確診)+1(案例本身),
所以就假定這是隨機的抽(事實上這應該比隨機抽的機率高) 那麼中獎的機率會是1/248
,那麼我們可以算一下這樣狀況之下的標準差:
[(1/248)*(1-1/248)/(248)]^0.5 大約是0.00402..,
接著我們看平均值1/248 大約是0.00403..,所以接下來我們看兩個標準差的值
0.00403..+2*0.0402..大約是0.012..,也就是說中獎的機率高於0.012的可能性大約是
2.5%左右,如果我們算三個標準差就會是0.016..,高於這一個值的可能性值接降到
0.0025以下,所以如果你說現在如果有得病的人的比例是高於2%,那科學界會說:
你的抽樣結果不支持你的假定。
這就是檢定假設。所以基本上你論文如果說高於1.2%就會有一堆人打你的臉了......。
但是我們不管就是任性的用1.2%來看目前高雄的檢測是不是應該多次快篩?我們先假定
大家都是最敏感的案例,快篩準確度結果直接上綱到95%,那麼偽陽性的機率會是0.0494
,在來比對真的陽性0.0114,兩者的比值約是:4.33..也就是假的對象會是真的對象的
4.33倍,這就是為什麼會說偽陽性太多的結果。然後假的就消耗了更多的醫療資源!!
至於多作幾次會不會改變結果?依據取樣結果是常態分配,所以你一個正常的人作
很多次之後結果就會接近快篩告訴你的檢驗可能性95%正常、5%得病(當然還是會有特例)
所以這樣多作幾次你大概可以得知的是:藥廠表示的誤差率是不是有問題~
如果對於抽樣有興趣的那就往下看吧~
相信大家很常在選舉的時候看到電視的民調資訊有"信心水準",
或多或少的人有對這一個資訊充滿好奇,不過我相信多數的人就直接略過~
所以我們就來談一下這個一個很有相關的"假設檢定",在聊這一個資訊之前我們有一些
要補齊的資訊:1.檢定樣本為常態分佈。2.二項式分佈量夠大的時候會接近常態分佈,
以上是必須有的資訊,我們簡單的解釋一下:
1-1.在統計分佈有很多種不一樣的圖型的形狀,其中有一項很特別的叫做常態分佈,
基本上就是很常出現的分佈圖型,所以就叫常態,這一個分佈有一個特色
就是68-95-99.5的配比關係,意思是離中央(平均值)的距離大的區間內發生的比例
越高,距離中央值一個標準差(距離的單位和一公分差不多)的範圍發生的機率是
68%,兩個標準差是95%,三個標準差99.5%。通常我們都是這樣表示
99.5 95 68 68 95 99.5 ([]內發生的機率)
---[----[----[----中----]----]----]---
3 2 1 1 2 3 (標準差個數)
看不太懂可以看美圖https://reurl.cc/OXdMMR
1-2.所謂的"檢定樣本為常態分佈"意思是不管你原本的樣本分佈是怎樣的分佈,只要我們
作取樣看中籤(如:當選、得病......)的統計分佈圖就是常態分佈。所以是針對取樣
結果來說就是常態分佈,而非指原先的樣本是常態分佈,這點常常是誤解。
2.一般來說我們作的民調或是得病的取樣統計基本上多數都是"二項式分佈",而所謂的
二項式分佈則是稱"每次的取樣只有兩個結果(O 或 X)作很多次"。其實就是作很多次
是非題的概念。
基本上這樣就可以開始我們的假設檢定的內文的部份了。
所謂的假設檢定就是我們假設一個"可能的分佈比例結果",在用抽樣的方式去檢驗這樣
的可能性是不是存在,而信心水準指數就是說有多高的比例我的猜測範圍內的"假設結果"
是可能發生的。舉個例子如果我做出來的抽樣結果是0.5,我們標準差是0.1,那就是說
如果我的假定真實的結果是0.4~0.6之間,那真的被我猜到真實的結果在這一個範圍內
的比例是68%。那如果是0.2~0.8那被我猜中的比例就會有99.5%這麼高。
※ 引述《lovebxcx (peiler :))》之銘言:
: 統一一次講,都一年了,大家都長進點好嗎…不要再跳針偽陽偽陰…
: Q1. 為什麼要普篩/廣篩/ whatever什麼篩?
: A1. 為了要阻斷傳染,越早被篩檢出來,就越早被處置(隔離/治療)
: Q2. 為什麼陽性率很低的地方,不追求普篩?
: A2. 因為沒有傳染鍊存在,又何來阻斷傳染,驗了只是浪費錢。
: Q3. 那偽陽偽陰又是?
: A3. 用來騙你的,偽陽偽陰從來都不是考慮該不該篩檢的因素。
: 簡單地說,假設偽陽的機率有1%,那你用一根篩檢棒有百分之1的機率誤判,一次用兩根
: 篩檢棒就只剩萬分之1,一次用三根篩檢棒的機率就只剩下百萬分之1,這就是現代人驗
: 孕一次買不同廠商的同時驗的理由。
: Q4. 那高雄該不該普篩?
: A4. 不管高雄現在該不該「普篩」,也應該要建立快篩站了,全世界一年多來已經示範
: 給台灣看了,台北也示範了三天給其他縣市看,驗不到就當是演練流程也好,都已經一
: 年了,各國都在打疫苗解封,台灣人竟然還在為了篩檢排隊?
: ※ 引述《tenfu (富哥)》之銘言
: : 台北快篩也只有萬華
: : 有沒有想過其他區域如 大安 信義
: : 為啥沒有快篩? 希望上篇酸的 可以來答一下
: : 平常各大醫院有一定篩檢量
: : 現在醫院也會去拼命篩
: : 當有趨勢顯示特定區域
: : 自然有可能如萬華設置
: : 現在就如同大安 信義沒設置快篩
:
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.166.43 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Kaohsiung/M.1621274764.A.A64.html
噓
05/18 02:07,
2年前
, 1F
05/18 02:07, 1F
別這樣阿~最近在複習量子力學,學量子計算難得轉換科目~追一下時事阿!!
噓
05/18 02:11,
2年前
, 2F
05/18 02:11, 2F
我一直以為防疫是科學問題~原來是政治問題阿!!
推
05/18 02:17,
2年前
, 3F
05/18 02:17, 3F
TBBT嗎?哈~我還蠻喜歡看的~覺得好笑XDD
推
05/18 02:20,
2年前
, 4F
05/18 02:20, 4F
可以提出來大家一起討論討論~
推
05/18 03:42,
2年前
, 5F
05/18 03:42, 5F
→
05/18 03:42,
2年前
, 6F
05/18 03:42, 6F
→
05/18 03:45,
2年前
, 7F
05/18 03:45, 7F
→
05/18 03:45,
2年前
, 8F
05/18 03:45, 8F
→
05/18 03:45,
2年前
, 9F
05/18 03:45, 9F
→
05/18 03:48,
2年前
, 10F
05/18 03:48, 10F
→
05/18 03:48,
2年前
, 11F
05/18 03:48, 11F
→
05/18 03:48,
2年前
, 12F
05/18 03:48, 12F
推
05/18 04:00,
2年前
, 13F
05/18 04:00, 13F
推
05/18 05:14,
2年前
, 14F
05/18 05:14, 14F
推
05/18 05:15,
2年前
, 15F
05/18 05:15, 15F
噓
05/18 05:38,
2年前
, 16F
05/18 05:38, 16F
推
05/18 05:47,
2年前
, 17F
05/18 05:47, 17F
推
05/18 06:21,
2年前
, 18F
05/18 06:21, 18F
→
05/18 06:21,
2年前
, 19F
05/18 06:21, 19F
→
05/18 06:21,
2年前
, 20F
05/18 06:21, 20F
推
05/18 06:23,
2年前
, 21F
05/18 06:23, 21F
推
05/18 06:43,
2年前
, 22F
05/18 06:43, 22F
→
05/18 06:43,
2年前
, 23F
05/18 06:43, 23F
推
05/18 06:50,
2年前
, 24F
05/18 06:50, 24F
→
05/18 06:51,
2年前
, 25F
05/18 06:51, 25F
→
05/18 06:54,
2年前
, 26F
05/18 06:54, 26F
推
05/18 07:00,
2年前
, 27F
05/18 07:00, 27F
推
05/18 07:41,
2年前
, 28F
05/18 07:41, 28F
我想這邊有點小誤解~所以來解釋一下,並不是把這次的疫情分佈作為常態分佈來看,
而是針對取樣結果所成的機率函數分佈視為常態分佈。
舉例來說:如果我們丟銅板,分佈只會有兩種可能(正、反),所以基本上就是二項式分佈
但是如果你把丟10次的結果作一筆數據,如:正面的次數(可能性會有11種)。
如此稱為一次試驗,接著做100次這樣的試驗(就是丟1000次的硬幣),這樣你會有100
筆數據,而這100筆數據就會呈現趨近常態分配。
所以是實驗的統計數據結果成常態分配,非指原樣本分佈為常態分配。
因此才有辦法可以做假設檢定。
推
05/18 07:50,
2年前
, 29F
05/18 07:50, 29F
推
05/18 07:59,
2年前
, 30F
05/18 07:59, 30F
推
05/18 08:14,
2年前
, 31F
05/18 08:14, 31F
推
05/18 08:19,
2年前
, 32F
05/18 08:19, 32F
推
05/18 08:20,
2年前
, 33F
05/18 08:20, 33F
推
05/18 08:37,
2年前
, 34F
05/18 08:37, 34F
還有 27 則推文
還有 1 段內文
→
05/18 10:26,
2年前
, 62F
05/18 10:26, 62F
→
05/18 10:26,
2年前
, 63F
05/18 10:26, 63F
→
05/18 10:27,
2年前
, 64F
05/18 10:27, 64F
→
05/18 10:28,
2年前
, 65F
05/18 10:28, 65F
→
05/18 10:28,
2年前
, 66F
05/18 10:28, 66F
推
05/18 10:28,
2年前
, 67F
05/18 10:28, 67F
→
05/18 10:28,
2年前
, 68F
05/18 10:28, 68F
→
05/18 10:30,
2年前
, 69F
05/18 10:30, 69F
→
05/18 10:30,
2年前
, 70F
05/18 10:30, 70F
推
05/18 10:48,
2年前
, 71F
05/18 10:48, 71F
→
05/18 10:48,
2年前
, 72F
05/18 10:48, 72F
推
05/18 11:14,
2年前
, 73F
05/18 11:14, 73F
推
05/18 11:30,
2年前
, 74F
05/18 11:30, 74F
→
05/18 11:30,
2年前
, 75F
05/18 11:30, 75F
→
05/18 11:30,
2年前
, 76F
05/18 11:30, 76F
→
05/18 11:35,
2年前
, 77F
05/18 11:35, 77F
→
05/18 11:35,
2年前
, 78F
05/18 11:35, 78F
→
05/18 11:35,
2年前
, 79F
05/18 11:35, 79F
→
05/18 11:35,
2年前
, 80F
05/18 11:35, 80F
推
05/18 11:37,
2年前
, 81F
05/18 11:37, 81F
推
05/18 12:08,
2年前
, 82F
05/18 12:08, 82F
→
05/18 12:28,
2年前
, 83F
05/18 12:28, 83F
→
05/18 12:28,
2年前
, 84F
05/18 12:28, 84F
推
05/18 12:47,
2年前
, 85F
05/18 12:47, 85F
噓
05/18 13:59,
2年前
, 86F
05/18 13:59, 86F
推
05/18 18:36,
2年前
, 87F
05/18 18:36, 87F
有可能這樣的結果是來自於我的描述不夠清楚,所以可以提出不清楚的地方討論討論。
噓
05/18 18:37,
2年前
, 88F
05/18 18:37, 88F
→
05/18 18:39,
2年前
, 89F
05/18 18:39, 89F
其實針對你這樣的內容沒什麼好回覆的,如果有哪裡不符合科學計算的概念可以提出來,
難道科學也要考慮黨的立場?如果是有利黨的資訊就是幫黨說話?還是你有資訊我領
黨的薪水?我想什麼是中立應該是顯而易見了。
不過如果你在意的是我是不是中立,那你就看不到我更在乎的是科學怎麼討論。
→
05/18 21:34,
2年前
, 90F
05/18 21:34, 90F
→
05/18 21:34,
2年前
, 91F
05/18 21:34, 91F
這件事情可以這樣想,你丟一次銅板想得到正面的機率是1/2(如果是公正的),
兩次正面的機率是1/4,我想你的想法應該是這樣,但這是你考慮特定的樣本型態
(連續兩次正面),當你考慮的是都100萬次的正面和總次數的比值時是不是又回到了1/2
這就是統計學有趣的地方。而我說的95%正是這一個概念。根據藥廠的實驗數據告訴你
95%很準,僅5%是錯誤的,你做很多次自然也應該得到這一個數據結果,如果不是~那可能
是因為個人因素或是藥廠不實。
推
05/18 22:13,
2年前
, 92F
05/18 22:13, 92F
→
05/18 22:13,
2年前
, 93F
05/18 22:13, 93F
→
05/18 22:13,
2年前
, 94F
05/18 22:13, 94F
就"假設檢定"來說其中的一個假設是:如果你做得夠多次,而這次的試驗是你做得夠多次
的某一次試驗整合出一個值(暫稱整合值),且你猜測了一項做了夠多次的整合值結果的
中央值,討論這樣的中央值是否屬於可能發生的可能?這才是假設檢定,並不是實際的
我就看我這100筆或是1000筆的數據的分佈狀況。這塊也是常有的誤會。
所以我們看民調樣本數多數都是1000上下筆數,做到2000的也不會特別的準
,原因是1000筆數據的統計的信賴區已經很小了,2000增益部份實在是不大。
然就是假設檢定常給人的誤解,以為1000筆數據的分佈就是數據本身討論的分佈,
事實上數據討論的分佈是1000筆資料視為某一特定的樣本資料(整合值),用所有可能的
方式去建構成的樣本資訊,但事實上我們根本沒去建立這一個可能的樣本資訊,而是
直接經由二項式分配在極大化的狀況之下所構成的結果 => 常態分配直接套用。
因此"檢定假設"只可以用來檢驗你所假設的中央值是否有可能發生,而無法去真的知道
中央值的結果。
→
05/18 22:13,
2年前
, 95F
05/18 22:13, 95F
→
05/18 22:13,
2年前
, 96F
05/18 22:13, 96F
傳染病的傳播還可以用SIR模型來看,如果有興趣~也是可以來一篇來討論討論。
※ 編輯: simonjen (114.25.166.43 臺灣), 05/18/2021 23:22:13
討論串 (同標題文章)
完整討論串 (本文為第 8 之 8 篇):