Re: [請益] 如何教大家"正確"解釋統計數據呢?消失

看板gay作者時間6年前 (2017/09/26 04:15), 6年前編輯推噓2(9733)
留言49則, 10人參與, 最新討論串3/7 (看更多)
原文恕刪,就算被台大事件的風波蓋掉新聞,我也還是要上來回一下 本人沒有念台大也沒有什麼高就,就是個說書的而已 接下來就用我所知道的數學來回應一下這個問題~ 開始囉! https://imgur.com/dbas0XO
這個問題的引爆點大致可以歸功於統計數據,所以讓我們先看看數字: https://imgur.com/eN2QWqR
*註2:數據參考衛服部網站:https://goo.gl/5M9iVq,數據為1984年至2014年之總和 其中5,321人為異性戀不安全性行為中男性人數與女性人數總和; 男性4,441人、女性880人,共計5,321人。 (另外先有註2是因為作圖的時候先做了別張XD 真正寫文章的時候發現這張放前面才有個前因後果) https://imgur.com/HGtkv9T
好好停停停停! 數據上確實是寫著男男間不安全性行為人數比異性戀人數還多呀! 賴清德那樣說,到底錯在哪裡https://imgur.com/aS5SqP3
(其實也沒有用到很高深的統計,因為我也不會:P) 為什麼賴清德那樣的說法是錯誤的?其實關鍵就在只看「人數」其實不準。 這樣講好了,我們先把大家做一點分類: https://imgur.com/pK0U03Z
*註1:事實上同性戀與異性戀並不適合分開來討論,因為人的性向其實是一片光譜, 也就是大家所熟知的性別光譜。但是因為後續的數學討論需要, 所以我才把同性戀跟異性戀切開,因為數學上定義的分割(Partition)嚴格指 的是兩個集合交集為空,但聯集為整個宇集。 (本部分註的部分,若數學看不懂則可以忽略,不是重點XD) https://imgur.com/m03QQAI
事實上,若只看人數的數字是沒有意義的。除了未知的人數真的不知道有多少人以外, 扣掉篩檢HIV結果呈現陽性者的人數以後,還必須知道「到底有多少人去篩檢?」 如果你不是很懂的話,讓我舉個例子給你看: 這是男男間不安全性行為與異性戀不安全性行為的人數: https://imgur.com/eN2QWqR
但是,如果真實的受試者人數長成這個樣子呢? https://imgur.com/pDFEb8Z
*註3:此處的受檢人數為假設數字,並不代表真的數字。我只是要讓你看出來, 受檢人數的多少其實才是真正影響這個統計數字的關鍵。 你問我為什麼不把真的數字寫出來,要寫我假設的數字? 當然是因為每個人去篩檢的時候,他沒事才不會問你是不是同性戀咧。 所以我們只知道到底有多少人「玩過這個篩檢」,但卻不知道這些接受篩檢 的人之中,同性戀與異性戀的占比。 從比例來看的話,不管是同性戀或者是異性戀,篩檢人數:愛滋病人數都接近2:1耶! 如果真實的篩檢數字正常這樣的話,那我就可以跟你說,愛滋病的主因跟同性戀完全 無關!從數學上來看的話,兩事件若為獨立事件,則族群數量與事件的發生成比例。 (單純就是數學上對於獨立事件的定義,也就是說兩件事情無直接關聯) 其實在生活中也不難看見這件事情。大部分的同志相較於異性戀來的更有篩檢的概念, 因此造成同性戀的受試者人數較異性戀多,這也是可以被接受的。 你說,可是我們也不知道真正各族群的篩檢人數是多少啊! 我說,就是因為不知道各族群篩檢的人數是多少,所以賴清德才無法說愛滋病的主因 是男同性戀之間危險性行為!就是因為數字並不知道,你講話要有憑有據,如果不是事實 的事,那你就不能亂說! 這時候如果你不服氣,想要幫賴神護航,那我來告訴你怎樣的數據叫做愛滋病的主因 就是男同性戀吧! https://imgur.com/iJfCXla
或者請看下面這張圖: https://imgur.com/iyuWM3N
如果有辦法從衛服部的數據中,證明以下的不等號成立: https://imgur.com/eFTvAXS
那至少你就可以說愛滋病與男同性戀者有關,即男同性戀為愛滋病的主因之一! 呼~寫到這裡本來想繼續用數學寫下去的,不過我覺得這樣解釋應該大部分的人都懂 了,如果還想了解更深入者,歡迎Google貝氏定理(Bayes' Theorem)。 接著我想寫一些不論是新聞媒體或是院長本人都應該理解的事情: 事實:在HIV+患者當中,男同性戀佔的比例較高。 (這是客觀的事實) 推論:HIV+的主因是男同性戀之間的不安全性行為。 (這是主觀的推論) 從事實推論其實過程沒有那麼簡單,並且此推論必須要負嚴格的舉證責任, 也就是你必須證明。(上面提過了,現有的數據並不構成此推論) 至於院長道不道歉我也無所謂了,洋洋灑灑熬夜寫了這麼多也只是希望大家 可以少點對同志的污名。一路從去年十月開始的婚姻平權小蜜蜂走來, 這條路並不好走,除了婚權以外,我們要的更是平權。 身為一個說書的,也總是希望台下的呆瓜們可以聽懂我想表達什麼, 從減少歧視、反霸凌到反汙名化,讓這個世界更美好。 希望大家有看懂,也誠懇的請版上高手,如果有錯麻煩鞭大力一點,懇請不吝指教! 萊恩 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.40.183.224 ※ 文章網址: https://www.ptt.cc/bbs/gay/M.1506370515.A.690.html ※ 編輯: wayne0824 (114.40.183.224), 09/26/2017 04:17:41

09/26 06:39, , 1F
真是用心,幫你推一個
09/26 06:39, 1F

09/26 07:30, , 2F
講了半天 還是"愛滋黑數"這爛招
09/26 07:30, 2F

09/26 07:31, , 3F
推分析
09/26 07:31, 3F

09/26 07:32, , 4F
得愛滋遲不篩檢 早晚會發病的 到最後還是會回到統計
09/26 07:32, 4F

09/26 07:32, , 5F
09/26 07:32, 5F

09/26 07:34, , 6F
就算有潛伏期 但也只是延後而已 對新增病率的統計影
09/26 07:34, 6F

09/26 07:34, , 7F
像不大
09/26 07:34, 7F

09/26 07:35, , 8F
台灣不是第三世界國家醫療覆蓋率低落
09/26 07:35, 8F

09/26 07:36, , 9F
不可能你愛滋發病 還不會進入醫療體系中不被統計到
09/26 07:36, 9F

09/26 07:40, , 10F
是有少部分人帶原hiv不吃藥也永遠不會發病,那是少
09/26 07:40, 10F

09/26 07:40, , 11F
數有特殊基因的歐裔
09/26 07:40, 11F

09/26 07:41, , 12F
東亞裔哦 不吃藥控制就等發病吧
09/26 07:41, 12F

09/26 07:42, , 13F
我們可不可以因為發生家暴的家庭多數是異性戀,所以宣稱
09/26 07:42, 13F

09/26 07:42, , 14F
異性戀成家是導致家暴的主因呢?
09/26 07:42, 14F

09/26 07:44, , 15F
答案肯定是不行的。 任何抽樣統計要推論到全體,都有以
09/26 07:44, 15F

09/26 07:44, , 16F
管窺豹之嫌。
09/26 07:44, 16F

09/26 07:44, , 17F
你試圖用統計交集創造一個偽論"同志高是同志篩檢人多
09/26 07:44, 17F

09/26 07:44, , 18F
"
09/26 07:44, 18F

09/26 07:47, , 19F
但卻忘了愛滋不是真的"小感冒" 沒補助給帶原者吃藥
09/26 07:47, 19F

09/26 07:47, , 20F
早晚會發病 還是會被醫療機構紀錄到
09/26 07:47, 20F

09/26 07:52, , 21F
愛滋黑數只是解釋了為何有新增病率暴增的原因
09/26 07:52, 21F

09/26 07:53, , 22F
黑數在被檢測出來前依然持續危險性行為 造成新病歷
09/26 07:53, 22F

09/26 07:54, , 23F
但黑數在台灣早晚會回到總統計中 對族群病率推估影響
09/26 07:54, 23F

09/26 07:54, , 24F
不大
09/26 07:54, 24F

09/26 07:58, , 25F
事實上 如果假設黑數是造成新增病歷的主因 那新增病
09/26 07:58, 25F

09/26 07:58, , 26F
歷一直成長的男同 才可能是黑數最高的族群
09/26 07:58, 26F

09/26 08:00, , 27F
我是預設男同確定帶原後 就不會做危險性行為了
09/26 08:00, 27F

09/26 08:03, , 28F
沒有異性戀有大量黑數 但新增病歷卻下降的可能
09/26 08:03, 28F

09/26 08:06, , 29F
用國高中的統計 就想推翻防疫專家統計的結論 ......
09/26 08:06, 29F

09/26 08:06, , 30F
....唉
09/26 08:06, 30F

09/26 08:13, , 31F
推噓文的那位,黑數在醫療覆蓋率高的狀況下不合理
09/26 08:13, 31F

09/26 08:14, , 32F
除非每個發病都不給醫院治療,關在家等死才有黑數
09/26 08:14, 32F

09/26 08:17, , 33F
是會有黑數啦 但黑數在台灣對病率推算引響不大,因
09/26 08:17, 33F

09/26 08:17, , 34F
為遲早會被統計到
09/26 08:17, 34F

09/26 08:17, , 35F
探討"黑數" 主要是探討黑數造成新病歷
09/26 08:17, 35F

09/26 08:18, , 36F
但新病歷最多的是哪個族群我不講了
09/26 08:18, 36F

09/26 09:03, , 37F
母體數跟抽樣數應該不同喔
09/26 09:03, 37F

09/26 09:05, , 38F
覺得原po的邏輯滿好的,推的都是符合統計學的解釋,其
09/26 09:05, 38F

09/26 09:05, , 39F
實就社會公開發言這件事而言,本就該有多少證據說多少
09/26 09:05, 39F

09/26 09:05, , 40F
話吧
09/26 09:05, 40F

09/26 09:42, , 41F
目前黑數影響不大?黑人問號
09/26 09:42, 41F

09/26 09:42, , 42F
更正一下,統計沒有事實喔。
09/26 09:42, 42F

09/26 09:43, , 43F
你說的那是統計「分析」或「總結」。
09/26 09:43, 43F

09/26 09:55, , 44F
統計有趣的地方是同一筆資料在不同人手上可以得到很不一
09/26 09:55, 44F

09/26 09:55, , 45F
樣的結論XD
09/26 09:55, 45F

09/26 12:17, , 46F
09/26 12:17, 46F

09/26 12:58, , 47F
如果都是用真的'統計學'來解釋一份數據,結果應該不會
09/26 12:58, 47F

09/26 12:58, , 48F
相差太遠,怕就是有人看百分比率,完全沒有拿數據跑test
09/26 12:58, 48F

09/26 12:58, , 49F
就直接下結論,而且還是下因果推論XDD
09/26 12:58, 49F
文章代碼(AID): #1PoMFJQG (gay)
討論串 (同標題文章)
文章代碼(AID): #1PoMFJQG (gay)