[問卦]「校正回歸」的定義以及數據上不合理之處

看板Gossiping作者 (小肥羊)時間3年前 (2021/05/23 09:28), 編輯推噓398(42527203)
留言655則, 448人參與, 3年前最新討論串1/4 (看更多)
再看了CDC跟雙北記者會後,想跟各位談談「校正回歸」的定義以及數據上不合理之處。 以下我會提出幾個問題,並從我手邊的資料提出一些想法,文長,不喜可以直接跳下去 看結論。 我想先簡單說一下我的背景,我剛好在美國念cs博士,資料分析是我其中之一的專長,對 於科學研究也還算略懂。又剛好碰上了紐約封城,也經歷了這段政府從認知到嚴重性、封 城、打疫苗、解封的過程(那時候每天都得看Cuomo的記者會)。我希望能從我所學的概 念與知識,跟各位討論以下問題。 Q:所以「校正回歸」的定義是什麼? 沒有定義。我認為這名詞99%是現在中央政府發明的。一個快速的檢驗方法是去GOOGLE 「 校正回歸 英文」或「校正回歸 研究」如果跳出來的都是些阿哩佈達的東西,那大概 就是沒有人在使用的玩意 (這邊先不談google 的權威性以及錯誤率,至少這方法在目前 一般狀況下都有很高的參考性)。 我再後來又看了雙北記者會跟陳時中的追加解釋 (ref. 1,2,3),大概得到的定義就是 「因為驗證檢驗結果的時間不夠,所以有一些試劑 驗證不完,只好之後處理完再補上數據」,這個時間不夠可能是key資料的時間不夠、報 到中央的時間不夠多、研究室辨識確診的時間不夠多...等等。 Q: 那「校正回歸」是新概念嗎? 不是,去年那麼多國家在做檢驗,他們也會遇到一樣的問題。 前面有些人文章提到的 「 testing backlog」(ref. 4,5) 就是很好的例子。backlog是指當要完成一件任務需 要做很多事情時間又不夠的時候,就挑優先度高的先完成。 簡單說,英國那邊的實驗室 說我們一天只能檢驗三萬筆試劑,你一天送三萬三千筆來,我們只能壓著三千筆以後驗 。但是每天都超收,壓的試劑就越來越多。所以要解決這問題,英國有幾天就把檢驗量 縮減,讓被壓著的試劑能驗完 (ref. 6)。 Q: 所以這個新名詞「校正回歸」,有什麼不好嗎? 有。 第一點,這名字爛透了。 「校正」是指把錯誤的東西改正回來。以上面的例子來 說,沒有一個是錯誤的阿,你早就知道你還有沒驗完的試劑,跟錯誤有什麼關係? 再來 ,「回歸」這個更扯,回歸是指調整函數的係數使得它可以逼近資料上的實際值。 請問 上面的例子哪一部分跟回歸有關係? 取名也是有學問的,是要讓人能直覺聯想到你在做 什麼,而不是把很多fancy的字湊在一起就行了,你以為是在寫武俠招式嗎? 第二點,它的定義十分模糊,甚至包山包海,只要還沒來的及統計完的,都可以之後補 上再說我是校正回歸。我認為當政府給出一個新名詞,最重要的就是要把定義說清楚, 讓白癡都能懂,而不是用術語解釋術語來把事情複雜化。 當大家都不知道你在說什麼, 每個人就可以有各自的解讀,然後鬧烘烘炒成一團,最後沒有人能聚焦在真正該討論, 檢討的問題上。 政府公告的對象是民眾,有十幾歲的年輕人,也有八十幾歲的老人,你 本來就要盡力讓每個人都懂,這樣所謂的假消息才沒有插針的空間。 Q: 既然會有這些辨識不完的例子,那麼,經過「校正回歸」後的數據有什麼不合理嗎? 有。第一,這個回報後的比例高到很怪。各位可以看CDC更正後增加的確診數量每天大概 是20%到30%的。如果合理懷疑沒被驗到的試劑是隨機抽樣的(也就是政府不是刻意隱瞞 疫情),那就代表每天有大概至少20%的試劑沒被驗到,這是很嚴重的事情,絕對不該拖 到這週週末才跟大家講。另外,政府還是沒說這些壓著的試劑是不是都驗完 了,會不會沒驗完的試劑其實比你我想像的多更多。更何況現在我們的檢驗數還很低就塞 車這麼嚴重,那以後呢? 去年紐約一開始Cuomo就很強調要提高檢驗能量,就是在處理這 種事情。第二,每天的工作量就這麼大,這段期間我也沒有看到增加了公務 人員還是實驗室人員。那怎麼週末就可以把這些壓著的試劑處理完了?要知道英國為了這 件事情可是在去年九月焦頭爛額了好幾周。這都是應該好好說明的部分,而不是,「因為 我們進步了,所以把塞車的地方都處理完了(ref: 1)。」把事情透明化出來,民眾驗完 是怎麼送實驗室的,實驗室一天驗多少,驗完怎麼報上去的,有多少數據還沒來的及處理 。你先公開,民眾才能討論、知道到底是哪邊效率不好、哪邊沒跟上,所以才會有部分的 檢驗數據被壓下來,你之後的東西才有公信力。不然你這次冒出一個「校正回歸」、下次 發明一個「卡方補正」又給你加些確診,這樣你之前做的統計還有意義嗎? 一樣,你政府 既然這麼重視打擊假消息,那為什麼還要留這麼大的模糊空間而不把事情透明化,不把事 情講清楚? ---- 結論 (TL:DR) -------- 「校正回歸」是政府發明的新名詞,並沒有任何專業性在裡面,也沒給予任何明 確定義。但是它所要描述的事情是的確存在的,概念也很簡單,就是因為中央無法來的及 消化完所有的檢驗數,所以壓到後面處理。問題是在於,回報的方式有很多瑕疵以及不透 明之處 (為什麼之前不講有壓者的檢驗數、為什麼名字亂取、為什麼現在還不公開還未確 認的檢驗數量)。 這種回報反而是傷害人民對政府的信任。這世界沒有那麼多專有名詞、 專有名詞的設計也是讓人更明白更直覺地了解事情,而不是複雜化。 當政府講的事情讓 民眾聽不懂、那絕對是政府的責任,政府更應該好好出來解釋清楚、而不是放任各種粉專 、FB文章、莫名專業人士出來各種自以為是的講解、作圖。那只是讓事情變得更亂、而防 疫最怕的就是「亂」。 ---- 補充資料 ----- 本篇文章不想揣測任何新觀念、只是從檯面上我認為比較「正規」的消息來源做整理後、 提出見解跟不合理之處。文中所用的參考資料附在下面。 1. CDC 5/21 記者會 https://www.youtube.com/watch?v=5oqunnTeh3Q
2. 北市 記者會 https://www.youtube.com/watch?v=G0hGom61H6E
3. 陳時中解釋校正回歸 https://tinyurl.com/ye7fmzn3 4. BBC報導英國 testing backlog https://www.bbc.com/news/uk-scotland-54149702 5. 對report backlog更詳盡的解釋 https://www.bmj.com/content/370/bmj.m3678 6. 英國考慮降低採檢量來對付backlog https://tinyurl.com/hpt8327z -- 「天下大亂,亂於大家把謊言養成習慣」 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.45.242.199 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1621733305.A.A38.html

05/23 09:29, 3年前 , 1F

05/23 09:29, 3年前 , 2F
國外會寫成721(+400),只有台灣寫成321+400
05/23 09:29, 2F

05/23 09:29, 3年前 , 3F
05/23 09:29, 3F

05/23 09:30, 3年前 , 4F
太長。TLDR應該擺前面
05/23 09:30, 4F

05/23 09:30, 3年前 , 5F
看到CS博士就end 你有牙醫專業嗎?
05/23 09:30, 5F

05/23 09:31, 3年前 , 6F
05/23 09:31, 6F

05/23 09:31, 3年前 , 7F

05/23 09:32, 3年前 , 8F
校正回歸是內部分析用,但外部不能用校正回歸的方式
05/23 09:32, 8F

05/23 09:32, 3年前 , 9F
雖然我同意你這個詞很爛,但你說的是迴歸的定義,不是
05/23 09:32, 9F

05/23 09:32, 3年前 , 10F
回歸,字不一樣意思不一樣,回歸是像回歸祖國那樣
05/23 09:32, 10F

05/23 09:32, 3年前 , 11F
不要那麼專業好不好
05/23 09:32, 11F

05/23 09:32, 3年前 , 12F
推你個認真討論
05/23 09:32, 12F

05/23 09:33, 3年前 , 13F
721(+400)大家可以接受,但不能接受321+400
05/23 09:33, 13F

05/23 09:33, 3年前 , 14F
所以我說文字遊戲馬上被批,請幫政府加油
05/23 09:33, 14F

05/23 09:34, 3年前 , 15F
同意,既然是今天發現的,那就算一次不是更清楚,後
05/23 09:34, 15F

05/23 09:34, 3年前 , 16F
面再說明就好
05/23 09:34, 16F

05/23 09:34, 3年前 , 17F
調查局來了 小心啊
05/23 09:34, 17F

05/23 09:35, 3年前 , 18F
已向調查局檢舉
05/23 09:35, 18F

05/23 09:35, 3年前 , 19F
這篇值300萬嗎
05/23 09:35, 19F

05/23 09:35, 3年前 , 20F
其實有公布未判斷量,但數量越來越多,所以之後又要再
05/23 09:35, 20F

05/23 09:35, 3年前 , 21F
校正幾次
05/23 09:35, 21F

05/23 09:35, 3年前 , 22F
聽ICRT新聞時,是說721,然後有解釋back flush....什麼的
05/23 09:35, 22F

05/23 09:36, 3年前 , 23F
不要以為你在國外就沒事 莫忘江南案
05/23 09:36, 23F

05/23 09:36, 3年前 , 24F
結論: 1.增加20~30%很不合理 2.突然可以檢完不合理
05/23 09:36, 24F

05/23 09:36, 3年前 , 25F
怕 擔心你300
05/23 09:36, 25F

05/23 09:37, 3年前 , 26F
yes
05/23 09:37, 26F

05/23 09:37, 3年前 , 27F
backlog中文應該沒有專有名詞才是
05/23 09:37, 27F

05/23 09:37, 3年前 , 28F
智商高的人自然聽得懂校正回歸 智商低的說什麼也聽不懂
05/23 09:37, 28F

05/23 09:37, 3年前 , 29F
小心 10萬美元
05/23 09:37, 29F

05/23 09:38, 3年前 , 30F
所以是確實有其需要的
05/23 09:38, 30F

05/23 09:38, 3年前 , 31F
現在匯率已經不只10萬了啦....
05/23 09:38, 31F

05/23 09:38, 3年前 , 32F
智商高XDDDDDDDDD那請問智商高的 校正回歸英文怎麼翻
05/23 09:38, 32F

05/23 09:38, 3年前 , 33F
33有說明,是行政人員加班KEY資料,才會導致一天爆量
05/23 09:38, 33F

05/23 09:39, 3年前 , 34F
至於為什麼星期五才KEY,因為明天放假,就是這麼簡單
05/23 09:39, 34F

05/23 09:39, 3年前 , 35F
科學很重定義阿
05/23 09:39, 35F

05/23 09:39, 3年前 , 36F
05/23 09:39, 36F

05/23 09:39, 3年前 , 37F
這樣作圖要怎麼反駁,給點空間吧大哥
05/23 09:39, 37F

05/23 09:40, 3年前 , 38F
05/23 09:40, 38F

05/23 09:40, 3年前 , 39F
專業推
05/23 09:40, 39F
還有 576 則推文
還有 1 段內文
05/23 14:23, 3年前 , 616F
忙來研究數據,看能看出什麼現象,這樣不好嗎?大家一起
05/23 14:23, 616F

05/23 14:23, 3年前 , 617F
出力啊,還是就是只能自己判讀,不準大家解讀
05/23 14:23, 617F

05/23 14:23, 3年前 , 618F
05/23 14:23, 618F

05/23 14:31, 3年前 , 619F
是突然驗完真的很怪
05/23 14:31, 619F

05/23 14:31, 3年前 , 620F
這篇講得超清楚 說沒內容的是自己校正回歸了嗎XD
05/23 14:31, 620F

05/23 14:35, 3年前 , 621F
承認了是個其他國家也會發生的問題,然後覺得名詞不合理
05/23 14:35, 621F

05/23 14:35, 3年前 , 622F
,就這樣?
05/23 14:35, 622F

05/23 14:37, 3年前 , 623F
要我就說校正啦,有新的data,圖就得再跑一遍,這個不是
05/23 14:37, 623F

05/23 14:37, 3年前 , 624F
做data scientists的日常生活?
05/23 14:37, 624F

05/23 14:39, 3年前 , 625F
博士快說說除了名詞還有哪裏不合理
05/23 14:39, 625F

05/23 14:39, 3年前 , 626F
還是你code review只會看變數命名對不對而已?
05/23 14:39, 626F

05/23 14:41, 3年前 , 627F
上面還一堆說這篇講的多有理,笑死
05/23 14:41, 627F

05/23 14:43, 3年前 , 628F
不然不要校正阿,直接灌進單日數據,然後你就看單日,不
05/23 14:43, 628F

05/23 14:43, 3年前 , 629F
看均線?
05/23 14:43, 629F

05/23 14:47, 3年前 , 630F
推 修飾美化無法解決問題 面對 接受 放下 解決他
05/23 14:47, 630F

05/23 14:49, 3年前 , 631F
05/23 14:49, 631F

05/23 14:55, 3年前 , 632F
05/23 14:55, 632F

05/23 15:20, 3年前 , 633F
推,重點不只是名詞吧,只糾結在這個的是不識字嗎XD
05/23 15:20, 633F

05/23 15:22, 3年前 , 634F
回歸不等於迴歸好嗎 頭好痛 一堆文盲
05/23 15:22, 634F

05/23 15:41, 3年前 , 635F
05/23 15:41, 635F

05/23 15:47, 3年前 , 636F
你換一個名字在PTT一樣是噓爆的
05/23 15:47, 636F

05/23 15:48, 3年前 , 637F
原來名字也不難懂
05/23 15:48, 637F

05/23 16:00, 3年前 , 638F
05/23 16:00, 638F

05/23 16:06, 3年前 , 639F
邏輯清楚
05/23 16:06, 639F

05/23 16:06, 3年前 , 640F
但講實話會被打成中共同路人 保重
05/23 16:06, 640F

05/23 16:36, 3年前 , 641F
05/23 16:36, 641F

05/23 19:04, 3年前 , 642F
05/23 19:04, 642F

05/23 21:18, 3年前 , 643F
你好認真
05/23 21:18, 643F

05/23 21:33, 3年前 , 644F
推清楚
05/23 21:33, 644F

05/23 23:01, 3年前 , 645F
05/23 23:01, 645F

05/23 23:48, 3年前 , 646F
!!
05/23 23:48, 646F

05/24 00:00, 3年前 , 647F
Counts adjusted retrospectively 勒?
05/24 00:00, 647F

05/24 11:53, 3年前 , 648F
恭喜 300萬
05/24 11:53, 648F

05/24 12:09, 3年前 , 649F
回歸校正四個字就假裝很專業其實內
05/24 12:09, 649F

05/24 12:09, 3年前 , 650F
容空洞啊
05/24 12:09, 650F

05/24 14:06, 3年前 , 651F
CS博的智商也不夠理解的概念啦,絕對沒
05/24 14:06, 651F

05/24 14:06, 3年前 , 652F
錯XDDD
05/24 14:06, 652F

05/26 08:57, 3年前 , 653F
這次疫情讓我了解世界很大 不是只有自己看
05/26 08:57, 653F

05/26 08:58, 3年前 , 654F
到那樣
05/26 08:58, 654F

05/26 09:03, 3年前 , 655F
文章代碼(AID): #1WgQ-veu (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1WgQ-veu (Gossiping)