Re: [問卦] 武漢肺炎也會數學?

看板Gossiping作者 (pulseaudio)時間4年前 (2020/02/07 03:15), 4年前編輯推噓5(6117)
留言24則, 8人參與, 4年前最新討論串8/12 (看更多)
1. 累加的數字本來就會趨近於某一個值。 若不信,你可以試著用亂數來驗證我上面這一句話。 舉例: 迴路19次:(以你提供的數據的樣本數為例) { 迴路N次: { A = A + 1 產生介於0到1之間的亂數x 若 x> 0.5 則 B = B + 1 } 印出 B/A } 即使你輸入的是亂數,印出來的 B/A 會越來越趨近於某個值。 隨機事件在累加之下本來就會趨近某一個值。 所以該數據趨近於2.1%一點都不奇怪。 除非條件改變,例如上面的x>0.5 在迴路一半變成 x>0.7之類的。 以這個武漢病毒數據例子為例就是 病毒擴散飽和了,或防堵產生效果了 此一類的條件改變,那時就會脫離2.1%。 2. 累加的數字不是獨立變量,下一個數字是前一個的累積。 舉個例子就是上面的程式,改成「印出B」。用累加的B值 做線性回歸,你會發現自然而然就會得到非常接近1的R^2。 不是獨立變量本做這一類分析是沒有意義的。更不要說去得到有 意義的結論。 你要是真的想檢驗數據的跳動是否合理,你應該檢驗每一天的 增加量,這才是獨立變量,而不是累加的量。畫出來是這樣: https://imgur.com/a/HSDqQQz 用上面的程式來說明就是在兩個迴路間 把 A和B都歸零, 這樣子每一個B都是獨立變量,數值的跳動也合理多了。 ※ 引述《hugoyo (阿佑)》之銘言: : ※ 引述《terrymoon (說好的幸福呢)》之銘言: : : 剛剛在FB看到的 : : https://i.imgur.com/bNLvEbB.jpg
: : 1/30 : : 170死/7821確診=2.1% : : 1/31 : : 213死/9800確診=2.1% : : 2/1 : : 259死/11880確診=2.1% : : 2/2 : : 304死/14401確診=2.1% : : 2/3 : : 361死/17238確診=2.1% : : 怎麼死亡率都剛好在2.1%上下徘徊? : 大概大概啦,他們公布的東西就是這樣 : 天數 日期 確診 累積確診 死亡 累積死亡 死亡率 : 1 1月18日 45 45 2 2 4.44% : 2 1月19日 17 62 0 2 3.23% : 3 1月20日 139 201 1 3 1.49% : 4 1月21日 17 218 0 3 1.38% : 5 1月22日 102 320 3 6 1.88% : 6 1月23日 223 543 11 17 3.13% : 7 1月24日 96 639 0 17 2.66% : 8 1月25日 717 1356 24 41 3.02% : 9 1月26日 677 2033 15 56 2.75% : 10 1月27日 711 2744 24 80 2.92% : 11 1月28日 1771 4515 26 106 2.35% : 12 1月29日 1459 5974 26 132 2.21% : 13 1月30日 1737 7711 38 170 2.20% : 14 1月31日 1981 9692 43 213 2.20% : 15 2月 1日 2102 11794 46 259 2.20% : 16 2月 2日 2590 14384 45 304 2.11% : 17 2月 3日 2829 17213 57 361 2.10% : 18 2月 4日 3235 20448 64 425 2.08% : 19 2月 5日 3887 24335 65 490 2.01% : 猜猜看明天是不是 2.00% 左右?? : 從一月底開始都穩穩地控制了,死亡率漸漸變低,這樣大家才會比較安心 : 那麼,明天會多少確診呢? 既然大家覺得數據都是Garbage,再怎麼分析都是Garbage out : 還是可以猜猜看明天的Garbage長什麼樣子呀~ : 不想太認真用分佈的模型來積分成error function : 用大家都能懂得多項式就好,抓個3次方。 : https://i.imgur.com/pqua02g.png
還蠻平的~ : https://i.imgur.com/ni4FgcQ.png
: 所以明天中國大概 確診 28297 人,增加 4046 人 : 死亡 566 人,增加 76 人 : 個人希望他們不要真的這樣玩數據。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.77.33.103 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1581016541.A.939.html

02/07 03:16, 4年前 , 1F
不是你不懂數學 是你不懂中共
02/07 03:16, 1F

02/07 03:16, 4年前 , 2F
跟著推
02/07 03:16, 2F

02/07 03:17, 4年前 , 3F
流行病學在跑模型好像84這樣算ㄉ欸
02/07 03:17, 3F

02/07 03:18, 4年前 , 4F
樓下用 AI 預測
02/07 03:18, 4F

02/07 03:19, 4年前 , 5F
請阿法狗玩一次瘟疫公司驗證看看
02/07 03:19, 5F

02/07 03:19, 4年前 , 6F
這些數據只是有紀錄的
02/07 03:19, 6F

02/07 03:23, 4年前 , 7F
統計或者生統是一個機率的概念 不是單純
02/07 03:23, 7F

02/07 03:23, 4年前 , 8F
數字或數學...只能說這個比例都剛好的機
02/07 03:23, 8F

02/07 03:24, 4年前 , 9F
其實問題是趨近有多準,也就是得出來的誤差
02/07 03:24, 9F

02/07 03:24, 4年前 , 10F
範圍符不符合自然的分佈 這也是每日增加的
02/07 03:24, 10F

02/07 03:24, 4年前 , 11F
獨立變數下去分析比較容易,例如每日增加量
02/07 03:24, 11F

02/07 03:24, 4年前 , 12F
率是高還低
02/07 03:24, 12F

02/07 03:24, 4年前 , 13F
假如都在1.9%到2.1%就不合理,或是嚴格遞減
02/07 03:24, 13F

02/07 03:24, 4年前 , 14F
就不合理 這個我之前檢測過了,沒有什麼異
02/07 03:24, 14F

02/07 03:24, 4年前 , 15F
樣 不過,要做通過這些方法的假數據也很簡
02/07 03:24, 15F

02/07 03:24, 4年前 , 16F
單,建個模型就好
02/07 03:24, 16F

02/07 03:25, 4年前 , 17F
但是這都是理論上的數據,在現實世界變數
02/07 03:25, 17F

02/07 03:25, 4年前 , 18F
我那個百分比指的是 死亡/確診
02/07 03:25, 18F

02/07 03:26, 4年前 , 19F
很大...比如政治影響、檢驗方法、檢驗或
02/07 03:26, 19F

02/07 03:26, 4年前 , 20F
醫療能量等等的因素...
02/07 03:26, 20F

02/07 03:31, 4年前 , 21F
其實這串的錯誤是在標題,病毒不符合數學才
02/07 03:31, 21F

02/07 03:31, 4年前 , 22F
值得懷疑
02/07 03:31, 22F

02/07 03:35, 4年前 , 23F
這些數據單看可能是符合數學的,值得分析的
02/07 03:35, 23F

02/07 03:35, 4年前 , 24F
是和中國外數據的關係
02/07 03:35, 24F
這無關模型,而是「累加的值的某一個比例趨近於某一個值」是否合理。 我的答案是 這是合理的: https://imgur.com/a/PR5lNiM ※ 編輯: pulseaudio (223.137.34.180 臺灣), 02/07/2020 11:10:29
文章代碼(AID): #1UF6NTav (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1UF6NTav (Gossiping)