Re: [新聞] 獨家/根本在誤導判斷!數學名師嗆:遊戲橘子的律師數學該重修

看板Gossiping作者 (安穩殘憶)時間1年前 (2023/01/14 00:04), 1年前編輯推噓8(13545)
留言63則, 11人參與, 1年前最新討論串2/3 (看更多)
43 不可置信 為了方便說明,先來看一個抽三次的例子,一樣每次 10% 假定抽樣間獨立,前面是否抽中不影響後面抽中機率 也就是穩定的 10% 抽中,1-10% = 90% 沒抽中 因為是抽三次,所以可能有 4 種 沒抽中 90% x 90% x 90% = 72.9% 中 1次 10% x 90% x 90% 第一次中 + 90% x 10% x 90% 二 + 90% x 90% x 10% 三 = [C 3 取 1] 10%^1 x 90%^2 = 24.3% 中 2次 [C 3 取 2] 10%^2 x 90%^1 = 2.7% 中 3次 10%^3 = 0.1% 從上述可以發現到不同抽中次數的發生機率是有計算規律的 不用去考慮什麼中央極限定理就可以知道抽中幾次對應到的機率 規則上就是總抽 n 次,中 x 次,每次抽中機率 p,則發生機率為 [C n 取 x] p^x (1-p)^(n-x) 而所謂的檢定粗俗點講,就是在「假設正確」下,觀察到的樣本罕見到「不可置信」嗎? 好比前例只說我們就只抽三次,然後中了兩次,你覺得機率有點低「機率小於 10%」。 那我們就去把抽中兩次以下的機率通通加起來,看他是不是小到不可置信。 現在先把原文中的 5% 當作基準,如果機率加完後小於 5%,我們就覺得不可置信。 72.9% + 24.3% + 2.7% = 99.9% 這個數值表示高達 99.9%,表示說在「機率 10%」下,這件事還真有可能發生。 以這個案例來說,如果你問「機率大於 10%」嗎? 那就是 2.7% + 0.1% = 2.8%,會覺得「還真有可能大於 10%」,係因 2.8% < 5% 換言之,就是要注意「提問對應的算法」。 但無論如何,都跟什麼中央極限定理無關。 你可能會想問 「機率小於 10%」為啥是要去把「抽中兩次以下的機率加起來」 我就是想「抽中兩次以上的機率加起來」不可以嗎? 來看看一個例子,或許可以比較理解。 天鵝的啟示 這裡以提問「天鵝是不是都白的」作為說明案例。 我們考慮關於是不是白的兩種等價敘述 1. 所有天鵝都是白的 2. 有一隻天鵝不是白的。 這兩敘述中的任何一敘述被確認真假後,另一敘述的真假便立即得知。 來討論看看,這兩敘述分別在敘述為真的情況下,哪一敘述「比較容易確認」。 首先來看看「所有天鵝都是白的」這句話。 在這敘述為真的情況下,想要確認就要檢查全部天鵝。 一隻隻檢查,直到最後一隻天鵝檢查完,只要還剩下任何一隻,就不算結束。 然後發出,喔,天啊,真的都是白的,這樣才驗證完。 再來是第二句話「有一隻天鵝不是白的」。 一樣一隻隻,但只要檢查到發現某一隻不是白的即可停止。 很顯然的,第二個敘述相對容易被驗證為真。 由此可知,我們即便是想要知道「所有天鵝都是白的」。 也是藉由確認「有一隻天鵝不是白的」這敘述是錯誤的來得知「所有天鵝都是白的」。 當檢查到最後一隻天鵝時,也都沒有發現任何一隻不是白的,則第二個敘述錯誤,以此得 知第一個敘述正確。 在進行假設前提確認時,要以能否藉由資料否定假設,想要直接驗證假設一般是很困難的 。 在不考慮一些特殊情況下,「一般我們同意」假設相對假設外「小」很多。 換言之,「操作」否定假設以回應「主張」證明假設。 好比以前面討論抽中機率,就可能有預期外的「當機=沒抽中」這種情況。 (還是有哪家會出現當機給你算抽中的?重抽就不錯了吧??) 該怎麼推論 根據上述說明,你可能會疑惑前面抽卡說明裡「機率小於 10%」是去算抽中兩次以下的。 這其實是沒有區分「主張」與「操作」的問題。 從前面天鵝的啟示裡可以知道,主張「A 正確」則是以操作「觀察 A 不正確」回應。 「機率小於 10%」是在「操作」,也就是觀察「有多麼不正確」。 實際上該操作對應的主張是「機率大於等於 10%」 流程大概如下 主張「機率大於等於 10%」 => 現象「高機率觀察到抽中足夠多」 => 抽中很少代表主張錯誤 (罕見事件) => 計算抽中兩張以下機率 (假設前提正確下的計算) => 看起來「像」主張機率小於 10% 之所以會「像」是因為我們「先天知道」只有「A 與非 A」兩種情況。 好比前面天鵝的例子,你實際上不知道白天鵝以外會是啥顏色。 不會有什麼「天鵝黑到什麼程度」的觀察,壓根就不知道會不會是黃的、藍的、紅的,怎 麼會從「黑」去判斷 484 此外,在有更多資訊狀況下,我們能更明確地設定該如何去拒絕假設。 前面提及的 5%,具體而言係指「不小心把假設拒絕掉的機率」型一錯誤率 alpha。 但很多時候我們在意的可能其他,好比「假設不對,有真的拒絕假設」檢定力 beta。 如果知道各種判斷時的損益,則可以計算經濟收益矩陣。 假設正確 錯誤 拒絕假設 alpha;A beta;B 不拒絕 1-alpha;C 1-beta;D A;B 表 機率;損益 則可以去操作最大化期望損益 A x alpha + B x beta + C x (1-alpha) + D x (1-beta) 以本抽卡案來說,就是可以考慮評估該案對未來的「社會損益」去代入 A,B,C,D。 (不過對某一造來說,可能只在乎假設正確/錯誤中某一個) 另外,beta 有的時候不知道,需要去估計評估。 考量經濟收益矩陣對於實際應用非常重要,只會問「Yes or No」會造成許多問題。 所以本案呢? 以此案來說橘子方應該是主張「機率大於等於 10%」 那操作就是計算抽 175 次中 4 次以下的機率 根據數感實驗室 https://bit.ly/3ZBWv63 計算,機率為「十萬分之 7」。 (我算好像是萬分之七啦) 即便考慮前後抽 475 次中 11 次,機率也非常之低。 我用 https://stattrek.com/online-calculator/binomial 算,機率顯示 0,應該是小 到不給算了。 若採用原文所約定的 5%,將其視為「不可置信」來說,算是拒絕該主張的。 不過我不知道具體法院有沒有約定什麼數字,或是有其他資訊之類的,無法作完整判斷。 好比說可能有約定說機率不獨立,抽中後會不中多少次之後才重置卡池之類的。 沒玩手遊,不是很確定契約怎麼寫的。 其他 從上述來說 抽卡本身就是可以用二項式分佈算 根本就不需要啥中央極限定理、抽樣次數、常態 -- [閒聊] 統計套利的配對交易策略:回顧與展望 I #1XwxemWa (Quant) II #1Xxbw-nv (Quant) III #1XxwEddS (Quant) IV #1YRZo4j9 (Quant) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.23.34 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1673625896.A.B72.html

01/14 00:09, 1年前 , 1F
謝謝老師!
01/14 00:09, 1F

01/14 00:16, 1年前 , 2F
你很認真可是我看不懂推一下好ㄌ
01/14 00:16, 2F
QAQ

01/14 00:18, 1年前 , 3F
讀到大學就是要秀
01/14 00:18, 3F

01/14 00:19, 1年前 , 4F
不然小學幾何題目 還在用小學算法會被
01/14 00:19, 4F

01/14 00:19, 1年前 , 5F
01/14 00:19, 5F
通通秀起來

01/14 00:26, 1年前 , 6F
囉哩八唆 不要玩就好
01/14 00:26, 6F
喔。 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:29:13

01/14 00:31, 1年前 , 7F
用信賴區間這個可以嗎?
01/14 00:31, 7F
不行 信賴區間是描述「區間裡包含真實值的可能性」 你是以觀察到的值去展開區間,然後說「這個範圍裡大概有真實值」 即便區間裡包含 10% 也並沒有說明他是 10% 而若以不在區間來說不是 10%,則是先天預設非 10%。 畢竟你「將觀察值當成正確值去操作」 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:39:43

01/14 00:40, 1年前 , 8F
欸你根本張飛打岳飛,你用機率算別人用
01/14 00:40, 8F

01/14 00:40, 1年前 , 9F
t檢定算,你不用中央極限定理別人必須
01/14 00:40, 9F

01/14 00:40, 1年前 , 10F
要用呀,t檢定的基本假定不就有母群常
01/14 00:40, 10F
所以我說「不需要」添加其他假設也能處理

01/14 00:40, 1年前 , 11F
態?
01/14 00:40, 11F
然後漸進的話不用考慮常態吧?抽卡這例會收斂到常態ㄅ

01/14 00:42, 1年前 , 12F
然後信賴區間和假設檢定根本是一題兩面
01/14 00:42, 12F

01/14 00:42, 1年前 , 13F
好嗎···
01/14 00:42, 13F
工沙小 =.= ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:43:42

01/14 00:43, 1年前 , 14F
你不需要別人需要,結果你說人家說錯,
01/14 00:43, 14F

01/14 00:43, 1年前 , 15F
這就是算法不同需要的假定也不同而已
01/14 00:43, 15F
哀,題目沒有的假設你加進來還要說對喔 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:44:57

01/14 00:45, 1年前 , 16F
你連信賴區間和假設檢定是一體兩面都不
01/14 00:45, 16F

01/14 00:45, 1年前 , 17F
知道,笑死,初統重修吧
01/14 00:45, 17F
令人無言 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:46:44

01/14 00:45, 1年前 , 18F
哀啥?被打爆臉回不了話?
01/14 00:45, 18F
即便我跟你說我在大學裡開過課也沒啥意義吧 看起來就沒有討論空間 說再多又有何用呢 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:48:46

01/14 00:50, 1年前 , 19F
喔是喔,我還說我是美國總統咧
01/14 00:50, 19F
是是,您說的是,美國總統陛下。 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:50:38

01/14 00:50, 1年前 , 20F
信賴區間和假設檢定之間的關係都搞不懂
01/14 00:50, 20F

01/14 00:51, 1年前 , 21F
,大學怎麼開課的?
01/14 00:51, 21F
阿災,可能缺老師吧 ^.^ ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:30

01/14 00:51, 1年前 , 22F
你可以退下了,跪安
01/14 00:51, 22F
晚安陛下 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:47

01/14 00:52, 1年前 , 23F
然後總統會稱作閣下不會稱作陛下
01/14 00:52, 23F

01/14 00:53, 1年前 , 24F
連國文似乎都不行,我美國人都比你強
01/14 00:53, 24F
睡不著想我啊 <3 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:55:43

01/14 00:57, 1年前 , 25F
你可能是機率強但統計還好吧,我認真的
01/14 00:57, 25F

01/14 00:57, 1年前 , 26F
01/14 00:57, 26F
不知道,但真要說我研究統計檢定的。 然後,我想你是考慮了本文說的只有 A 與非 A = B 的情況。 實際上許多時候我覺得你的說法會有問題。 好比你的說法或許在抽卡上可以,但天鵝的例子不行。 這樣會在對立假設上用虛無假設展開某個東西。 或者說,你也沒具體說明你的意思,就單純衝出來一直噓而已。 看起來沒有討論的打算,我好像也沒法回什麼 484 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:59:28

01/14 00:57, 1年前 , 27F
我賭你就算真的有開課,也不會是開統計
01/14 00:57, 27F
多重檢定算統計嗎?還是說那算機率? 就當成我做機率的吧 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:03:29

01/14 01:03, 1年前 , 28F
都研究到多重檢定應該是厲害的,那怎麼
01/14 01:03, 28F

01/14 01:03, 1年前 , 29F
連信賴區間和假設檢定的關係都不知道?
01/14 01:03, 29F
我就說我只看到你衝出來噓而已齁 天知道你想表達什麼 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:04:54

01/14 01:06, 1年前 , 30F
好了啦,有什麼是假設檢定能做然後信賴
01/14 01:06, 30F

01/14 01:06, 1年前 , 31F
區間不能做的?說來聽聽。別硬凹了
01/14 01:06, 31F
cointegration test 你試試 @.@ ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:06:52

01/14 01:08, 1年前 , 32F
這什麼啦,美國總統才不會這麼難的,我
01/14 01:08, 32F

01/14 01:08, 1年前 , 33F
只管大事好嗎
01/14 01:08, 33F
他檢定空間的維度,應該是無法展開信賴區間的。 我是這樣認為啦 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:10:19

01/14 01:11, 1年前 , 34F
你不能說些t檢定z檢定簡單一點的嗎?我
01/14 01:11, 34F

01/14 01:11, 1年前 , 35F
美國總統哪有時間管你這些,我不是不會
01/14 01:11, 35F
K-S test 檢定一個分布是不是常態 虛無假設「是常態分布」,對立假設「不是常態分布」 對立假設不具體時,我覺得不能展開信賴區間。 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:12:44

01/14 01:11, 1年前 , 36F
我是怕其他人聽不懂好嗎?
01/14 01:11, 36F

01/14 01:17, 1年前 , 37F
這又是我不是不會我怕別人不懂的檢定,
01/14 01:17, 37F

01/14 01:17, 1年前 , 38F
你是不是不會z、t檢定呀,看來我覺得z
01/14 01:17, 38F

01/14 01:17, 1年前 , 39F
、t檢定才是統計最精華的部分
01/14 01:17, 39F
K-S test 初統必學好ㄇ =.= ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:18:22

01/14 01:18, 1年前 , 40F
好啦對不起我錯了,美國總統的位子還是
01/14 01:18, 40F

01/14 01:18, 1年前 , 41F
讓賢給你
01/14 01:18, 41F

01/14 01:21, 1年前 , 42F
不過K-S檢定初統教,這老師也太狠了
01/14 01:21, 42F
我是沒聽過學生抱怨啦 基本上為了避免我前面說的那種主張與操作的誤會,都一定要講個對立假設模糊的。 然後順便說明 alpha beta 的關係在對立假設模糊時會怎麼變化。 不講 K-S test 就沒簡單的例子了吧?我是沒想到啦 ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:24:53

01/14 01:22, 1年前 , 43F
公式背的起來就阿彌陀佛了
01/14 01:22, 43F

01/14 02:17, 1年前 , 44F
wolfram alpha 是好用的計算機
01/14 02:17, 44F
講到這個我就森 77 之前 iPhone 買了 WolframAlpha 後,又給我推一個新的 Wolfram Alpha ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 02:27:19

01/14 02:37, 1年前 , 45F
寫得真好 半夜睡不著看剛剛好 文組也
01/14 02:37, 45F

01/14 02:37, 1年前 , 46F
看得很開心
01/14 02:37, 46F

01/14 02:48, 1年前 , 47F

01/14 02:51, 1年前 , 48F
我只有在用網頁版的0.0
01/14 02:51, 48F
用 beta 分布也太潮了吧~~ 不過你用 beta 可當檢定嗎? 那個參數裡的 12 是觀察值不是嗎? 順帶一問,有辦法畫兩個 beta 的疊圖嗎 我試不出來 @.@ (雖然很顯然地 4/175 約等於 11/475) ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:20:44

01/14 03:12, 1年前 , 49F
回來留言下,因為法庭上雙方是在爭論
01/14 03:12, 49F

01/14 03:12, 1年前 , 50F
有無違反契約精神,其中包含但不限於
01/14 03:12, 50F

01/14 03:12, 1年前 , 51F
經營方式、過去有無相關狀況、事後有
01/14 03:12, 51F

01/14 03:13, 1年前 , 52F
無恰當反應等;數學模型是否正確只是
01/14 03:13, 52F

01/14 03:13, 1年前 , 53F
其中需要考慮的一部分,不完全能證明
01/14 03:13, 53F

01/14 03:13, 1年前 , 54F
什麼,才會出現數學老師怒噴的情況
01/14 03:13, 54F

01/14 03:19, 1年前 , 55F
簡單來說,雖然主張是抽卡本身有問題
01/14 03:19, 55F

01/14 03:19, 1年前 , 56F
,但法庭爭論上不僅僅只討論這個主張
01/14 03:19, 56F

01/14 03:21, 1年前 , 57F
處罰是因為違反契約精神,不是因為行
01/14 03:21, 57F

01/14 03:21, 1年前 , 58F
為與僅僅一句話不符
01/14 03:21, 58F
謝謝說明 那個有無相關情況,因為他有間隔一段時間分開兩次抽,所以應該是可以主張一下存在惡 意之類的?(經告知後仍未改善) 應該可以用 f 大用的那個 beta 分布做檢定。 好像網路上沒人做這個,可能哪天我有空做個瞧瞧。 說到這個法庭爭論嘛 基本上確實是考量的點很多,即便是「有沒有錯」也都要衡量錯多少。 (有關刑事非告訴乃論的,事後態度更是一項重要參考資料) 好奇問個 有一項不符,且有造成損失,就算是有責了吧? 說實在地,我覺得板友也只在乎有或沒有而已 (判決符不符合民意,好像也都只是死刑不死刑,無期跟輕判??) ※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:43:39

01/14 07:09, 1年前 , 59F
那為什麼民調會做信賴區間
01/14 07:09, 59F

01/14 07:10, 1年前 , 60F
民調可以,抽卡不行?
01/14 07:10, 60F
95% 信賴 [47%, 53%],你要推論說勝選這樣?因為 51% 在裡面呢! 你怎麼不說敗選,49% 在裡面? 數字你當然是可以算,但不代表可以這樣用 真實值有信心落在裡面,就這樣 然後我想你 87% 是指「虛無假設」下的那個東西去做信賴區間 (相當給出拒絕域) 但前面我指的是觀察值去開的那個區間,十之八九你應該沒有看清楚前面討論 ※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 09:22:34

01/14 18:12, 1年前 , 61F
我也搞不清楚幹嘛中央極限定理
01/14 18:12, 61F
三樓 lupin2401 說的那樣吧,就是想秀技 一下中央,一下又極限的,聽起來就夠中二 吃我的中央極限拳~~~

01/14 18:27, 1年前 , 62F
辛苦您了 您講的是最標準的通例,一堆用慣
01/14 18:27, 62F

01/14 18:27, 1年前 , 63F
例的想打臉你,想必一定回應的很無奈 XD
01/14 18:27, 63F
搞錯是無所謂,我也不見得對 但「我就對」、「聽我的」這種根本就沒打算討論的態度就... ※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 19:31:48
文章代碼(AID): #1ZmO4ejo (Gossiping)
文章代碼(AID): #1ZmO4ejo (Gossiping)