Re: [新聞] 獨家/根本在誤導判斷!數學名師嗆:遊戲橘子的律師數學該重修
43
不可置信
為了方便說明,先來看一個抽三次的例子,一樣每次 10%
假定抽樣間獨立,前面是否抽中不影響後面抽中機率
也就是穩定的 10% 抽中,1-10% = 90% 沒抽中
因為是抽三次,所以可能有 4 種
沒抽中 90% x 90% x 90% = 72.9%
中 1次 10% x 90% x 90% 第一次中
+ 90% x 10% x 90% 二
+ 90% x 90% x 10% 三
= [C 3 取 1] 10%^1 x 90%^2
= 24.3%
中 2次 [C 3 取 2] 10%^2 x 90%^1 = 2.7%
中 3次 10%^3 = 0.1%
從上述可以發現到不同抽中次數的發生機率是有計算規律的
不用去考慮什麼中央極限定理就可以知道抽中幾次對應到的機率
規則上就是總抽 n 次,中 x 次,每次抽中機率 p,則發生機率為
[C n 取 x] p^x (1-p)^(n-x)
而所謂的檢定粗俗點講,就是在「假設正確」下,觀察到的樣本罕見到「不可置信」嗎?
好比前例只說我們就只抽三次,然後中了兩次,你覺得機率有點低「機率小於 10%」。
那我們就去把抽中兩次以下的機率通通加起來,看他是不是小到不可置信。
現在先把原文中的 5% 當作基準,如果機率加完後小於 5%,我們就覺得不可置信。
72.9% + 24.3% + 2.7% = 99.9%
這個數值表示高達 99.9%,表示說在「機率 10%」下,這件事還真有可能發生。
以這個案例來說,如果你問「機率大於 10%」嗎?
那就是 2.7% + 0.1% = 2.8%,會覺得「還真有可能大於 10%」,係因 2.8% < 5%
換言之,就是要注意「提問對應的算法」。
但無論如何,都跟什麼中央極限定理無關。
你可能會想問
「機率小於 10%」為啥是要去把「抽中兩次以下的機率加起來」
我就是想「抽中兩次以上的機率加起來」不可以嗎?
來看看一個例子,或許可以比較理解。
天鵝的啟示
這裡以提問「天鵝是不是都白的」作為說明案例。
我們考慮關於是不是白的兩種等價敘述
1. 所有天鵝都是白的
2. 有一隻天鵝不是白的。
這兩敘述中的任何一敘述被確認真假後,另一敘述的真假便立即得知。
來討論看看,這兩敘述分別在敘述為真的情況下,哪一敘述「比較容易確認」。
首先來看看「所有天鵝都是白的」這句話。
在這敘述為真的情況下,想要確認就要檢查全部天鵝。
一隻隻檢查,直到最後一隻天鵝檢查完,只要還剩下任何一隻,就不算結束。
然後發出,喔,天啊,真的都是白的,這樣才驗證完。
再來是第二句話「有一隻天鵝不是白的」。
一樣一隻隻,但只要檢查到發現某一隻不是白的即可停止。
很顯然的,第二個敘述相對容易被驗證為真。
由此可知,我們即便是想要知道「所有天鵝都是白的」。
也是藉由確認「有一隻天鵝不是白的」這敘述是錯誤的來得知「所有天鵝都是白的」。
當檢查到最後一隻天鵝時,也都沒有發現任何一隻不是白的,則第二個敘述錯誤,以此得
知第一個敘述正確。
在進行假設前提確認時,要以能否藉由資料否定假設,想要直接驗證假設一般是很困難的
。
在不考慮一些特殊情況下,「一般我們同意」假設相對假設外「小」很多。
換言之,「操作」否定假設以回應「主張」證明假設。
好比以前面討論抽中機率,就可能有預期外的「當機=沒抽中」這種情況。
(還是有哪家會出現當機給你算抽中的?重抽就不錯了吧??)
該怎麼推論
根據上述說明,你可能會疑惑前面抽卡說明裡「機率小於 10%」是去算抽中兩次以下的。
這其實是沒有區分「主張」與「操作」的問題。
從前面天鵝的啟示裡可以知道,主張「A 正確」則是以操作「觀察 A 不正確」回應。
「機率小於 10%」是在「操作」,也就是觀察「有多麼不正確」。
實際上該操作對應的主張是「機率大於等於 10%」
流程大概如下
主張「機率大於等於 10%」
=> 現象「高機率觀察到抽中足夠多」
=> 抽中很少代表主張錯誤 (罕見事件)
=> 計算抽中兩張以下機率 (假設前提正確下的計算)
=> 看起來「像」主張機率小於 10%
之所以會「像」是因為我們「先天知道」只有「A 與非 A」兩種情況。
好比前面天鵝的例子,你實際上不知道白天鵝以外會是啥顏色。
不會有什麼「天鵝黑到什麼程度」的觀察,壓根就不知道會不會是黃的、藍的、紅的,怎
麼會從「黑」去判斷 484
此外,在有更多資訊狀況下,我們能更明確地設定該如何去拒絕假設。
前面提及的 5%,具體而言係指「不小心把假設拒絕掉的機率」型一錯誤率 alpha。
但很多時候我們在意的可能其他,好比「假設不對,有真的拒絕假設」檢定力 beta。
如果知道各種判斷時的損益,則可以計算經濟收益矩陣。
假設正確 錯誤
拒絕假設 alpha;A beta;B
不拒絕 1-alpha;C 1-beta;D
A;B 表 機率;損益
則可以去操作最大化期望損益
A x alpha + B x beta + C x (1-alpha) + D x (1-beta)
以本抽卡案來說,就是可以考慮評估該案對未來的「社會損益」去代入 A,B,C,D。
(不過對某一造來說,可能只在乎假設正確/錯誤中某一個)
另外,beta 有的時候不知道,需要去估計評估。
考量經濟收益矩陣對於實際應用非常重要,只會問「Yes or No」會造成許多問題。
所以本案呢?
以此案來說橘子方應該是主張「機率大於等於 10%」
那操作就是計算抽 175 次中 4 次以下的機率
根據數感實驗室 https://bit.ly/3ZBWv63 計算,機率為「十萬分之 7」。
(我算好像是萬分之七啦)
即便考慮前後抽 475 次中 11 次,機率也非常之低。
我用 https://stattrek.com/online-calculator/binomial 算,機率顯示 0,應該是小
到不給算了。
若採用原文所約定的 5%,將其視為「不可置信」來說,算是拒絕該主張的。
不過我不知道具體法院有沒有約定什麼數字,或是有其他資訊之類的,無法作完整判斷。
好比說可能有約定說機率不獨立,抽中後會不中多少次之後才重置卡池之類的。
沒玩手遊,不是很確定契約怎麼寫的。
其他
從上述來說
抽卡本身就是可以用二項式分佈算
根本就不需要啥中央極限定理、抽樣次數、常態
--
[閒聊] 統計套利的配對交易策略:回顧與展望
I #1XwxemWa (Quant)
II #1Xxbw-nv (Quant)
III #1XxwEddS (Quant)
IV #1YRZo4j9 (Quant)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.23.34 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1673625896.A.B72.html
推
01/14 00:09,
1年前
, 1F
01/14 00:09, 1F
推
01/14 00:16,
1年前
, 2F
01/14 00:16, 2F
QAQ
噓
01/14 00:18,
1年前
, 3F
01/14 00:18, 3F
→
01/14 00:19,
1年前
, 4F
01/14 00:19, 4F
→
01/14 00:19,
1年前
, 5F
01/14 00:19, 5F
通通秀起來
噓
01/14 00:26,
1年前
, 6F
01/14 00:26, 6F
喔。
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:29:13
推
01/14 00:31,
1年前
, 7F
01/14 00:31, 7F
不行
信賴區間是描述「區間裡包含真實值的可能性」
你是以觀察到的值去展開區間,然後說「這個範圍裡大概有真實值」
即便區間裡包含 10% 也並沒有說明他是 10%
而若以不在區間來說不是 10%,則是先天預設非 10%。
畢竟你「將觀察值當成正確值去操作」
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:39:43
噓
01/14 00:40,
1年前
, 8F
01/14 00:40, 8F
→
01/14 00:40,
1年前
, 9F
01/14 00:40, 9F
→
01/14 00:40,
1年前
, 10F
01/14 00:40, 10F
所以我說「不需要」添加其他假設也能處理
→
01/14 00:40,
1年前
, 11F
01/14 00:40, 11F
然後漸進的話不用考慮常態吧?抽卡這例會收斂到常態ㄅ
→
01/14 00:42,
1年前
, 12F
01/14 00:42, 12F
→
01/14 00:42,
1年前
, 13F
01/14 00:42, 13F
工沙小 =.=
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:43:42
→
01/14 00:43,
1年前
, 14F
01/14 00:43, 14F
→
01/14 00:43,
1年前
, 15F
01/14 00:43, 15F
哀,題目沒有的假設你加進來還要說對喔
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:44:57
→
01/14 00:45,
1年前
, 16F
01/14 00:45, 16F
→
01/14 00:45,
1年前
, 17F
01/14 00:45, 17F
令人無言
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:46:44
→
01/14 00:45,
1年前
, 18F
01/14 00:45, 18F
即便我跟你說我在大學裡開過課也沒啥意義吧
看起來就沒有討論空間
說再多又有何用呢
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:48:46
噓
01/14 00:50,
1年前
, 19F
01/14 00:50, 19F
是是,您說的是,美國總統陛下。
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:50:38
→
01/14 00:50,
1年前
, 20F
01/14 00:50, 20F
→
01/14 00:51,
1年前
, 21F
01/14 00:51, 21F
阿災,可能缺老師吧 ^.^
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:30
→
01/14 00:51,
1年前
, 22F
01/14 00:51, 22F
晚安陛下
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:51:47
→
01/14 00:52,
1年前
, 23F
01/14 00:52, 23F
→
01/14 00:53,
1年前
, 24F
01/14 00:53, 24F
睡不著想我啊 <3
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:55:43
推
01/14 00:57,
1年前
, 25F
01/14 00:57, 25F
→
01/14 00:57,
1年前
, 26F
01/14 00:57, 26F
不知道,但真要說我研究統計檢定的。
然後,我想你是考慮了本文說的只有 A 與非 A = B 的情況。
實際上許多時候我覺得你的說法會有問題。
好比你的說法或許在抽卡上可以,但天鵝的例子不行。
這樣會在對立假設上用虛無假設展開某個東西。
或者說,你也沒具體說明你的意思,就單純衝出來一直噓而已。
看起來沒有討論的打算,我好像也沒法回什麼 484
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 00:59:28
→
01/14 00:57,
1年前
, 27F
01/14 00:57, 27F
多重檢定算統計嗎?還是說那算機率?
就當成我做機率的吧
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:03:29
推
01/14 01:03,
1年前
, 28F
01/14 01:03, 28F
→
01/14 01:03,
1年前
, 29F
01/14 01:03, 29F
我就說我只看到你衝出來噓而已齁
天知道你想表達什麼
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:04:54
推
01/14 01:06,
1年前
, 30F
01/14 01:06, 30F
→
01/14 01:06,
1年前
, 31F
01/14 01:06, 31F
cointegration test
你試試 @.@
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:06:52
推
01/14 01:08,
1年前
, 32F
01/14 01:08, 32F
→
01/14 01:08,
1年前
, 33F
01/14 01:08, 33F
他檢定空間的維度,應該是無法展開信賴區間的。
我是這樣認為啦
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:10:19
→
01/14 01:11,
1年前
, 34F
01/14 01:11, 34F
→
01/14 01:11,
1年前
, 35F
01/14 01:11, 35F
K-S test
檢定一個分布是不是常態
虛無假設「是常態分布」,對立假設「不是常態分布」
對立假設不具體時,我覺得不能展開信賴區間。
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:12:44
→
01/14 01:11,
1年前
, 36F
01/14 01:11, 36F
推
01/14 01:17,
1年前
, 37F
01/14 01:17, 37F
→
01/14 01:17,
1年前
, 38F
01/14 01:17, 38F
→
01/14 01:17,
1年前
, 39F
01/14 01:17, 39F
K-S test 初統必學好ㄇ =.=
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:18:22
→
01/14 01:18,
1年前
, 40F
01/14 01:18, 40F
→
01/14 01:18,
1年前
, 41F
01/14 01:18, 41F
推
01/14 01:21,
1年前
, 42F
01/14 01:21, 42F
我是沒聽過學生抱怨啦
基本上為了避免我前面說的那種主張與操作的誤會,都一定要講個對立假設模糊的。
然後順便說明 alpha beta 的關係在對立假設模糊時會怎麼變化。
不講 K-S test 就沒簡單的例子了吧?我是沒想到啦
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 01:24:53
→
01/14 01:22,
1年前
, 43F
01/14 01:22, 43F
→
01/14 02:17,
1年前
, 44F
01/14 02:17, 44F
講到這個我就森 77
之前 iPhone 買了 WolframAlpha 後,又給我推一個新的 Wolfram Alpha
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 02:27:19
推
01/14 02:37,
1年前
, 45F
01/14 02:37, 45F
→
01/14 02:37,
1年前
, 46F
01/14 02:37, 46F
→
01/14 02:48,
1年前
, 47F
01/14 02:48, 47F
→
01/14 02:51,
1年前
, 48F
01/14 02:51, 48F
用 beta 分布也太潮了吧~~
不過你用 beta 可當檢定嗎?
那個參數裡的 12 是觀察值不是嗎?
順帶一問,有辦法畫兩個 beta 的疊圖嗎
我試不出來 @.@
(雖然很顯然地 4/175 約等於 11/475)
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:20:44
推
01/14 03:12,
1年前
, 49F
01/14 03:12, 49F
→
01/14 03:12,
1年前
, 50F
01/14 03:12, 50F
→
01/14 03:12,
1年前
, 51F
01/14 03:12, 51F
→
01/14 03:13,
1年前
, 52F
01/14 03:13, 52F
→
01/14 03:13,
1年前
, 53F
01/14 03:13, 53F
→
01/14 03:13,
1年前
, 54F
01/14 03:13, 54F
→
01/14 03:19,
1年前
, 55F
01/14 03:19, 55F
→
01/14 03:19,
1年前
, 56F
01/14 03:19, 56F
→
01/14 03:21,
1年前
, 57F
01/14 03:21, 57F
→
01/14 03:21,
1年前
, 58F
01/14 03:21, 58F
謝謝說明
那個有無相關情況,因為他有間隔一段時間分開兩次抽,所以應該是可以主張一下存在惡
意之類的?(經告知後仍未改善)
應該可以用 f 大用的那個 beta 分布做檢定。
好像網路上沒人做這個,可能哪天我有空做個瞧瞧。
說到這個法庭爭論嘛
基本上確實是考量的點很多,即便是「有沒有錯」也都要衡量錯多少。
(有關刑事非告訴乃論的,事後態度更是一項重要參考資料)
好奇問個
有一項不符,且有造成損失,就算是有責了吧?
說實在地,我覺得板友也只在乎有或沒有而已
(判決符不符合民意,好像也都只是死刑不死刑,無期跟輕判??)
※ 編輯: Glamsight (1.164.23.34 臺灣), 01/14/2023 03:43:39
噓
01/14 07:09,
1年前
, 59F
01/14 07:09, 59F
→
01/14 07:10,
1年前
, 60F
01/14 07:10, 60F
95% 信賴 [47%, 53%],你要推論說勝選這樣?因為 51% 在裡面呢!
你怎麼不說敗選,49% 在裡面?
數字你當然是可以算,但不代表可以這樣用
真實值有信心落在裡面,就這樣
然後我想你 87% 是指「虛無假設」下的那個東西去做信賴區間 (相當給出拒絕域)
但前面我指的是觀察值去開的那個區間,十之八九你應該沒有看清楚前面討論
※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 09:22:34
推
01/14 18:12,
1年前
, 61F
01/14 18:12, 61F
三樓 lupin2401 說的那樣吧,就是想秀技
一下中央,一下又極限的,聽起來就夠中二
吃我的中央極限拳~~~
推
01/14 18:27,
1年前
, 62F
01/14 18:27, 62F
→
01/14 18:27,
1年前
, 63F
01/14 18:27, 63F
搞錯是無所謂,我也不見得對
但「我就對」、「聽我的」這種根本就沒打算討論的態度就...
※ 編輯: Glamsight (1.164.9.232 臺灣), 01/14/2023 19:31:48
討論串 (同標題文章)
完整討論串 (本文為第 2 之 3 篇):