Re: [機統] 一個想不通的機率問題

看板Math作者 (會喵喵叫的大叔)時間12年前 (2013/12/17 23:15), 編輯推噓4(4027)
留言31則, 7人參與, 6年前最新討論串3/4 (看更多)
※ 引述《LPH66 (f0VMRgEBA)》之銘言: : 標題: Re: [機統] 一個想不通的機率問題 : 時間: Tue Dec 17 19:39:52 2013 : : : 這裡是數學板就拿個實際數字出來你自己解讀吧: : : 就以到目前歷史最短的今彩 539 來算 : : 開獎的總號碼數是 C(39,5) = 575757 : : 1~39 裡選 5 個不連號的選法是 C(39-5+1,5) = 324632 : : 也就是說有連號的種類數是 575757 - 324632 = 251125 : : 機率是 251125/575757≒43.62% : : 同樣也可以來算存在至少三連號 37*C(36,2) - 36*35 = 22050 種 : : 機率是 22050/575757≒3.83% : : 存在至少四連號則是 36*35 - 35 = 1225 種 : : 機率是 1225/575757≒0.213% : : 而實際上今彩 539 的歷史數據 : : 到昨天為止的 1971 期當中 (今天的還沒開 XD) : : 有 852 期存在連號 比率是 43.23% : : 有 72 期存在三連號 比率是 3.65% : : 有 4 期存在四連號 比率是 0.203% : : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 114.41.20.223 : → wohtp :能不能也提供一下理論值的標準差? 12/17 21:06 : → wohtp :晚餐吃太飽懶得動腦 XD 12/17 21:06 : → LPH66 :你真的晚餐吃太飽了...這只是機率不是分布啊 @@ 12/17 22:15 消化得差不多了,自己來動手一下。 每期出現連號的理論機率是43.62%,一共開了1971期,這就是N = 1971的二次分布嘛。 所以標準差是 43.62% / sqrt(1971) ~ 0.98% (還是分母應該要用1970?反正結果都一樣啦。) 如果用實際上開彩的結果來估計,一個標準差區間是 (43.23 ± 0.97) % 總之,兩邊都在彼此的一個標準差之內,的確是差不多。 : → MOONY135 :推有找數據來驗證的人 12/17 22:26 : → MOONY135 :結果這個機率還真的跟算得差不多XDDDD 12/17 22:27 問題就是,43.23% 跟 43.62% 是不是真的「差不多」?這要看標準差才能知道。 然後我們來看三連號和四連號。 三連號理論值: (3.83 ±0.086) % 四連號理論值: (0.213 ±0.005) % 實際開出的 3.65% 和 0.203% 都在一個標準差以外!尤其是三連號,少了大約 兩個標準差! 兩個標準差以外 => 自然發生的機率只有約 1.5% 樂透開獎真的會迴避連號嗎!? 別高興得太早。三連和四連分別開出72次跟7次,樣本非常少。 從開彩紀錄估計的機率: 三連號 (3.65 ±0.4) % 所以3.83還在取樣誤差裡面 四連號 (0.203 ±0.13) % 這誤差大到沒什麼好說的 所以就是樣本太少,取樣誤差太大,目前還不能斷言三連號和四連號有沒有 被特別迴避。 但二連號的出現頻率符合數字隨機的假設。 L大有興趣看看correlation嗎? XD -- 下列哪一隻鋼彈比較厲害? 1. 公式承認尺寸最小的鋼彈 2. 搭載高性能AI,還有越來越誇張的外掛武裝 3. 在希洽曾被水桶 4. 雖然不能飛,但是很會做菜(? 5. 我想不到第五隻 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.110.184.241

12/17 23:59, , 1F
喔是這玩意喔XD 確實三連跟四連樣本數太少
12/17 23:59, 1F

12/18 00:01, , 2F
correlation應該不用看吧 @@ 四連imply三連imply二連
12/18 00:01, 2F

12/18 00:01, , 3F
這樣 correlation 的意義好像不大 @@
12/18 00:01, 3F

12/18 00:02, , 4F
(其實小樣本數多少也有點故意, 這樣即使差的有點多
12/18 00:02, 4F

12/18 00:02, , 5F
表面上看起來還是可以很接近 (炸))
12/18 00:02, 5F
我說correlation是多期之間,例如說用五期、十七期、十九期前的數字 可以預測這一期會開什麼之類的。你找到了我們就發了! ※ 編輯: wohtp 來自: 123.110.184.241 (12/18 00:16)

12/18 01:41, , 6F
這種東西不是已經一堆人在做了嗎XD
12/18 01:41, 6F

12/18 01:41, , 7F
所謂的"拖牌"就是你在講的這個關連啊
12/18 01:41, 7F

12/18 10:30, , 8F
兩倍 "標準差" 並不算太離譜. 不過, 這 "樣本數" 應
12/18 10:30, 8F

12/18 10:31, , 9F
該是指資料的期數, 與幾連號的出現次數是兩回事, 因
12/18 10:31, 9F

12/18 10:32, , 10F
此並沒有 "樣本數太少" 的問題. 比較可能受影響的是:
12/18 10:32, 10F
差不多是同一回事啦。 嫌三連號出現72次太少,唯一的解決方法就是等他多開幾千期嘛。

12/18 10:33, , 11F
一般判斷是否有 "顯著異常" 採用 2倍標準差(標準誤)
12/18 10:33, 11F

12/18 10:34, , 12F
是基於常態近似, 像這種稀有事件, 樣本數需要非常大,
12/18 10:34, 12F

12/18 10:34, , 13F
才足以保證常態近似的適用性.
12/18 10:34, 13F

12/18 10:36, , 14F
如四連號機率 0.00213, 1971期的理論次數是 4.2次,
12/18 10:36, 14F

12/18 10:37, , 15F
常態近似有點不足. 也就是說: 即使實際出現次數與理
12/18 10:37, 15F

12/18 10:37, , 16F
論次數超過2倍標準差, 也尚難說有異常. 用 Poisson
12/18 10:37, 16F

12/18 10:38, , 17F
近似計算其 tail probability 比用常態近似好些.
12/18 10:38, 17F
啊,在PTT就稍微嗜血一點嘛 XD 我本行物理,都要求五個標準差的...

12/18 14:47, , 18F
除了連號 還有特殊連號或跳號 ex. 2 4 6 8 10 12
12/18 14:47, 18F

12/18 14:49, , 19F
ex. 4 8 12 16 20 ex. 5 10 15 20 25 ex.2 12 22 32.
12/18 14:49, 19F

12/18 14:51, , 20F
是不是等我把這些特殊組合都刪除 就
12/18 14:51, 20F

12/18 16:12, , 21F
推yhliu的講解
12/18 16:12, 21F
※ 編輯: wohtp 來自: 123.110.184.241 (12/18 16:39)

12/18 16:25, , 22F
有個笨問題 請問二次分布長怎樣...
12/18 16:25, 22F

12/18 16:27, , 23F
>silent 你可以看到單算二連就佔去一半了,
12/18 16:27, 23F

12/18 16:28, , 24F
如果你還把那些特殊連號刪去我想剩下的應該不到三成
12/18 16:28, 24F

12/18 16:29, , 25F
過往數據分析會告訴你這麼一來中獎率也會剩下三成
12/18 16:29, 25F

12/18 16:30, , 26F
那這種狀況值不值得你去投資就自己研究吧
12/18 16:30, 26F

12/18 16:32, , 27F
>MOONY 那個東西好像是叫做二項式分布的樣子 XD
12/18 16:32, 27F

12/18 16:33, , 28F
也許是 wohtp 記錯名字了吧
12/18 16:33, 28F

12/18 16:37, , 29F
我是覺得標準差好像算得很怪...湊不起來
12/18 16:37, 29F

01/02 15:37, 7年前 , 30F
correlation https://daxiv.com
01/02 15:37, 30F

07/07 11:43, 6年前 , 31F
如果你還把那些特殊連號 https://muxiv.com
07/07 11:43, 31F
文章代碼(AID): #1Ii6gAua (Math)
討論串 (同標題文章)
文章代碼(AID): #1Ii6gAua (Math)