[心得] 90000個UID樣本分析(轉載)
以下為轉載內容
========================================================================
首先聲明你不滿意又提神魔大戰的請你上一頁
原文:http://home.gamer.com.tw/creationDetail.php?sn=3091987
已獲屋主同意轉貼
首先我個人是看了這篇之後 決定了作一個大測試
http://forum.gamer.com.tw/C.php?page=1&bsn=23805&snA=507543
用了差不多2天的時間收集大量uid的單雙數據
結果如下:
http://truth.bahamut.com.tw/s01/201602/56f64ae4e9b8fb165fdf8edeefee10af.JPG
整合excel下載: https://drive.google.com/open?id=0B_iHq6425S9lemlqOGVCZW5uaFk
大致上其實就是雙方人數差不多 不過的確是uid雙數的人數稍稍高於單數的
根據數據就是雙數>單數 0.85%
這0.85%主要由uid 10,000,000 - uid 99,999,999所提供 (佔差異的 63.9%)
不過你可能會說這只不過是自然誤差 不是真的相差0.85%
我稍作計算 假設兩邊機率均等 90000個樣本做成0.85%的自然誤差大約機率多少
用的工具是wolfram-alpha的binomial probabilities widget
http://www.wolframalpha.com/widgets/view.jsp?id=226badd3f3410155b258766cca6002ea
公式就不列了 有興趣自己查cumulative binomial probabilities
http://truth.bahamut.com.tw/s01/201602/51fc05cafb689b27457433bc295f7b03.JPG
那代表自然誤差做成0.85%或以上的機率為0.102042*2=0.204084 即20.4%左右 5次發生一
次
所以更大機率就是由uid尾數checksum的公式關係造成的0.85%差距
而留意上表也看得到 雙>單的uid開頭 比單>雙的uid開頭多
以上沒說服力? 有可能我就是這麼雖中了20.4%?
那最有說服力是checksum的理據在下面
數據最令人在意的是 uid 10,000,000至99,999,999這組
當中單雙數據上有5%差異 10000個樣本生成5%
那麼雙方機率均等下 10000個樣本自然誤差做成5%的機率是多少?
http://truth.bahamut.com.tw/s01/201602/eee6d27d0090bc9e35b31fca2110162e.JPG
機率均等下 做成5%或以上的自然誤差的機率是0.75%*2=1.5% 很低機率了吧
所以尾數=checksum 只是大家還沒反譯到公式出來
也同時代表早期的checksum公式(uid 10,000,000至99,999,999區間)沒考慮到單雙人數分
配問題
亦即是說1000天的老玩家 雙數的 可是比 單數的多5%
捱到1000天的 就算無課大部份也有一定能力
而單雙人數最主要差距的來源就是在這1000天前的帳號
==============================================================================
至於套入神魔大戰會怎樣?
提醒 以下只是估算 只作參考 不喜勿噴
首先估算參與TGS玩家人數的可以參考這篇(留言比較重要) 我也懶得列式之類的了
http://forum.gamer.com.tw/Co.php?bsn=23805&sn=3015508
圖我也沒載 只能借用 所以先看那文跟留言吧
以下討論的也在於這個圖:
http://truth.bahamut.com.tw/s01/201602/5d2eb27c7fe04ef19f73d40fb47fb2cb.PNG
簡單點說 就是這種分數就代表有70000個至37萬個玩家參與
不算萬名的話假設大約平均分26000(考慮不是萬名的刷成就+大量1場玩家)
14萬參與人數是比較可能的
根據統計結果做成0.85%差異的話
即是說 69704 vs 70296 (70296/69704=1.00849...)
即相差592人
那考慮該圖情況 592人可以做成多少分差?
首100名 機率為 100/140000 平均分為假設200000
100-500名 機率為 400/140000 平均分為(139900+97800)/2=118500
500-1000名 機率為 500/140000 平均分為(97800+83600)/2=90700
1000-2000名 機率為 1000/140000 平均分為(83600+74200)/2=78900
2000-5000名 機率為 3000/140000 平均分為 (74200+64300)/2=69250
5000-8000名 機率為 3000/140000 平均分為 (64300+59900)/2=62100
8000-10000名 機率為2000/140000 平均分為 (59900+56100)/2=58000
10000名以外 機率為130000/140000 平均分為26000
592人分數的期望值= 592*[ (100/140000)*200000 + (400/140000)*118500 +
(500/140000)*90700 + (1000/140000)*78900 + (3000/140000)*69250 +
(3000/140000)*62100 + (2000/140000)*58000 + (130000/140000)*26000 = 592*29156
= 17260352
的確就算加上這分還是輸
如果你有熱身賽圖 也試試這樣算看看 我圖都沒載
但我想強調的是 正如上文所說
0.85%的差異主要來自uid 10,000,000 至 99,999,999的
這區間提供了63.9%的數據上的差異
這592人當中有60%左右的人是1000天的玩家機率不低
試問一個捱到1000天的老玩家 就算無課 可以差到去哪?
這組人真的平均只有26000-29156?
所以上面估計分差期望值只會更大
所以無可否認是不公平比賽
不過嘛 這些也只解釋到熱身賽
後面那幾天就算有8%加乘都輸的
只能說明「小部份」神族玩家因為前面不公平比賽輸的關係 士氣低落而放棄
隨便一刀切兩邊人 又沒有任何合理渠道鼓起士氣 (巴哈 fb也只有一小撮玩家用)
如果有渠道還好 有向心力在還有機會反敗為勝
MH真的不要搞這種活動了 雪球只會越滾越大 說真的 一面倒你賺到多少錢?
=============================================================================
有大大說要懶人包 我稍作嘗試
1. 經90000個樣本統計 uid尾數雙數>單數 約有0.85%差異
2. 在uid 10,000,000至99,999,999 區間中 雙數>單數的差異特別大 有5%
間接証明尾數=checksum
因為在數學上10000個樣本均等機率下 5%誤差是不太可能發生(約1.5%機率)
3. 其實uid雙數多於單數的差異來源也同時在這個區間 佔63.9%
即1000天左右的老玩家尾數雙數比單數多
4. 不考慮上面老玩家問題 uid checksum設計至少做成1700萬分差 如果加上老玩家問題
分差只會更多 所以本身就是不公平比賽
=============================================================================
(2016/2/6) 0952更新
其實我看完大家回覆
在這裡想強調一下這篇上面內容只是証明就算沒誤差存在
本身也會有的0.85%差異 還有老玩家人數差距
而老玩家會不會把這0.85%提升上至1%或以上的效果?
只要他們比全體平均分高17.6%就會這樣
0.0085*1.176=0.01
亦即以上面那圖為例 平均是26000-29156的話 1000天區間平均分是30588-34301就會發生
不過這的確只是屬於猜想部份而已
而這0.85%是checksum公式問題帶來單雙機率不均等所做成的的「差異」
早期更是沒考慮均分問題 因此差異特別大
其他因素或是無辦法避免的自然誤差亦沒有列入考慮
另外我一直所說的自然誤差所指的是 「無任何外在因素下、客觀條件情況下自然產生的
誤差」
例如就算你拋10萬次硬幣 兩邊機率雖均等 但也不能保證兩邊數據都是5萬
當中這個差距就是自然誤差
而這0.85%則是由外在因素「checksum公式」帶來的
實際差多少不知道其實不知道 還要看有沒有其他因素自然誤差或是外在因素影響下的差
異
因為checksum公式 導致單/雙機率不均等 不是50% vs 50%
而是49.788% vs 50.212% (50.212/49.788 = 1.0085)
那考慮一下自然誤差可以做成多少變化
那140000人情況下 產生1.5%或以上的誤差偏向雙數那邊的機率是多少?
先說一下 1.5%差異是 69479 vs 70521 ( 70521 / 69479=1.015)
http://truth.bahamut.com.tw/s01/201602/06665133f7c2d75f5566399189d3ab58.JPG
就11.6%機率 不高但還是有可能
而0.85%變成1.2%人數差距 則是26.11%機率
http://truth.bahamut.com.tw/s01/201602/38fbdbd3ef81fe28370a07b25b8e3011.JPG
而且我還不知道會不會有其他因素影響 有的話疊到上像熱身賽2.7%亦不奇怪
這篇只是以uid分配角度看而已
至於後面的賽果 只能說明「小部份」神族玩家放棄
例如只要有6%以上玩家放棄 就算8%加乘也彌補不了分數差距 (1.08*0.9337...=1.0085)
所以我是特別強調是「小部份」
最後歡迎轉載 加個來源就好的 謝謝
=============================================================================
來源:http://forum.gamer.com.tw/Co.php?bsn=23805&sn=3021936
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.222.5.79
※ 文章網址: https://www.ptt.cc/bbs/ToS/M.1454810949.A.9DB.html
推
02/07 10:09, , 1F
02/07 10:09, 1F
推
02/07 10:11, , 2F
02/07 10:11, 2F
→
02/07 10:12, , 3F
02/07 10:12, 3F
推
02/07 10:13, , 4F
02/07 10:13, 4F
推
02/07 10:13, , 5F
02/07 10:13, 5F
※ 編輯: playplayying (203.222.5.79), 02/07/2016 10:18:43
推
02/07 10:15, , 6F
02/07 10:15, 6F
推
02/07 10:15, , 7F
02/07 10:15, 7F
→
02/07 10:15, , 8F
02/07 10:15, 8F
推
02/07 10:15, , 9F
02/07 10:15, 9F
推
02/07 10:16, , 10F
02/07 10:16, 10F
→
02/07 10:16, , 11F
02/07 10:16, 11F
推
02/07 10:16, , 12F
02/07 10:16, 12F
推
02/07 10:17, , 13F
02/07 10:17, 13F
推
02/07 10:17, , 14F
02/07 10:17, 14F
推
02/07 10:21, , 15F
02/07 10:21, 15F
※ 編輯: playplayying (203.222.5.79), 02/07/2016 10:24:49
噓
02/07 10:21, , 16F
02/07 10:21, 16F
→
02/07 10:25, , 17F
02/07 10:25, 17F
※ 編輯: playplayying (203.222.5.79), 02/07/2016 10:27:46
推
02/07 10:27, , 18F
02/07 10:27, 18F
推
02/07 10:31, , 19F
02/07 10:31, 19F
推
02/07 10:32, , 20F
02/07 10:32, 20F
推
02/07 10:32, , 21F
02/07 10:32, 21F
→
02/07 10:32, , 22F
02/07 10:32, 22F
→
02/07 10:33, , 23F
02/07 10:33, 23F
→
02/07 10:35, , 24F
02/07 10:35, 24F
噓
02/07 10:35, , 25F
02/07 10:35, 25F
→
02/07 10:35, , 26F
02/07 10:35, 26F
推
02/07 10:37, , 27F
02/07 10:37, 27F
※ 編輯: playplayying (180.204.160.106), 02/07/2016 10:45:43
推
02/07 10:38, , 28F
02/07 10:38, 28F
→
02/07 10:38, , 29F
02/07 10:38, 29F
推
02/07 10:38, , 30F
02/07 10:38, 30F
→
02/07 10:39, , 31F
02/07 10:39, 31F
推
02/07 10:42, , 32F
02/07 10:42, 32F
→
02/07 10:45, , 33F
02/07 10:45, 33F
※ 編輯: playplayying (180.204.160.106), 02/07/2016 10:50:38
推
02/07 10:48, , 34F
02/07 10:48, 34F
還有 66 則推文
還有 6 段內文
→
02/07 13:53, , 101F
02/07 13:53, 101F
→
02/07 13:54, , 102F
02/07 13:54, 102F
→
02/07 14:00, , 103F
02/07 14:00, 103F
→
02/07 14:00, , 104F
02/07 14:00, 104F
推
02/07 14:04, , 105F
02/07 14:04, 105F
推
02/07 14:09, , 106F
02/07 14:09, 106F
推
02/07 14:11, , 107F
02/07 14:11, 107F
推
02/07 14:16, , 108F
02/07 14:16, 108F
推
02/07 14:18, , 109F
02/07 14:18, 109F
噓
02/07 14:27, , 110F
02/07 14:27, 110F
推
02/07 14:41, , 111F
02/07 14:41, 111F
→
02/07 14:42, , 112F
02/07 14:42, 112F
→
02/07 14:42, , 113F
02/07 14:42, 113F
推
02/07 15:40, , 114F
02/07 15:40, 114F
推
02/07 15:41, , 115F
02/07 15:41, 115F
→
02/07 15:45, , 116F
02/07 15:45, 116F
→
02/07 15:46, , 117F
02/07 15:46, 117F
→
02/07 15:48, , 118F
02/07 15:48, 118F
推
02/07 15:51, , 119F
02/07 15:51, 119F
→
02/07 16:01, , 120F
02/07 16:01, 120F
→
02/07 16:01, , 121F
02/07 16:01, 121F
噓
02/07 16:32, , 122F
02/07 16:32, 122F
推
02/07 16:53, , 123F
02/07 16:53, 123F
推
02/07 16:55, , 124F
02/07 16:55, 124F
推
02/07 16:56, , 125F
02/07 16:56, 125F
→
02/07 17:08, , 126F
02/07 17:08, 126F
噓
02/07 17:27, , 127F
02/07 17:27, 127F
噓
02/07 17:41, , 128F
02/07 17:41, 128F
→
02/07 17:43, , 129F
02/07 17:43, 129F
→
02/07 17:43, , 130F
02/07 17:43, 130F
→
02/07 17:48, , 131F
02/07 17:48, 131F
→
02/07 17:48, , 132F
02/07 17:48, 132F
→
02/07 17:50, , 133F
02/07 17:50, 133F
→
02/07 17:50, , 134F
02/07 17:50, 134F
推
02/07 17:53, , 135F
02/07 17:53, 135F
推
02/07 20:07, , 136F
02/07 20:07, 136F
推
02/07 21:57, , 137F
02/07 21:57, 137F
推
02/07 23:09, , 138F
02/07 23:09, 138F
推
02/08 15:16, , 139F
02/08 15:16, 139F
→
02/09 11:54, , 140F
02/09 11:54, 140F