Re: [棒球] MLB 數值分析
去年個人也曾經用程式來預測MLB的結果,
那時還曾經帶著自己弄的資料庫特別專門去請教統計學者,
當時詳細的情形我都有Po在版上,
有興趣的人可以看我去年4、5月的文章即可。
先來說最重要的結論:
這類棒球預測國外早就有人做過,
但從長期的結果論來看: 從來沒一個人真正準的 !
(指長期預測的正確率能夠達到60%以上)
而在經過那次的經驗後,
讓我更加體驗到棒球數據派大師Bill James其中的一項重要結論:
「我們總在習慣上與經驗上,
會把棒球的統計數據視為兩組人馬對抗所達到的成就,
但事實上並非如此!
這些統計數據在骨子裏其實是一群人與當時的情境結合後,
所產生的成就。」
在此來稍微解釋一下好了,
用數據來預測比賽結果其實有不少盲點 !
比如說一個能力值是90分的投手,
他在程式中表現出來的永遠都是90分的優質表現。
但在實際上一個賽揚級的投手可能突然會一局爆、
或是一個ERA 5以上的鳥投突然賽揚上身,完封了強隊。
還有比如像是「運氣值」這種隱藏的屬性:
一個90分的強投就算正常表現出優質先發,
但打線可能根本就不幫忙、
或是在關鍵時刻守備出現失誤、牛棚放火....等因素,
照樣沒辦法贏 !
但要如何才能知道每位選手今天的「運氣值」 !?
也不用說先發的運氣值好了,
大家想想看你自己今天的「運氣值」是多少、你自己知道嗎 !? @@
光是一個投手就有一堆不確定的因素,
更遑論全隊所有的球員了。
還有很多我不想打(ok ! 我承認我是懶的打),
只是說千萬不要盲目相信、甚至大注這些數據跑出來的結果:
如果短期內會感覺好像蠻準的,那是運氣而絕非數據。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.150.35
※ 文章網址: https://www.ptt.cc/bbs/SportLottery/M.1460732622.A.5EF.html
推
04/15 23:05, , 1F
04/15 23:05, 1F
推
04/15 23:06, , 2F
04/15 23:06, 2F
推
04/15 23:06, , 3F
04/15 23:06, 3F
推
04/15 23:16, , 4F
04/15 23:16, 4F
→
04/15 23:24, , 5F
04/15 23:24, 5F
推
04/15 23:45, , 6F
04/15 23:45, 6F
推
04/16 00:00, , 7F
04/16 00:00, 7F
→
04/16 00:19, , 8F
04/16 00:19, 8F
→
04/16 00:19, , 9F
04/16 00:19, 9F
→
04/16 00:20, , 10F
04/16 00:20, 10F
→
04/16 00:22, , 11F
04/16 00:22, 11F
→
04/16 00:22, , 12F
04/16 00:22, 12F
→
04/16 00:24, , 13F
04/16 00:24, 13F
→
04/16 00:25, , 14F
04/16 00:25, 14F
討論串 (同標題文章)