[討論] 德州條子的歷史級鐵壁:一分差比賽
不要看到鐵壁就興奮的點進來看有沒有短裙啊各位(?
德州遊騎兵目前為止83W57L,全大聯盟戰績第二,僅次於今年一飛沖天的小熊,
但是開季的時候戰績大概沒有人想得到,看一下到目前為止的美西季後賽機率,
http://i.imgur.com/PRRkUL9.png
(from FG),開季還被看雖墊底。
再提供另外一個數字,今年他們的Pythagorean Win-Loss[註一] 為 72-68
跟實際勝場勝差來到了十一場,曾經有過這樣表現的季後賽隊伍,近十年來只有
2012的金鶯(93-69, pyth W-L 82-80, 2012 AL Wild Card),
以及2007的響尾蛇(90-72, pyth W-L 79-83 2007 NL West 1st),
超出畢氏勝率很多的原因,假設不懂數學的話,直觀上的猜測就是:
贏的分數不多,於是一分差比賽是一個值得參考的點。
今年的條子跟陳偉殷到美國第一年的金鶯,都有一個歷史級的紀錄:
一分差比賽的勝率
在今年以前,2012金鶯的一分差比賽 為29-9 76.3%的勝率,為史上第一,
而條子到目前為止已經是30-9更是超越了金鶯的紀錄。
可是這個表現到底是運氣?還是實力與技術?
(雖然我在數據上很不喜歡用運氣這個字,但實際看球肯定感受得到。)
在看數據之前先喚起各位的回憶,畢竟那時候開始就變成民視/ESPN金鶯台,有很多比賽看
Buck Showalter一直是一個以善於調度,與掌握牛棚時機的教練,
近幾年來也讓金鶯都是以鐵牛著稱,
就算是看球的印象派,也可以發現inherited runners常常回不來。
近年的金鶯防守都很強悍,而當年的牛棚有蚵嗲,以及年度救援王後來爆炸的金江嬸。
在當時金鶯創下歷史的時候,就有人提出相關的論點[註二],
這裡用logit model跑了07-11年的一分差賽事,模型裡面還放了一堆變數像是park factor,
但模型解釋中,只有IsoP,RPs' K/9 & RPs' BB/9有顯著,其中RP的能力很直觀,
但IsoP的顯著性大於我們觀念中可以造成對手壓力與不確定因素的擊球率與保送率,
甚至防守跟跑壘也都不那麼重要。
(當然,去年的World Series大家看見過了,那所謂的皇家靈氣就是不確定因素)
再來他把同一個模型拿去與一分差以上的比賽做比較,可以發現後援投手在一分差比賽
的影響大於一分差以上的比賽如下圖:
http://i.imgur.com/NCdVu8u.jpg
這樣的結果的確make sense,而且看到保送在一分差的負面影響比起一分差以上更明顯。
的確,這三樣東西也是當時金鶯隊強項,只是模型預測出來的勝率,金鶯在一分差的
勝率為64.7%,但實際上我們看到了一個歷史級的存在,76.3%,好吧,剩下來的部分,
就只好交給良好的總教練技術來做解釋了lol
回到條子,目前為止,條子的得分差為+21,在一週前Fangraphs預測球季只會有84勝,
而現在他們已經接近這個數字,在季末要贏下AL West 1st並且超過90勝也不是太大問題。
原因就出在於他們優異的一分差賽事表現,即使同區的太色人勝分差來的更多。
ok,先暫停一下,條子的牛棚算強嗎?雖然在五月中拔掉了Tolleson之後,
可以看到球隊戰績節節高昇,但是球隊牛棚的BB%中段班,K%甚至倒數,
(畢竟牛棚屬性都不是三振高手)
雖然團隊的SV是聯盟並列第一,但是ERA也好WAR也好等等數據,都是後面數比較快,
怎麼跟上面的結論不太一樣?看看IsoP吧,不然臉要腫起來惹。結果只有11名!?
%%%%%%%%%%%%%%%%,我的臉好腫。
於是跑了一下regression,用近三十年的牛棚WAR跟一分差勝率來跑,嗯,
看來這兩個outlier根本不能解釋,好吧,丟人現眼QQ
雖然帶著正相關,但是相關係數連弱正相關的0.3都沒有,只好先放旁邊。
(雖然一開始跑之前好像就猜的到這種結果惹= =
居然妄想用回歸來解釋這種看起來是outlier的東西,臭87)
不過仔細看一下牛棚組成,當然吸塵器更生人Diekman都蠻強的,(有個酒駕被關的跳過)
可是牛棚裡面也有一些OO,例如被拔掉的Tolleson, Wilhelmsen等,
如果要說這些高手去扛一分差很猛也是合理,你當然不會看到後面那些OO在一分差出現,
除非逼不得已,所以這些人拖低了WAR。
當然,牛棚的確可能overvalued,因為計算的槓桿不同,牛棚每多1WAR就可以多1.18勝,
把WAR轉換成勝率對於牛棚來說顯然可能高估了。
所以我們得另外找一下有沒有其他因素,歷史證明法已經失敗了。
然後就看到了一篇CBSSport寫到的「關鍵時刻的打擊帶領條子創造MLB歷史」[註三]
看來我們要縮小尺度到一些一分差的單場比賽觀察Win Probability,
否則純看WPA大概會跟上面有差不多的結果。
這篇舉了8/31拳王歐多九局下的兩分砲,從一分差loss變成一分差win,看一下這圖,
http://i.imgur.com/cflS7pA.png
(想看互動式的請洽http://goo.gl/n66D4Z 這是FG的頁面)
看起來非常精美的,原本在吹哥打出了安打後還是可能輸球,結果一棒就怒提高了80%
直接灌成100%贏得勝利。
看樣子都是時機問題,時機若對,就可以贏下一分差。所以決定去看一下FG的Clutch,
與調查這支球隊的RISP,與各種情況下的OPS。
先來看Clutch,果不其然,6.36。這項數據以零作為平均數,大概在2就是很優秀了,
他們幾乎要是聯盟第二名的1.7倍,表示關鍵時刻有一套。而根據上面CBS的文章內顯示,
這應該是歷史級的數據,FanGraph則顯示這是近百年來第九位的數據
(http://goo.gl/GxnBK2)
另外,當壘包空空的時候球隊只有0.750的OPS,只要一有人就變成0.780,
RISP也是0.780,這在聯盟是相當靠前的水準。
除了純二壘有人打比較不好外,其他狀況都相當亮眼,
並且局數越後面打越好,比數越靠近也打越好。
(數據很多,詳見BR http://goo.gl/V77VYc)
這樣的結果,可以歸咎於氣勢,或者是總教練善於派能面對大場面的選手,
這有非常多的因素,讓我想到不知道誰說的The will to win,但相對的,
可以看出這樣的結果與統計事實比較不相符,是否很stable也要再做觀察,
畢竟到了季後賽大場面,選手可能軟手,牛棚也都是各隊精英,還能不能有這麼高檔?
到底是真的有啥科學根據,像是金鶯那種做法,還是條子的The Will to Win呢?
就看這種Clutch可以帶著條子在季後賽走得多遠吧!
==============================================================================
[註一]
Pyth W-L的公式,常見的Bill James版本為RunsScored^2/(RS^2+RunsAllowed^2)
https://arxiv.org/pdf/math/0509698v4.pdf
這份PDF充分的證明了Pyth W-L以及其指數不應該是2 而是1.82
作為本科系學生加上愛好者其實看到這個就...阿斯>///< 推導的蠻漂亮的
詳細內容有點困難,可以簡略看過。
[註二]
http://www.fangraphs.com/blogs/how-much-luck-is-involved-in-one-run-games/
logit model是統計上常用的一種非參數方法,常見的應用如:信用卡違約機率等
是一種可以把回歸的outcome壓縮到0,1之間的實用技術,壓縮成二元應變數之後,
計算odds ratio 勝算比也非常容易了。
[註三]
http://goo.gl/iiu9UZ
=============================================================================
希望各位批評指教,可以寫得越來越好...
當然下一次可能不會發這麼數據的文,應該會試圖翻譯一些其他的~
--
「一直保持朋友關係,是很快樂。而愛的越深,受的傷害也越大。」
「但是,人還是要戀愛吧!」--by Haruka Koga
「所以全國四千所學校的高中生,才會那麼期待和甲子園約會。」--by Hiro Kunimi
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.176.219
※ 文章網址: https://www.ptt.cc/bbs/MLB/M.1473349201.A.9C7.html
推
09/08 23:44, , 1F
09/08 23:44, 1F
推
09/08 23:47, , 2F
09/08 23:47, 2F
推
09/08 23:49, , 3F
09/08 23:49, 3F
※ 編輯: rn940111 (111.249.176.219), 09/08/2016 23:51:47
推
09/08 23:52, , 4F
09/08 23:52, 4F
推
09/08 23:56, , 5F
09/08 23:56, 5F
推
09/08 23:59, , 6F
09/08 23:59, 6F
推
09/09 00:00, , 7F
09/09 00:00, 7F
推
09/09 00:03, , 8F
09/09 00:03, 8F
推
09/09 00:03, , 9F
09/09 00:03, 9F
推
09/09 00:16, , 10F
09/09 00:16, 10F
推
09/09 00:18, , 11F
09/09 00:18, 11F
推
09/09 00:22, , 12F
09/09 00:22, 12F
推
09/09 00:29, , 13F
09/09 00:29, 13F
推
09/09 00:36, , 14F
09/09 00:36, 14F
推
09/09 00:43, , 15F
09/09 00:43, 15F
推
09/09 00:44, , 16F
09/09 00:44, 16F
推
09/09 00:46, , 17F
09/09 00:46, 17F
→
09/09 01:16, , 18F
09/09 01:16, 18F
→
09/09 01:17, , 19F
09/09 01:17, 19F
→
09/09 01:18, , 20F
09/09 01:18, 20F
→
09/09 01:19, , 21F
09/09 01:19, 21F
→
09/09 01:20, , 22F
09/09 01:20, 22F
→
09/09 01:20, , 23F
09/09 01:20, 23F
→
09/09 01:21, , 24F
09/09 01:21, 24F
→
09/09 01:21, , 25F
09/09 01:21, 25F
→
09/09 01:21, , 26F
09/09 01:21, 26F
→
09/09 01:22, , 27F
09/09 01:22, 27F
→
09/09 01:23, , 28F
09/09 01:23, 28F
→
09/09 01:23, , 29F
09/09 01:23, 29F
→
09/09 01:23, , 30F
09/09 01:23, 30F
→
09/09 01:23, , 31F
09/09 01:23, 31F
→
09/09 01:23, , 32F
09/09 01:23, 32F
→
09/09 01:24, , 33F
09/09 01:24, 33F
→
09/09 01:25, , 34F
09/09 01:25, 34F
→
09/09 01:25, , 35F
09/09 01:25, 35F
→
09/09 01:26, , 36F
09/09 01:26, 36F
→
09/09 01:27, , 37F
09/09 01:27, 37F
→
09/09 01:28, , 38F
09/09 01:28, 38F
還有 23 則推文
→
09/09 08:25, , 62F
09/09 08:25, 62F
推
09/09 08:33, , 63F
09/09 08:33, 63F
推
09/09 08:35, , 64F
09/09 08:35, 64F
→
09/09 08:35, , 65F
09/09 08:35, 65F
→
09/09 08:35, , 66F
09/09 08:35, 66F
推
09/09 08:35, , 67F
09/09 08:35, 67F
推
09/09 08:38, , 68F
09/09 08:38, 68F
推
09/09 08:59, , 69F
09/09 08:59, 69F
→
09/09 09:00, , 70F
09/09 09:00, 70F
推
09/09 09:01, , 71F
09/09 09:01, 71F
推
09/09 09:05, , 72F
09/09 09:05, 72F
推
09/09 09:21, , 73F
09/09 09:21, 73F
→
09/09 09:22, , 74F
09/09 09:22, 74F
→
09/09 09:22, , 75F
09/09 09:22, 75F
推
09/09 09:52, , 76F
09/09 09:52, 76F
推
09/09 10:25, , 77F
09/09 10:25, 77F
推
09/09 10:27, , 78F
09/09 10:27, 78F
→
09/09 10:40, , 79F
09/09 10:40, 79F
→
09/09 10:41, , 80F
09/09 10:41, 80F
推
09/09 10:41, , 81F
09/09 10:41, 81F
推
09/09 10:48, , 82F
09/09 10:48, 82F
推
09/09 10:50, , 83F
09/09 10:50, 83F
→
09/09 10:50, , 84F
09/09 10:50, 84F
→
09/09 10:50, , 85F
09/09 10:50, 85F
推
09/09 12:01, , 86F
09/09 12:01, 86F
推
09/09 13:58, , 87F
09/09 13:58, 87F
推
09/09 14:03, , 88F
09/09 14:03, 88F
→
09/09 14:03, , 89F
09/09 14:03, 89F
推
09/09 14:09, , 90F
09/09 14:09, 90F
推
09/09 19:36, , 91F
09/09 19:36, 91F
推
09/09 21:12, , 92F
09/09 21:12, 92F
推
09/09 22:30, , 93F
09/09 22:30, 93F
推
09/09 23:42, , 94F
09/09 23:42, 94F
推
09/10 00:22, , 95F
09/10 00:22, 95F
→
09/10 00:23, , 96F
09/10 00:23, 96F
推
09/10 01:20, , 97F
09/10 01:20, 97F
推
09/10 20:21, , 98F
09/10 20:21, 98F
推
09/11 01:35, , 99F
09/11 01:35, 99F
推
09/11 06:10, , 100F
09/11 06:10, 100F
推
09/13 12:39, , 101F
09/13 12:39, 101F