[討論] 德州條子的歷史級鐵壁:一分差比賽

看板MLB作者 (卡比)時間7年前 (2016/09/08 23:40), 7年前編輯推噓49(49052)
留言101則, 52人參與, 最新討論串1/1
不要看到鐵壁就興奮的點進來看有沒有短裙啊各位(? 德州遊騎兵目前為止83W57L,全大聯盟戰績第二,僅次於今年一飛沖天的小熊, 但是開季的時候戰績大概沒有人想得到,看一下到目前為止的美西季後賽機率, http://i.imgur.com/PRRkUL9.png
(from FG),開季還被看雖墊底。 再提供另外一個數字,今年他們的Pythagorean Win-Loss[註一] 為 72-68 跟實際勝場勝差來到了十一場,曾經有過這樣表現的季後賽隊伍,近十年來只有 2012的金鶯(93-69, pyth W-L 82-80, 2012 AL Wild Card), 以及2007的響尾蛇(90-72, pyth W-L 79-83 2007 NL West 1st), 超出畢氏勝率很多的原因,假設不懂數學的話,直觀上的猜測就是: 贏的分數不多,於是一分差比賽是一個值得參考的點。 今年的條子跟陳偉殷到美國第一年的金鶯,都有一個歷史級的紀錄: 一分差比賽的勝率 在今年以前,2012金鶯的一分差比賽 為29-9 76.3%的勝率,為史上第一, 而條子到目前為止已經是30-9更是超越了金鶯的紀錄。 可是這個表現到底是運氣?還是實力與技術? (雖然我在數據上很不喜歡用運氣這個字,但實際看球肯定感受得到。) 在看數據之前先喚起各位的回憶,畢竟那時候開始就變成民視/ESPN金鶯台,有很多比賽看 Buck Showalter一直是一個以善於調度,與掌握牛棚時機的教練, 近幾年來也讓金鶯都是以鐵牛著稱, 就算是看球的印象派,也可以發現inherited runners常常回不來。 近年的金鶯防守都很強悍,而當年的牛棚有蚵嗲,以及年度救援王後來爆炸的金江嬸。 在當時金鶯創下歷史的時候,就有人提出相關的論點[註二], 這裡用logit model跑了07-11年的一分差賽事,模型裡面還放了一堆變數像是park factor, 但模型解釋中,只有IsoP,RPs' K/9 & RPs' BB/9有顯著,其中RP的能力很直觀, 但IsoP的顯著性大於我們觀念中可以造成對手壓力與不確定因素的擊球率與保送率, 甚至防守跟跑壘也都不那麼重要。 (當然,去年的World Series大家看見過了,那所謂的皇家靈氣就是不確定因素) 再來他把同一個模型拿去與一分差以上的比賽做比較,可以發現後援投手在一分差比賽 的影響大於一分差以上的比賽如下圖: http://i.imgur.com/NCdVu8u.jpg
這樣的結果的確make sense,而且看到保送在一分差的負面影響比起一分差以上更明顯。 的確,這三樣東西也是當時金鶯隊強項,只是模型預測出來的勝率,金鶯在一分差的 勝率為64.7%,但實際上我們看到了一個歷史級的存在,76.3%,好吧,剩下來的部分, 就只好交給良好的總教練技術來做解釋了lol 回到條子,目前為止,條子的得分差為+21,在一週前Fangraphs預測球季只會有84勝, 而現在他們已經接近這個數字,在季末要贏下AL West 1st並且超過90勝也不是太大問題。 原因就出在於他們優異的一分差賽事表現,即使同區的太色人勝分差來的更多。 ok,先暫停一下,條子的牛棚算強嗎?雖然在五月中拔掉了Tolleson之後, 可以看到球隊戰績節節高昇,但是球隊牛棚的BB%中段班,K%甚至倒數, (畢竟牛棚屬性都不是三振高手) 雖然團隊的SV是聯盟並列第一,但是ERA也好WAR也好等等數據,都是後面數比較快, 怎麼跟上面的結論不太一樣?看看IsoP吧,不然臉要腫起來惹。結果只有11名!? %%%%%%%%%%%%%%%%,我的臉好腫。 於是跑了一下regression,用近三十年的牛棚WAR跟一分差勝率來跑,嗯, 看來這兩個outlier根本不能解釋,好吧,丟人現眼QQ 雖然帶著正相關,但是相關係數連弱正相關的0.3都沒有,只好先放旁邊。 (雖然一開始跑之前好像就猜的到這種結果惹= = 居然妄想用回歸來解釋這種看起來是outlier的東西,臭87) 不過仔細看一下牛棚組成,當然吸塵器更生人Diekman都蠻強的,(有個酒駕被關的跳過) 可是牛棚裡面也有一些OO,例如被拔掉的Tolleson, Wilhelmsen等, 如果要說這些高手去扛一分差很猛也是合理,你當然不會看到後面那些OO在一分差出現, 除非逼不得已,所以這些人拖低了WAR。 當然,牛棚的確可能overvalued,因為計算的槓桿不同,牛棚每多1WAR就可以多1.18勝, 把WAR轉換成勝率對於牛棚來說顯然可能高估了。 所以我們得另外找一下有沒有其他因素,歷史證明法已經失敗了。 然後就看到了一篇CBSSport寫到的「關鍵時刻的打擊帶領條子創造MLB歷史」[註三] 看來我們要縮小尺度到一些一分差的單場比賽觀察Win Probability, 否則純看WPA大概會跟上面有差不多的結果。 這篇舉了8/31拳王歐多九局下的兩分砲,從一分差loss變成一分差win,看一下這圖, http://i.imgur.com/cflS7pA.png
(想看互動式的請洽http://goo.gl/n66D4Z 這是FG的頁面) 看起來非常精美的,原本在吹哥打出了安打後還是可能輸球,結果一棒就怒提高了80% 直接灌成100%贏得勝利。 看樣子都是時機問題,時機若對,就可以贏下一分差。所以決定去看一下FG的Clutch, 與調查這支球隊的RISP,與各種情況下的OPS。 先來看Clutch,果不其然,6.36。這項數據以零作為平均數,大概在2就是很優秀了, 他們幾乎要是聯盟第二名的1.7倍,表示關鍵時刻有一套。而根據上面CBS的文章內顯示, 這應該是歷史級的數據,FanGraph則顯示這是近百年來第九位的數據 (http://goo.gl/GxnBK2) 另外,當壘包空空的時候球隊只有0.750的OPS,只要一有人就變成0.780, RISP也是0.780,這在聯盟是相當靠前的水準。 除了純二壘有人打比較不好外,其他狀況都相當亮眼, 並且局數越後面打越好,比數越靠近也打越好。 (數據很多,詳見BR http://goo.gl/V77VYc) 這樣的結果,可以歸咎於氣勢,或者是總教練善於派能面對大場面的選手, 這有非常多的因素,讓我想到不知道誰說的The will to win,但相對的, 可以看出這樣的結果與統計事實比較不相符,是否很stable也要再做觀察, 畢竟到了季後賽大場面,選手可能軟手,牛棚也都是各隊精英,還能不能有這麼高檔? 到底是真的有啥科學根據,像是金鶯那種做法,還是條子的The Will to Win呢? 就看這種Clutch可以帶著條子在季後賽走得多遠吧! ============================================================================== [註一] Pyth W-L的公式,常見的Bill James版本為RunsScored^2/(RS^2+RunsAllowed^2) https://arxiv.org/pdf/math/0509698v4.pdf 這份PDF充分的證明了Pyth W-L以及其指數不應該是2 而是1.82 作為本科系學生加上愛好者其實看到這個就...阿斯>///< 推導的蠻漂亮的 詳細內容有點困難,可以簡略看過。 [註二] http://www.fangraphs.com/blogs/how-much-luck-is-involved-in-one-run-games/ logit model是統計上常用的一種非參數方法,常見的應用如:信用卡違約機率等 是一種可以把回歸的outcome壓縮到0,1之間的實用技術,壓縮成二元應變數之後, 計算odds ratio 勝算比也非常容易了。 [註三] http://goo.gl/iiu9UZ ============================================================================= 希望各位批評指教,可以寫得越來越好... 當然下一次可能不會發這麼數據的文,應該會試圖翻譯一些其他的~ -- 「一直保持朋友關係,是很快樂。而愛的越深,受的傷害也越大。」 「但是,人還是要戀愛吧!」--by Haruka Koga 「所以全國四千所學校的高中生,才會那麼期待和甲子園約會。」--by Hiro Kunimi -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.176.219 ※ 文章網址: https://www.ptt.cc/bbs/MLB/M.1473349201.A.9C7.html

09/08 23:44, , 1F
推推
09/08 23:44, 1F

09/08 23:47, , 2F
看不懂不過好像很厲害XD
09/08 23:47, 2F

09/08 23:49, , 3F
推~
09/08 23:49, 3F
※ 編輯: rn940111 (111.249.176.219), 09/08/2016 23:51:47

09/08 23:52, , 4F
條子的牛棚說不穩真的不穩,說穩也是真的很穩
09/08 23:52, 4F

09/08 23:56, , 5F
專業推
09/08 23:56, 5F

09/08 23:59, , 6F
一分差39場樣本數也不少了 看季後賽褲子會不會不見
09/08 23:59, 6F

09/09 00:00, , 7F
09/09 00:00, 7F

09/09 00:03, , 8F
推結論 這才是面對統計數據應該有的態度,不是當加減法
09/09 00:03, 8F

09/09 00:03, , 9F
之前有陣子還有得失分差-1結果聯盟一位...
09/09 00:03, 9F

09/09 00:16, , 10F
09/09 00:16, 10F

09/09 00:18, , 11F
推一下,可以順便分析一下我襪為什麼一分差一直輸嗎?XD
09/09 00:18, 11F

09/09 00:22, , 12F
紅襪迷感到羨慕
09/09 00:22, 12F

09/09 00:29, , 13F
專業推
09/09 00:29, 13F

09/09 00:36, , 14F
例賽的成功 要再季候賽的強度才能見真張
09/09 00:36, 14F

09/09 00:43, , 15F
推 雖然不是很懂XDD
09/09 00:43, 15F

09/09 00:44, , 16F
09/09 00:44, 16F

09/09 00:46, , 17F
2011 WS G6 也是一分差 我要被條迷追殺了 ....
09/09 00:46, 17F

09/09 01:16, , 18F
統計這種東西本來就註定會有 outlier, 不能解釋就不能啊
09/09 01:16, 18F

09/09 01:17, , 19F
看到一個現象就想找原因來解釋/歸咎是人性, 但這世界上
09/09 01:17, 19F

09/09 01:18, , 20F
就是有運氣這種東西, outlier 是統計的一部份, 是規則的
09/09 01:18, 20F

09/09 01:19, , 21F
例外, 但不是讓定律失效的 X factor
09/09 01:19, 21F

09/09 01:20, , 22F
然後這結論其實滿爛的, 季後賽能走多遠和這個現象有沒有
09/09 01:20, 22F

09/09 01:20, , 23F
根據其實一點關係不大; 季後賽的小樣本會造成更多偏差可
09/09 01:20, 23F

09/09 01:21, , 24F
能, 而這些因素的影響遠大於影響季賽表現的因素, 所以季
09/09 01:21, 24F

09/09 01:21, , 25F
應該這樣說,很多方法可以處理離群,但是我今天不這麼做
09/09 01:21, 25F

09/09 01:21, , 26F
,是因為今天目的是來看看這隻球隊的特性為何來做討論。
09/09 01:21, 26F

09/09 01:22, , 27F
後賽的表現不能證明任何事情
09/09 01:22, 27F

09/09 01:23, , 28F
喔我沒有要質疑你的分析方法啦, 你看的東西都沒問題, 分
09/09 01:23, 28F

09/09 01:23, , 29F
所以我的結論不想說死,因為季後賽小樣本,我覺得靠關鍵
09/09 01:23, 29F

09/09 01:23, , 30F
一擊不是很穩。我也沒說金鳥好棒,但是他們的一分差勝率
09/09 01:23, 30F

09/09 01:23, , 31F
原因來自於統計結果,跟這種比起來,我想看看他們能走多
09/09 01:23, 31F

09/09 01:23, , 32F
遠,我也其實不是下什麼結論lol
09/09 01:23, 32F

09/09 01:24, , 33F
析也很仔細, 只是你前面寫的其實沒辦法導出你最後的結論
09/09 01:24, 33F

09/09 01:25, , 34F
如果那不是結論, 你最後一段就不能那樣寫 XD 我隨便猜一
09/09 01:25, 34F

09/09 01:25, , 35F
下你應該是大學生?還沒經歷過被釘爆過研究方法, 雖然有
09/09 01:25, 35F

09/09 01:26, , 36F
料, 但論述的方式有問題這樣。其實真的寫得不錯啦, 再多
09/09 01:26, 36F

09/09 01:27, , 37F
思考一下怎麼從分析 extract 出抽象概念就完美了
09/09 01:27, 37F

09/09 01:28, , 38F
謝謝指教XD 我是剛畢業的沒有錯哈哈
09/09 01:28, 38F
還有 23 則推文
09/09 08:25, , 62F
一分差比賽,感覺勝負也是他媽的運氣
09/09 08:25, 62F

09/09 08:33, , 63F
反正關鍵時刻條子都會軟手
09/09 08:33, 63F

09/09 08:35, , 64F
非常簡單 因為條子勝利組的牛很強 守備又好 DP是全聯盟
09/09 08:35, 64F

09/09 08:35, , 65F
最多 牛的整體ERA會那麼難看是因為特定幾隻牛被炸了 不
09/09 08:35, 65F

09/09 08:35, , 66F
過那幾隻不是被交易就是下放
09/09 08:35, 66F

09/09 08:35, , 67F
版主很有心
09/09 08:35, 67F

09/09 08:38, , 68F
專業推
09/09 08:38, 68F

09/09 08:59, , 69F
uranusjr真是好人~
09/09 08:59, 69F

09/09 09:00, , 70F
這篇內容也很認真,板主讚!
09/09 09:00, 70F

09/09 09:01, , 71F
專業文大推
09/09 09:01, 71F

09/09 09:05, , 72F
應該是我加入的關係吧~XD
09/09 09:05, 72F

09/09 09:21, , 73F
SORRY我上面推文說到的結論是指倒數第二段,網路上面看
09/09 09:21, 73F

09/09 09:22, , 74F
到的數據文常常落入太死的窠臼 感覺原po好像跟我唸
09/09 09:22, 74F

09/09 09:22, , 75F
同個系
09/09 09:22, 75F

09/09 09:52, , 76F
推用心~
09/09 09:52, 76F

09/09 10:25, , 77F
推分析
09/09 10:25, 77F

09/09 10:27, , 78F
推用心
09/09 10:27, 78F

09/09 10:40, , 79F
推 但我一開始看成條子的一球差比賽
09/09 10:40, 79F

09/09 10:41, , 80F
然後就馬上連結2011…………
09/09 10:41, 80F

09/09 10:41, , 81F
推!
09/09 10:41, 81F

09/09 10:48, , 82F
09/09 10:48, 82F

09/09 10:50, , 83F
12金鶯是靠強大牛棚守住的,今年條子則是靠打擊逆轉的
09/09 10:50, 83F

09/09 10:50, , 84F
,看有一場牛棚10上掉兩分結果10下硬是得三分逆轉就知
09/09 10:50, 84F

09/09 10:50, , 85F
09/09 10:50, 85F

09/09 12:01, , 86F
09/09 12:01, 86F

09/09 13:58, , 87F
專業推。看好條子進世界大賽
09/09 13:58, 87F

09/09 14:03, , 88F
水,見樹不是樹 見林亦非林,世上沒有一個理論能全吃的
09/09 14:03, 88F

09/09 14:03, , 89F
!凡事都得依賴腦子去判斷,不然電腦就是無敵!
09/09 14:03, 89F

09/09 14:09, , 90F
09/09 14:09, 90F

09/09 19:36, , 91F
好專業啊!另外看標題我直接想到2011年XD
09/09 19:36, 91F

09/09 21:12, , 92F
感謝板大!
09/09 21:12, 92F

09/09 22:30, , 93F
不明覺厲
09/09 22:30, 93F

09/09 23:42, , 94F
完全沒看扁啊,開季就買了一萬條子美西冠軍
09/09 23:42, 94F

09/10 00:22, , 95F
看得懂大部分,後面解釋統計的東西就看不懂了QQ
09/10 00:22, 95F

09/10 00:23, , 96F
看完這篇突然好想去學統計
09/10 00:23, 96F

09/10 01:20, , 97F
Never ever quit!
09/10 01:20, 97F

09/10 20:21, , 98F
今天又贏一分差了XD
09/10 20:21, 98F

09/11 01:35, , 99F
雖然看不懂,但是好像很厲害
09/11 01:35, 99F

09/11 06:10, , 100F
好文推推
09/11 06:10, 100F

09/13 12:39, , 101F
未看先猜推文必有2011WS
09/13 12:39, 101F
文章代碼(AID): #1NqOPHd7 (MLB)