[閒聊] 要怎樣的團隊數據才進的了季後賽?

看板MLB作者時間11年前 (2014/04/27 02:32), 11年前編輯推噓28(28014)
留言42則, 30人參與, 最新討論串1/1
把一支球隊送到季後賽去通常是各家GM們努力的目標 (需要觀念的球隊就另當別論了) 從2002到2013十一年間,總共有90隊次進到季後賽 (8*10+10*1,以往一年八支去年改成一年十支) 三十隊裡面有二十七隊有進過季後賽,最多的是NYY九次 http://ppt.cc/l3Qb 有三隊在這些年根本不知道季後賽是長什麼樣子 通通都是美聯的球隊(美東、美中、美西各一隊) 季後賽常客裡面也不乏payroll排行榜倒數的球隊 反過來說這三支球隊也都不是最最最沒錢的球隊 從這個角度來看 有不有錢跟進不得了季後賽好像關係並沒有太直接 所以我想要看看這幾年這些有進季後賽的球隊和沒進的球隊 在團隊數據上有哪些資料是有顯著的差異 或許可以提供一個補強時的考量 甚至是重新評估球員的價值 其實這個想法是在看完錢球之後想到的 電影裡面Billy Beane再挑新秀或是簽FA的時候很在意 OBP 不知道除了OBP外還有沒有其他的數據可以放進來一起評估 我把fangraphs上 投球、打擊、守備 的各項數值(大部分都不太知道哪是什麼XD) 扣除掉投手勝投勝率等勝負直接相關數據 總共51項數據 用non supervised的統計方法Principal Component Analysis主成分分析 來觀察兩組(post-season vs off-season)的趨勢 http://ppt.cc/fSOn 從2002-2013年間,有90支球隊(紅色)進到季後賽 有另外240支球隊直接放假(綠色) 從PCA圖上可以看出有分群的趨勢 代表兩組間應該有一些variable可以影響是否能進季後賽 接著再用supervised approach (PLS)試著找出最重要的variables http://ppt.cc/rpjc 再分群效果不錯的情形下,找出Variable Importance in Projection (VIP) 前五名分別為 1. bat_wRC+:Weighted Runs Created Plus 2. pit_ERA- 3. bat_wRAA:Weighted Runs Above Average 4. pit_WHIP 5. pit_FIP- 好像都還是能夠理解 咦! 等等 那守備相關的數據不是也放了嗎?? 總共18項與守備有關的數據有17項列在倒數20名VIP中 包含外野手助殺能力、內野手雙殺能力、捕手阻殺能力、UZR等等 都和能不能進季後賽關係不大 (防守野球、金守備計畫表示:________) 另外,再透過receiver operating characteristic curve (ROC) 來檢驗各項數據作為分群鑑別能力的靈敏度和選擇性 ROC 曲線下面積 (Area under curve, AUC) 若是等於1代表該進季後賽的都能被該模型正確預測出來且無偽陽性的結果產生 不過正常來說是不太可能發生的 AUC等於0.5左右大概相當於用擲杯來決定能不能進季後賽 (丟銅板好像比較合理XD) 我們可以看一下這幾項ROC的表現 wRC+ : http://ppt.cc/kru5 ERA- : http://ppt.cc/fdhU AUC算出來最高的前兩名跟PLS中VIP最高的兩名都是同樣的 AUC=0.8 在臨床文章上已經是很不錯了 樓上討論的FIP http://ppt.cc/ypQb 表現也是相當不錯 豆爺念茲在茲的 OBP呢? http://ppt.cc/Thux 雖然沒有wRC+ 那麼搶眼,但是比起看傳統AVG來說還是好了一些 http://ppt.cc/DECs 常常打很多安打卻得不了多少分的球隊,是不是就是少了製造得分能力的因素呢? 這要透過補強能適時擊出打點能力的選手? 或是換成調度能力和解讀球員特質能力強大的教練團? 才能提升所謂的wRC,好像也很難去驗證 至於防守端的數據我貼幾項出來 rARM, 外野手助殺能力 : http://ppt.cc/M1jP rSB, stolen base saved, 阻殺能力 : http://ppt.cc/pvi3 UZR/150: http://ppt.cc/nEPd (好像有一點點關係了) 綜合來說,防守數值似乎和能否進入季後賽沒有太大的關聯性 也有可能是,大家都已經不錯了, 80和85分的差異不會像中職可能57跟62分那五分決定勝負 (防守野球、金守備計畫再表示:________) 因此,補一些防守專家在大聯盟中真的對球隊有幫助嗎?? 我這邊指得是那些進不了季後賽還再補強的球隊 有趣的是 打者被K% 其實AUC也只有0.56, 忘記誰曾經說過三振也只不過是一種出局的方式 然而,對投手來說 投手K%的AUC 卻提升到 0.65 似乎有考量投手自己解決問題的能力 最後再把投打兩項最高分的(wRC+,ERA-)放在一起評估ROC 可以得到驚人超過0.9的AUC http://ppt.cc/OQeO 總結來說,這些data告訴我們, 打者能創造越多得分,投手掉越少分,離季後賽就不遠了..... 怎麼突然覺得自己好像在說屁話XDDD 謝謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.29.230 ※ 文章網址: http://www.ptt.cc/bbs/MLB/M.1398537130.A.51A.html

04/27 02:35, , 1F
讚 XD
04/27 02:35, 1F

04/27 02:40, , 2F
這場比賽,得分較多的人將獲勝。
04/27 02:40, 2F

04/27 02:44, , 3F
怎麼繞了一圈結果發現自己在說屁話XDDD
04/27 02:44, 3F

04/27 02:49, , 4F
水手12年沒進季後賽 藍鳥20年 皇家28年了
04/27 02:49, 4F

04/27 02:50, , 5F
但藍鳥/皇家最後一次進的剛好都是拿下冠軍...
04/27 02:50, 5F

04/27 02:50, , 6F
2002到2013應該是12年? 而且是2012開始十隊進季後
04/27 02:50, 6F
真的耶!! 應該是2003-2012 11年 然後漏了12年的兩隊 感謝

04/27 02:54, , 7F
雖然個人的ERA會有很多誤差
04/27 02:54, 7F

04/27 02:54, , 8F
但團隊的ERA還是很有參考價值XD
04/27 02:54, 8F

04/27 02:54, , 9F
推原PO的用心!
04/27 02:54, 9F
※ 編輯: ken24griffey (220.136.29.230), 04/27/2014 03:01:02

04/27 03:00, , 10F
雖然繞了圈再說屁話,但是很有科學精神XD
04/27 03:00, 10F

04/27 03:08, , 11F
比賽得比較多分的會獲勝,賽季獲勝比較多場的隊伍會進季後賽
04/27 03:08, 11F

04/27 03:18, , 12F
依我看來,這場比賽得分多的隊伍會贏
04/27 03:18, 12F

04/27 03:21, , 13F
英國研究指出:得分大於失分的隊伍會獲勝
04/27 03:21, 13F

04/27 03:36, , 14F
為什麼只看的懂結論
04/27 03:36, 14F

04/27 04:46, , 15F
失分=投手能力+團隊防守能力
04/27 04:46, 15F

04/27 04:47, , 16F
ERA其實已經有把防守的好壞對勝負的影響包進去了
04/27 04:47, 16F

04/27 04:49, , 17F
防守打底 搭配投手養成的建隊模式應該還是有用的
04/27 04:49, 17F

04/27 04:51, , 18F
主打防守野球還是要有投手 投手能力究竟對失分影響還是
04/27 04:51, 18F

04/27 04:52, , 19F
較大 XD
04/27 04:52, 19F

04/27 05:58, , 20F
建議drop掉那些大爛隊,只留差幾場進季後賽的隊伍當作
04/27 05:58, 20F

04/27 05:59, , 21F
counterfactual,說不定結果會有些不一樣。
04/27 05:59, 21F

04/27 05:59, , 22F
另外你的資料能跑些cov或correlation的東西嗎?
04/27 05:59, 22F

04/27 06:00, , 23F
這些應該可以延伸你結論中的分析
04/27 06:00, 23F

04/27 07:01, , 24F
這個遊戲,有必勝法
04/27 07:01, 24F

04/27 07:25, , 25F
PUSH
04/27 07:25, 25F

04/27 10:59, , 26F
雖然最後繞圈 但是很有趣XD
04/27 10:59, 26F

04/27 12:04, , 27F
認真文推
04/27 12:04, 27F

04/27 12:09, , 28F
推研究精神XD
04/27 12:09, 28F

04/27 12:23, , 29F
絕密贏球方法:得越多分 掉越少分
04/27 12:23, 29F

04/27 12:36, , 30F
推 精彩
04/27 12:36, 30F

04/27 12:50, , 31F
推認真文
04/27 12:50, 31F

04/27 13:07, , 32F
就勝場數超過敗場數多愈多愈好啊!
04/27 13:07, 32F

04/27 13:58, , 33F
認真
04/27 13:58, 33F

04/27 14:19, , 34F
push
04/27 14:19, 34F

04/27 16:20, , 35F
錢球派不是認為野手守備丟掉的分數,可以從打擊上補回來
04/27 16:20, 35F

04/27 16:22, , 36F
也許這篇可以間接驗證一下
04/27 16:22, 36F

04/27 18:28, , 37F
勝場比最低能進季後賽的門檻高就可以了
04/27 18:28, 37F

04/28 00:01, , 38F
從相對比較之下也很有價值啊,像A數據比B數據有關
04/28 00:01, 38F

04/28 00:24, , 39F
這還用問嗎,球隊的W大於L不就進季後賽了
04/28 00:24, 39F

04/28 04:25, , 40F
錢球不是說用有限的資源創造出最多的勝場 所以特別關注
04/28 04:25, 40F

04/28 04:26, , 41F
較被低估的球員數據 當時OBP就是
04/28 04:26, 41F

04/28 09:28, , 42F
好文~
04/28 09:28, 42F
文章代碼(AID): #1JM_kgKQ (MLB)