[心得] 論靠山的重要性:各大主場飛行環境分析消失

看板MLB作者時間7年前 (2018/11/02 15:44), 7年前編輯推噓29(2907)
留言36則, 27人參與, 最新討論串1/1
前言: 大聯盟三十支球隊有各式各樣的主場,這些主場又因各種理由被球迷區分成打者球場、中性球場、投手球場 為了提供客觀依據,數據網站也提供Park Factor作為球迷的參考,然而Park Factor在計算過程上的過於簡化為人所詬病 我們認為一個球場是否對打者友善由球場尺寸與擊球飛行環境兩大因素構成——球場尺寸很直覺,大的球場一定比較難擊出全壘打,而各隊主場的規格在網路上也相當容易取得 但是擊球飛行環境就很模糊了,或許我們聽說過Coors Field空氣稀薄、Chase Field處於乾燥的沙漠(已於17-18年休賽期間安裝加濕系統)、Petco Park有從外野吹向內野的海風,卻從未將其量化 本文想藉由batted ball的建模討論各球場於擊球飛行環境上的差異,以觀察各球場在尺寸之外對打者的友善程度 無廣告部落格好讀版:https://goo.gl/tteHry 正文: 整篇文章以一個核心思想貫穿:以相同初速(EV)、相同仰角(LA)擊出的兩個batted ball,必定會有相同的理想飛行距離(Hit_Distance),這是我們在高中物理的斜拋單元學到的事情。但現實不如理想那麼簡單,兩個batted ball即使有相同的(EV,LA),也會基於空氣阻力、風向、風速等因素落於截然不同的點上。這時候我們反向思考:如果我們持有一定的樣本數,我們就可以從同樣(EV,LA)的batted ball在不同的球場的飛行距離,得知各球場是否有助於球的飛行 舉個例子的話就是假設(EV,LA)=(100,25)的飛球在Coors Field平均可以飛行400ft,卻只能在Petco Park飛350ft,不就等同用數字證明了Coors Field比Petco Park更助於球的飛行嗎?不過也不是球飛得遠的球場就一定偏向打者——回到第一段所說的,一個球場好不好打不外乎尺寸和飛行環境;球比較會飛的小型球場當然是打者球場、比較不會飛的大型球場當然是投手球場,剩下的兩種情況(球會飛的大型球場/球不會飛的小型球場)就只能看矛盾大對決的結果了 回到飛行距離,由於牽扯到固定(EV,LA)時總免不了建模,但我們想要在建模前大概暸解一下各球場的飛行距離,所以先取出各球場飛行距離的平均值。問題是batted ball包含的種類實在太多,全部加在一起實在不能提供什麼資訊,所以我們只留下barrel這種已經經過EV和LA篩選的擊球類型,看看barrel在各球場的平均飛行距離——下圖是2018年的barrel在各球場的平均飛行距離(由短到長排序) https://imgur.com/b6kdYxp
上表列出的distance_hat即是平均飛行距離,其實有另外一種提供更多資訊的呈現方式——畫成95%信賴區間的圖 https://imgur.com/ub4W2N0
由表和圖我們可以發現多數的球場在飛行距離方面都相差不遠,中間二十支球隊的差距甚至在10ft以內,甚至某支球隊的barrel比別人兇一點可能就前進好幾名了 值得一提的是barrel飛行距離最短的Fenway Park,其實是因為Green Monster這堵高牆的存在擋下了很多球,大大減少了飛球的距離,出現在這個榜上根本算是作弊 第二名的AT&T Park有著名的海風助攻,出現在後段班也是預料中的結果 Barrel飛行距離最遠的幾個球場也是出了名的偏打者,像是乾燥的Globe Life Park in Arlington和高海拔的Coors Field,尤其Coors Field的飛行距離真是juice到不行… 這邊要注意的是上面選用barrel來做初步的資料觀察,理由是barrel經過了一定程度的篩選,batted ball之間的差距不會太大,但是差異還是存在的——搞不好巨人隊的打者打的barrel就是剛好過門檻、落磯隊打者打的barrel都是barrel之王,作為簡單的觀察還可以,直接拿來斷定各球場的差距就太武斷了,所以為了看出各球場真正的差異,我們還是要建模 在建模前我們必須了解資料特性: (1)只有飛球和平飛球會受到風、氣候影響而飛得更遠,所以我們只能剔除滾地球和pop up,留下這兩種batted ball(這篇文章後面所有batted ball指的都是經過篩選的飛球和平飛球) (2)LA並不是可以丟進線性模型裡的變數,我們都知道65度和5度的仰角都沒有25度飛得遠,如果我們直接把EV、LA、球場丟進線性模型裡,得到的模型肯定是垃圾進垃圾出 這時候我們會使用到廣義相加模型(Generalized additive model,GAM),它能夠幫我們正確地解釋掉LA對飛行距離的影響,白話文就是無視LA的複雜趨勢,直接固定住LA,把解釋力留給球場和EV(已知線性) 這種做法在統計理論上有一個問題,就是雖然我們成功固定住LA,但是LA會變得很難解釋——不過我們現在的case剛好沒有打算要解釋LA,所以GAM的副作用沒有對我們造成任何傷害 而在建立廣義相加模型了解30座球場和飛球距離的關係前,我們必須先找出一座「基準球場」作為所有球場的比較對象 這裡我們選擇光芒的Tropicana Field當作基準球場,因為這是一座室內球場,而且不像其他巨蛋球場開開關關,是終日關閉的,受到氣候的影響理當最小 https://imgur.com/wRAxfxS
上表就是其他29座球場之於Tropicana Field的飛行距離表——Estimate代表相同的LA下,各球場和Tropicana Field的平均飛行距離差距、Significant代表顯著程度,一樣是星星越多代表越明顯 舉例來說同樣(EV,LA)的兩個球,打在巨人隊的主場平均會比打在Tropicana Field少飛5.68ft,差距十分顯著(三顆星) 此外可以注意到倒數第二個項目launch_speed,代表固定LA下、增加1mph的EV平均可以增加4.46ft的飛行距離,用EV來分析飛行距離,想當然是顯著 從上表我們可以看出很多資訊,以下提供幾個觀察: (1)SD主場Petco Park在落成之前,當時的老闆曾經親口告訴媒體自己正在蓋一座超級投手球場 這個球場過去也確實被認為幅員廣闊,又有海風干擾球的飛行,是全聯盟最極端的投手球場 目前看起來Petco也不是最難飛行的球場,加上數次移牆之後Petco早就不如當年那麼嚴苛,或許現在的Petco依然是投手球場,但早就不是過去那個打者墳場了 (2)從SF和OAK可以發現Bay Area真不是蓋的,尤其AT&T Park有421英呎的中右外野,偉哉Barry Bonds (3)和前面的barrel版本相同,BOS的Green Monster擋球吃掉一些飛行距離 (4)雖然數字上比Tropicana有助於飛行(Estimate>0)的球場共有7座,但真正顯著的只有兩座(TEX和COL) 這代表的是剩下五座球場和Tropicana的差距尚在可能是誤差的範圍內,不足以拿來宣稱他們比Tropicana更利於飛行 (5)共有15座球場顯著比無風的Tropicana不利於飛行、12座無顯著特性、2座顯著更利於飛行 這可能代表風帶給球的壞處大過好處 (6)TEX的阿靈頓球場氣候乾燥有利於球的飛行,18年同樣條件的飛球相較無風的Tropicana會多飛2.95ft 今年加濕的Chase Field(響尾蛇主場)是0.97ft,在16年和Tropicana的差距是3ft、17年是2.02ft——有加濕真的有差 (7)COL真的超猛,18年同樣條件的球從和Tropicana到山上平均多飛11.16ft,在2016年同樣的球比起Tropicana甚至多飛15.06ft,差距有多大問問2016年轉隊的Jake McGee最清楚 同時Coors Field也是唯一影響比增加1mph EV劇烈的球場——同樣(EV,LA)的球在Coors和Tropicana飛行,Coors所增加的飛行距離相當於增加2.5mph的EV帶來的飛行距離 也就是在Coors打出的97.5mph飛球飛行距離會相當於同樣角度、且在Tropicana擊出的100mph飛球 (8)上一點聽起來不夠恐怖嗎? 那再加碼2016年時,同樣(EV,LA)的球Coors Field平均比AT&T Park多飛22ft,這簡直是接殺跟全壘打的差別了 (補充)同樣LA=20度、EV=110mph的球,2016年在Tropicana的平均飛行距離是387.03ft、2017年是390.77ft、2018年是384.53ft Tropicana沒有風,不要牽拖氣候變遷 #沒有換球,哦齁! 如果覺得我們的文章還算有趣,歡迎追蹤我們的臉書專頁:https://goo.gl/Eh2vuD -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 124.199.104.223 ※ 文章網址: https://www.ptt.cc/bbs/MLB/M.1541144676.A.274.html

11/02 15:48, , 1F
推推
11/02 15:48, 1F

11/02 15:49, , 2F
為甚麼巨人要故意蓋超級投手球場 報復社會嗎?
11/02 15:49, 2F

11/02 15:50, , 3F
標題是不是在說有球隊靠山?
11/02 15:50, 3F
依山傍水不好嗎

11/02 15:51, , 4F
講了半天,結論跟印象一樣....
11/02 15:51, 4F

11/02 15:52, , 5F
庫爾濕很會飛,AT&T會吃HR,好特別的結論 XD
11/02 15:52, 5F
你的印象知道Coors很會飛,可是不知道他多會飛啊XD ※ 編輯: allen63521 (124.199.104.223), 11/02/2018 15:57:20

11/02 16:00, , 6F
有分析給推
11/02 16:00, 6F

11/02 16:16, , 7F
結果還是兩個著名的打者天堂 XD
11/02 16:16, 7F

11/02 16:22, , 8F
有哦齁! 給箭頭
11/02 16:22, 8F
好險有打,不然要被噓了QQ

11/02 16:23, , 9F
棒子爺雖然* 但擊球力道真的超猛 都把球打進以最近過
11/02 16:23, 9F

11/02 16:23, , 10F
世的巨人前輩為名的海灣
11/02 16:23, 10F

11/02 16:24, , 11F
更正 不是"都" 而是"多次"
11/02 16:24, 11F
※ 編輯: allen63521 (124.199.104.223), 11/02/2018 16:25:45

11/02 17:14, , 12F
不然四樓是要期待什麼?我還蠻想知道的
11/02 17:14, 12F

11/02 17:36, , 13F
有分析有推
11/02 17:36, 13F

11/02 17:45, , 14F
擊球是有帶轉速的 不用考慮啊?
11/02 17:45, 14F
報告長官,其實有幾個理由啦 1. 我手上資料庫沒有打者的擊球轉速 2. 所有Statcast向的文章在算xwOBA之類的東西也不會把轉速加入考量,所以我不會用,也不覺得要用XD 另外就是大家可能知道投手轉速2700很快等等,但我自己,或是這裡的很多人根本就對擊球轉速沒概念吧 同樣轉速2000的球搞不好還分成上旋下旋,丟進去模型說不定還跟距離沒有顯著關係

11/02 18:00, , 15F
我期待看到褲而濕其實是偏投手球場
11/02 18:00, 15F
※ 編輯: allen63521 (58.114.159.252), 11/02/2018 18:31:08

11/02 18:30, , 16F
推分析,要等到樓上那結論大概得等氣候變遷?
11/02 18:30, 16F

11/02 18:36, , 17F
不用啊,把牆後退50呎就好
11/02 18:36, 17F

11/02 19:09, , 18F
11/02 19:09, 18F

11/02 19:10, , 19F
如果真的得出這樣的結論 你會信??
11/02 19:10, 19F

11/02 19:29, , 20F
喔齁
11/02 19:29, 20F

11/02 19:36, , 21F
推詳細分析
11/02 19:36, 21F

11/02 20:02, , 22F
barrel裡面用EV跟LA算其實就已經可以篩掉很多不營養的球
11/02 20:02, 22F

11/02 20:02, , 23F
了,轉速的差異性應該不大(應該啦
11/02 20:02, 23F

11/02 20:25, , 24F
11/02 20:25, 24F

11/02 20:37, , 25F
推推
11/02 20:37, 25F

11/02 20:45, , 26F
結論跟印象相同才知道印象不只是印象啊,有啥問題
11/02 20:45, 26F

11/02 21:28, , 27F
11/02 21:28, 27F

11/02 21:59, , 28F
把感覺化為數據
11/02 21:59, 28F

11/02 22:22, , 29F
喔齁
11/02 22:22, 29F

11/02 23:03, , 30F
想看黑猛或是納豆FA會拿到什麼合約
11/02 23:03, 30F

11/02 23:08, , 31F
知其然更要知其所以然啊 這樣沒啥不好
11/02 23:08, 31F

11/02 23:41, , 32F
讚 印象喜金A
11/02 23:41, 32F

11/03 04:23, , 33F
推好文+12樓
11/03 04:23, 33F

11/03 08:18, , 34F
結論:Coors是投手球場 反應:這啥爛數據
11/03 08:18, 34F

11/03 08:40, , 35F
好文,請問大大有無擊球仰角&初速,綠色怪物與一般球場
11/03 08:40, 35F

11/03 08:41, , 36F
的距離差距文獻,謝謝
11/03 08:41, 36F
文章代碼(AID): #1Rt01a9q (MLB)