[分享] 簡介數據(二)

看板Elephants作者 (KDD)時間8年前 (2016/06/17 02:09), 8年前編輯推噓12(1204)
留言16則, 15人參與, 最新討論串1/1
數據簡介   本章將分成打擊、投手、綜合等層面介紹常見數據。(註1) (1) 打擊 (A) AVG 打擊率:H/AB   常見數值在0.25~0.30之間,大於0.30即是優秀成績。   OBP 上壘率:(H+BB)/(BB+SF+AB) 因為打者不只靠安打能上壘或推進壘包,上壘率能評估一名打者成功打擊 的機率,較打擊率更為精準。 SLG 長打率: TB/AB 長打率原意是指球員每一個打數能進佔多少壘包。對於球賽影響性來說,即 便是安打,仍可分成1B、2B、3B、HR等不同影響性,長打率比打擊率更能釐 清球員進攻時的破壞能力。 OPS 整體攻擊指數 : OBP+SLG = OPS 顧名思義就是把上壘率加上長打率,綜合評斷打者打擊成功機率和破壞力。 OPS+ : (OBP/ lg OBP + SLG/ lg SLG -1)*100% OPS+較OPS直觀,藉由和聯盟平均球員成績比較,如果OPS+是120球員,表示 該球員高於聯盟平均20%。 GPA = (1.8*OBP+SLG ) /4 根據多數論文研究出來資料,上壘率比長打率重要約1.8倍,但OPS 把兩者視 作同等重要,這是OPS為人詬病之處。因此GPA主要目的即是修正此問題,除 以4原因主要是希望此數值跟打擊率相近,判斷上更為直觀,一般GPA大於0.28 即是優秀球員。 (B) XR/27 XR=(.50 x 1B) + (.72 x 2B) + (1.04 x 3B) + (1.44 x HR) + (.34 x (HP+TBB-IBB))+(.25 x IBB)+ (.18 x SB) + (-.32 x CS) + (-.090 x (AB - H - K)) + (-.098 x K)+ (-.37 x GIDP) + (.37 x SF) + (.04 x SH) 出局數= AB-H+SH+SF+CS+GIDP XR/27 = XR / 出局數*27 棒球數據學家一直對於打擊表現能製造出多少分數表達濃厚興趣,經由多次研 究和迴歸分析,公式有相當多版本。XR表示一名球員創造出多少分數,考慮面 向從安打能力、選球能力、推進壘包能力和阻斷攻勢等多方向綜合評估,但此 數據屬於累績型,為了在同等基礎上考慮,把XR除非出局數*27,可視作一名球 員在27個出局數中提供多少分數。 (C) wOBA = 0.69*uBB+0.72*HBP+0.89*1B+1.27*2B+1.62*3B+2.10*HR)/(AB+BB-IBB+ SF+HBP) wRAA= ((wOBA-lg wOBA)/ wOBA Scale)*PA wRC =((wOBA-lg wOBA)/ wOBA Scale)+lg R/PA))*PA wOBA系統是另一位數據專家Tom Tango研發,主要也是因為ops有比重不均缺陷 ,故根據安打能力和選球能力去做分析,每年fangraphs網站均會對woba係數做 調整。一般而言,wOBA數值大於0.38即為優秀球員。 而WRAA則是延伸出的數據,主要是評估該球員比聯盟平均選手多貢獻幾分,wRC 和wRAA計算類似,主要差別在wRAA可能有負值,wRC較不易有負值,另外WRC+跟 OPS+觀念類似。 (2) 投手 (A) ERA 自責分率: ER/IP*9 ERA主要是評估一名投手若投滿27個出局數會丟幾分自責分 WHIP = (H+BB)/(IP) ERA僅能呈現出自責失分結果,但計算自責分時,RP有可能被安打後的失分是前 一位投手留下來的跑者,並不會計算在自己身上,故WHIP較ERA能顯現出投手的 壓制能力,其概念是每局讓多少名打者上壘。 ERA+觀念類似OPS+ (B) CER = {[(H - HR)*1.255 + HR*4]*0.89 + (BB + IBB + HB)*0 .56}*{HB + H + BB}/(Total Batters Faced) ERC = CER*9/IP - 0.56 自責分的認定非常主觀,每人認定失誤定義並不相同,故誕生了ERC(真實防禦率) ,ERC主要是利用被安打數、四壞、打席等數據對自責分做迴歸分析,數據較ERA 客觀許多。 (C) FIP= (13*HR+3*(BB+HBP)-2*K)/IP+constant Constant = lg era –(((13*lg hr)+(3*(lg BB+lg hbp ) – 2*lg k ) / lg IP) xfip=((13*flyballs*lg hr/flyballs % )+3*(HBP+BB)-2*k)/IP + constant FIP主要針對K、HR、BB、HBP等四項投手可控制因素對自責分做迴歸分析,概念是 去除掉守備失誤因素,其值因為易受飛球影響,故XFIP是針對球場因素修正。值得 注意的是曾有人做過中職迴歸分析,發現係數和MLB 有極大差異,以本人實際操作 後發現,數值和國外數據統計亦有不少差異,此部份仍有待確認是否適用於中職數 據分析。 一般來說FIP、ERC、ERA若能落在3~4之間就是不錯成績。 (3) 綜合 (A) WS (勝場分享指數) WS計算過程非常繁雜,所以我就不提供算法了。WS概念是分析勝場是如何組成,因 此把棒球比賽分成攻擊及防守兩種層面,而防守又分成投手和守備。藉由理論勝率 可得知該球隊賽季中攻擊和防守各佔多少比例,將勝場數*3分配給攻擊、投手、守 備方後,再統計每個球員表現,依序依表現分配得到各自的WS,即表示該球員表現 累績值為該隊得到幾場勝利。 (B) WAR 要解釋WAR有一點類似在玩電玩遊戲,一開始你只擁有一群板凳等級球員 (Replacement level),當你買進A球員替換一名板凳球員時,可以替你多拿到4.01 勝,則A球員的總WAR就是4.01。計算方式非常複雜,大底上一樣分成攻擊、防守、 投手WAR,以攻擊為例,若球員能比板凳球員一年多得到80分,贏一場勝利約需10分 ,則攻擊WAR就是80/10=8。但此數據若想套用在中職,考量到RA、RS不相同、前述 FIP不一定可以直接套用、球賽場數不同、守備數據甚難計算等問題,目前無法計算 WAR。 註1: 目前仍先介紹中職可計算數據為主,守備數據因資訊不足,日後有機會再介紹。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.171.216.165 ※ 文章網址: https://www.ptt.cc/bbs/Elephants/M.1466100566.A.8B2.html

06/17 02:16, , 1F
推!
06/17 02:16, 1F

06/17 02:23, , 2F
推!
06/17 02:23, 2F

06/17 02:26, , 3F
推解說
06/17 02:26, 3F
KDDKDD:轉錄至看板 Baseball 06/17 02:30

06/17 02:31, , 4F
war呢
06/17 02:31, 4F

06/17 02:32, , 5F
WAR晚一點再解釋啦 中職根本算不出來 我再想想怎簡介他
06/17 02:32, 5F

06/17 02:33, , 6F
06/17 02:33, 6F

06/17 03:14, , 7F
WinShares跟WAR我一直分不太清楚@@
06/17 03:14, 7F

06/17 03:16, , 8F
兩個是不同系統
06/17 03:16, 8F

06/17 07:30, , 9F
推!
06/17 07:30, 9F

06/17 08:21, , 10F
推~~ 這篇補充了好多之前不懂的進階數據 感謝
06/17 08:21, 10F

06/17 08:43, , 11F
推!
06/17 08:43, 11F

06/17 08:48, , 12F
推,又可以進階了
06/17 08:48, 12F

06/17 09:08, , 13F
不推不行
06/17 09:08, 13F

06/17 09:33, , 14F
大推
06/17 09:33, 14F

06/17 10:19, , 15F
這篇猛!!!
06/17 10:19, 15F

06/17 10:56, , 16F
推推
06/17 10:56, 16F
※ 編輯: KDDKDD (118.171.216.165), 06/17/2016 12:48:25
文章代碼(AID): #1NOkjMYo (Elephants)