Re: [閒聊] 本季VORP值前10名

看板NBA作者 (溫一壺月光作酒)時間7年前 (2017/03/03 23:45), 7年前編輯推噓25(25020)
留言45則, 25人參與, 最新討論串2/2 (看更多)
※ 引述《dragon803 (wet)》之銘言: : 有一種數據叫做VORP,Value Over Replacement Player : 也就是替換球員差值,替換你的球員與你的差距 這邊完全搞錯了, VORP跟誰替換你完全無關 要講VORP, 要先知道BPM(ASPM), VORP是完全基於BPM(ASPM) 所謂的Replacement Player, 其實是一個想像中的球員 就是你隨時可以從次級聯盟例如NBDL或是CBA, 簽到的球員 一般我們可以稱這種球員為免洗球員或是底薪球員, 可以說是雜魚中的雜魚 而VORP, 就是一個球員比免洗球員能多做出多少貢獻 在這邊, VORP把Replaement Player的水準設定為BPM=-2 所以一個球員的BPM比-2高多少, 乘上他出賽時間比例, 就是他的VORP 不過我主要想要強調的是, BPM不是一個很有意義的數據 BPM是建立在這幾年很紅的RPM的基礎上 他是用所有%系列的進階數據, 兜成如下的函式 a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK% + f*AST% - g*USG%*TO% + h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr - Lg3PAr) - k] + l*sqrt(AST%*TRB%) 然後用2000-2014年的RPM資料跑回歸分析, 算出上面的a~l參數的值 OBPM也是用一樣公式、一樣的方式, 只是目標改成ORPM, 算出a~l 但是DBPM如果用一樣的方式作的話, 會導致OBPM+DBPM<>BPM的結果 於是發明者在這邊用了一個取巧的方法 就是不再去算DBPM, 而是直接讓DBPM=BPM-OBPM 這樣就可以確保OBPM跟DBPM相加會等於BPM 這邊可以看到三個問題 1.得到DBPM的方式本身就莫名其妙 2.既然是用回歸分析跑RPM, 幹嘛不直接看新一年度的RPM 卻要用這種從舊資料得出的公式, 去間接算出來? 3.公式的設計本身的合理性就無法保證, 為什麼BPM跟OBPM用的是同樣的函式?  有些很明顯跟進攻不會有關係的數據, 為甚麼也用在OBPM上? : 通常這個數據可以看出誰是對該球隊「最不可取代的球員」 跟這個無關 : Lebron James以113.9的累積數據排行NBA歷史第一,代表著他對所屬球隊的「無可取代性 : 」,也佐證他對所屬球隊的強大影響力,反面來看,一旦少了他,這個球隊會瞬間瓦解 : Lebron在這個數據上曾經於2005-2013都維持單季第一,直到2013-14才被Durant奪走 : 而在Durant本季加盟後,Curry對勇士的「不可取代性」,也有點下滑的趨勢 : 從過去兩個球季來看,Curry分別以9.81、7.86的累積數據成為聯盟所屬球隊最不可取代 : 的球員,不過本季在Durant加盟後這個數據不僅滑落到了第10名,Durant的名次更是比他 : 前面,這代表著對勇士來說,Durant的「不可取代性」比Curry更高。 -- 願歲月靜好,現世安穩 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.81.61 ※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1488555922.A.017.html

03/03 23:48, , 1F
專業推
03/03 23:48, 1F

03/03 23:54, , 2F
基準是拿豪神當標準嗎?
03/03 23:54, 2F

03/03 23:56, , 3F
專業推
03/03 23:56, 3F

03/04 00:02, , 4F
快推 免得被發現我看不懂
03/04 00:02, 4F
※ 編輯: IBIZA (122.116.81.61), 03/04/2017 00:03:20

03/04 00:12, , 5F
太專業了 我還是找女友研究人生
03/04 00:12, 5F

03/04 00:16, , 6F
I大你也回太快了吧
03/04 00:16, 6F

03/04 00:23, , 7F
推 真的是無厘頭,把一堆數據捏一捏變成瀨尿牛丸
03/04 00:23, 7F

03/04 00:24, , 8F
因為這篇東西他以前就在板上講過了
03/04 00:24, 8F

03/04 00:24, , 9F
VORP的概念聽起來跟棒球的WAR很相似
03/04 00:24, 9F

03/04 00:24, , 10F
所以不用再想可以馬上講出來吧
03/04 00:24, 10F

03/04 00:32, , 11F
原po對數據的解讀很可笑...box迷就是這樣傳染的
03/04 00:32, 11F

03/04 00:41, , 12F
樓上太高看box迷了 box迷是只看box那種
03/04 00:41, 12F

03/04 00:41, , 13F
啊就 籃球的量化分析很多概念是借用棒球計量而來的
03/04 00:41, 13F

03/04 00:42, , 14F
畢竟棒球的計量分析發展得早也比較成熟了
03/04 00:42, 14F

03/04 00:45, , 15F
BTW 兩種運動有本質差異 看籃球的量化分析要很小心
03/04 00:45, 15F

03/04 00:45, , 16F
數據分析可以多看緯來球評講解啊,記者也都會整理
03/04 00:45, 16F

03/04 00:45, , 17F
哈哈
03/04 00:45, 17F

03/04 00:45, , 18F
解讀,和box迷的解釋方法都好相近喔 果然高手在民
03/04 00:45, 18F

03/04 00:45, , 19F
間啊!
03/04 00:45, 19F

03/04 00:46, , 20F
好專業 想問下BPM跟RPM到底差在哪 我還是看不懂....
03/04 00:46, 20F
RPM只看正負分, 它是用大量的回合數, 試圖去消除隊友和對手的影響 理論上, 如果真的能排除隊友跟對手的影響 那麼剩下的就是球員個人對於正負分的影響 RPM需要很大量回合數, 才能有基本的準確度 之前在RPM發展時期的網頁上是說起碼要5000回合, 不滿5000回合的數據都只能參考 所以以前RPM都是打了半季才會有數據可以公布, 甚至很多球員跟本累積不到5000回合 RPM被ESPN吸收之後, 現在ESPN打十場就能公布數據, 不確定是怎麼辦到的 ESPN也沒有多作說明, 甚至連回合數也不公布了 不過我猜多半是犧牲準確度, 在回合數不足額的情況下就搶先發布 至於BPM, 它是希望能用比較簡單的方式, 也就是套公式, 就可以得到逼近RPM的結果 所以他用一系列%的進階數據為基礎, 兜出上面的公式, 然後用14年的資料跑回歸分析 去得到公式裡的每個參數 回歸分析是甚麼你可以參考下面網址 https://goo.gl/Reh3n7

03/04 00:59, , 21F
棒球和足球側的量化分析轉過來 @@
03/04 00:59, 21F

03/04 01:00, , 22F
好專業
03/04 01:00, 22F
※ 編輯: IBIZA (122.116.81.61), 03/04/2017 01:20:56

03/04 01:32, , 23F
欸你好像講第93582179835142576438次了
03/04 01:32, 23F

03/04 02:05, , 24F
是不要搖大大!!!
03/04 02:05, 24F

03/04 03:02, , 25F
太深了QQ 明天再看
03/04 03:02, 25F

03/04 05:07, , 26F
雖然我並不是統計專家 就你的第二個問題說一下 這
03/04 05:07, 26F

03/04 05:07, , 27F
其實是非常常見的統計或Machine Learning的應用 在
03/04 05:07, 27F

03/04 05:07, , 28F
你相信公式的合理性的這個前提下 也就是你相信BPM和
03/04 05:07, 28F

03/04 05:07, , 29F
RPM的差距大部分來自公式的變異性和Noise 那麼這個
03/04 05:07, 29F

03/04 05:07, , 30F
公式(或模型)的係數(或參數)不應該隨著不同的年度
03/04 05:07, 30F

03/04 05:07, , 31F
有所差異 一般來說 我們會把資料至少區分為Training
03/04 05:07, 31F

03/04 05:07, , 32F
Data和Test Data 那麼一般來說當年度的資料應該被
03/04 05:07, 32F

03/04 05:07, , 33F
視為Test Data 也就是檢驗公式的Data 而非用來幫助
03/04 05:07, 33F

03/04 05:07, , 34F
找到公式的參數
03/04 05:07, 34F

03/04 05:10, , 35F
當然全部的前提都是在相信公式的合理性下 才能有這
03/04 05:10, 35F

03/04 05:10, , 36F
樣的解釋 我猜他們應該試驗了非常多的次數不大於三
03/04 05:10, 36F

03/04 05:10, , 37F
次的多項式來當作公式(一般來說 次數超過三次很容
03/04 05:10, 37F

03/04 05:10, , 38F
易overfitting) 然後就這樣找到一個還不錯的模型吧
03/04 05:10, 38F

03/04 05:23, , 39F
不用理我前面講的公式的變異 那有點不對 應該是希
03/04 05:23, 39F

03/04 05:23, , 40F
望變異也很小 所以係數的差異也很小
03/04 05:23, 40F

03/04 06:55, , 41F
03/04 06:55, 41F

03/04 07:57, , 42F
看不懂給推 XD
03/04 07:57, 42F

03/04 08:05, , 43F
專業
03/04 08:05, 43F

03/04 09:34, , 44F
03/04 09:34, 44F

03/04 10:35, , 45F
看不懂給推
03/04 10:35, 45F
文章代碼(AID): #1OkO-I0N (NBA)
討論串 (同標題文章)
文章代碼(AID): #1OkO-I0N (NBA)