Re: [外電] 普人震怒

看板MLB作者 (小孩)時間11年前 (2014/03/08 08:29), 編輯推噓22(22075)
留言97則, 15人參與, 最新討論串4/7 (看更多)
※ 引述《tlchen (台灣加油)》之銘言: :   OPS+ 真的能讓張飛打岳飛嗎?我們來看一個小例子。 :   某甲為十年前某校的畢業生,成績全校第一名,平均分數為 98 分。 :   當年全校學生平均分數為 70 分。 假設標準差7分, 甲的z分數4分 :   某乙為今年同一所學校的第一名畢業生,平均分數為 90 分。 :   今年全校學生平均分數為 60 分。 若標準差10分, 乙的z分數是3分 甲是比乙好的 棒球員到底要用ops+比還是用z分數比 應該還不知道哪種比較好 標準差的資料也不知道去哪找 :   為了能讓甲乙相比,某丙創造了一個 score+, : 公式是個人成績除以全校平均再乘 100 : 根據 score+,某乙 150 海放某甲的 140,是個較優秀的學生。 :   發現這樣論證的問題了嗎?score+ 或 OPS+ 這種東西, -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.168.244.153

03/08 08:38, , 1F
Baseball databank可以download
03/08 08:38, 1F

03/08 08:38, , 2F
攻擊數據都是可以免錢跑的
03/08 08:38, 2F

03/08 11:27, , 3F
若有碩士主修統計的,若剛好有指導老師願意幫助玩這些資料
03/08 11:27, 3F

03/08 11:27, , 4F
我相信是很有機會海放目前的棒球統計
03/08 11:27, 4F

03/08 11:40, , 5F
海放? 樓上真當美國那些數據專家沒統計背景嗎...
03/08 11:40, 5F

03/08 11:46, , 6F
台灣就有經濟統計碩博士生在寫運動相關的論文了...
03/08 11:46, 6F

03/08 11:47, , 7F
經濟學也有運動經濟學這塊還有期刊 多的是在跑計量的論文
03/08 11:47, 7F

03/08 11:51, , 8F
期刊,研討會都有,統計界每年的大拜拜,也有運動統計
03/08 11:51, 8F

03/08 11:51, , 9F
問題是有多少人,多少心力真正投入
03/08 11:51, 9F

03/08 11:53, , 10F
若一開始的人稍微有點統計概念,就不該是OPS+這種觀念出現
03/08 11:53, 10F

03/08 11:59, , 11F
所以這跟你"有碩士主修統計且教授願意幫助就能海放"
03/08 11:59, 11F

03/08 12:00, , 12F
你這種講法好像都沒有念經濟統計的人在做這塊一樣~
03/08 12:00, 12F

03/08 12:13, , 13F
推OalexO
03/08 12:13, 13F

03/08 12:21, , 14F
講的數據好像只有OPS+一樣Orz
03/08 12:21, 14F

03/08 12:35, , 15F
海放? XDDDD
03/08 12:35, 15F

03/08 13:10, , 16F
海放嗎............................................
03/08 13:10, 16F

03/08 13:11, , 17F
只能說 紅雀每年付給Tango那麼多錢 紅襪付給James那麼
03/08 13:11, 17F

03/08 13:11, , 18F
多錢 不是沒理由的
03/08 13:11, 18F

03/08 13:12, , 19F
OPS+甚至更進一步的WAR之類你能在BR或FG查到的數據都
03/08 13:12, 19F

03/08 13:12, , 20F
是給球迷的小玩具 球隊內部的統計工具發展比這複雜多
03/08 13:12, 20F

03/08 13:18, , 21F
抱歉記錯 Tango現在是小熊的人
03/08 13:18, 21F

03/08 13:34, , 22F
說海放的真是搞笑,你能海放早就被付錢請去了
03/08 13:34, 22F

03/08 13:35, , 23F
OPS+是好算又誤差不會太大
03/08 13:35, 23F

03/08 13:37, , 24F
真的當Sabermetrics只有這點東西啊?
03/08 13:37, 24F

03/08 14:06, , 25F
原來美國球團都是槌子, 便宜的學校學生不找, 去花大錢買
03/08 14:06, 25F

03/08 14:06, , 26F
隨便都會被海放的垃圾
03/08 14:06, 26F

03/08 14:48, , 27F
數據當然不只有 OPS+, 還有像是討論價值用 WAR
03/08 14:48, 27F

03/08 14:49, , 28F
統計量本身沒有錯,但不知統叶量該怎麼用,被海放只是剛好
03/08 14:49, 28F

03/08 14:50, , 29F
機密的東西,做到多好,看不到無法評論
03/08 14:50, 29F

03/08 14:51, , 30F
但以目前 Sabermetrics 所公開展現的東西
03/08 14:51, 30F

03/08 14:51, , 31F
我是真的認為,碩士生就能做得比他們好
03/08 14:51, 31F

03/08 14:52, , 32F
FG或BR這種放來給大家wow一下的數據本來就是如此
03/08 14:52, 32F

03/08 14:52, , 33F
當然,若是跟著目前主流 Sabermetrics 的作法,那不會有
03/08 14:52, 33F

03/08 14:52, , 34F
不管是WAR或OPS+ 這背後都有隱含一個概念: 雖然年度不
03/08 14:52, 34F

03/08 14:53, , 35F
同 但是talent分布理論上差距不會太大
03/08 14:53, 35F

03/08 14:53, , 36F
什麼特別的東西.得要自己重新去想想,到底怎樣才是合適的
03/08 14:53, 36F

03/08 14:54, , 37F
WAR 要衡量 talent, 我沒有太大的意見
03/08 14:54, 37F

03/08 14:55, , 38F
但要來衡量貢獻度,那叫掛羊頭賣狗肉
03/08 14:55, 38F

03/08 14:55, , 39F
你為什麼這麼有把握你幻想中的碩士生能想出一個"特別又
03/08 14:55, 39F

03/08 14:55, , 40F
WAR 本身沒錯,錯的是一堆人把它用在不該用的地方
03/08 14:55, 40F

03/08 14:55, , 41F
有創新性代表的數據阿"...
03/08 14:55, 41F

03/08 14:56, , 42F
衡量talent比衡量貢獻渡還難耶=.=
03/08 14:56, 42F

03/08 14:56, , 43F
t大上次吵過一次的論點我還記得啦 他就是認為關鍵時刻
03/08 14:56, 43F

03/08 14:56, , 44F
的關鍵一擊才是貢獻度的重點
03/08 14:56, 44F

03/08 14:57, , 45F
不用特別又創新,而是適不適合.就像 z-score 就足以海放
03/08 14:57, 45F

03/08 14:57, , 46F
那些 xxxx+
03/08 14:57, 46F

03/08 14:57, , 47F
那早就有WPA滿足你對關鍵一擊的的重視了
03/08 14:57, 47F

03/08 14:58, , 48F
xxxx+是個簡單的數據 只是代表一個球員"比平均"好多少
03/08 14:58, 48F

03/08 14:58, , 49F
我的確認為在衡量貢獻度上,WPA 遠勝 WAR
03/08 14:58, 49F

03/08 14:58, , 50F
當然如果要看talent分布的話z-score是比較精準沒錯
03/08 14:58, 50F

03/08 14:59, , 51F
貢獻度是看已發生的表現,而不是預測未來的表現或本身能力
03/08 14:59, 51F

03/08 14:59, , 52F
你確定大聯盟是常態分佈再來用z-core
03/08 14:59, 52F

03/08 15:00, , 53F
z-score 也同樣可以看比平均好多少
03/08 15:00, 53F

03/08 15:01, , 54F
我前面也說過,z-score 用來看極端值一樣不可靠
03/08 15:01, 54F

03/08 15:01, , 55F
如果你覺得標準化這麼有代表性 歡迎寫一寫你投期刊....
03/08 15:01, 55F

03/08 15:01, , 56F
但它就是比那些 plus 好上許多
03/08 15:01, 56F

03/08 15:03, , 57F
我不認為 z-score 比 xxx+ 有代表性,能投上什麼期刊 :)
03/08 15:03, 57F

03/08 15:04, , 58F
我只是想做 做這些東西的人很多..沒有您講的這麼不堪這樣
03/08 15:04, 58F

03/08 15:04, , 59F
看統計量,看它跟平均的比,去問問哪個統計的人信服
03/08 15:04, 59F

03/08 15:04, , 60F
當然啦,除非是大家已知那統計量要取 log 來處理比較準
03/08 15:04, 60F

03/08 15:05, , 61F
像是照片中的 intensity
03/08 15:05, 61F

03/08 15:05, , 62F
就我看Journal of Sports Economics裡面最少超過20篇
03/08 15:05, 62F

03/08 15:06, , 63F
在那樣的情況下,看比例,等於看 log 後的差距
03/08 15:06, 63F

03/08 15:06, , 64F
講棒球的文章在用你所謂的xxxx+ 再做迴歸
03/08 15:06, 64F

03/08 15:06, , 65F
如果你能講出他們用的東西沒用...那是還蠻值得丟期刊的阿
03/08 15:06, 65F

03/08 15:07, , 66F
20 篇是指 z-score 比 xxxx+ 的比較?
03/08 15:07, 66F

03/08 15:07, , 67F
你這一講就漏餡了,你只是認為用減的比用除的好而已
03/08 15:07, 67F

03/08 15:08, , 68F
我只能說,統計的人,根本不可能去認為 xxx+ 有機會而去用
03/08 15:08, 68F

03/08 15:09, , 69F
不是 是他們xxx+在當類似球員表現的分析
03/08 15:09, 69F

03/08 15:09, , 70F
那一個比較好明明就是要看跟實際狀況預測起來吻不吻合
03/08 15:09, 70F

03/08 15:10, , 71F
就像RC公式該不該全是線性組合一樣
03/08 15:10, 71F

03/08 15:10, , 72F
除非是完全按照打棒球的機制去模擬
03/08 15:10, 72F

03/08 15:11, , 73F
要不然線性組合就只是近似而已
03/08 15:11, 73F

03/08 15:11, , 74F
這是就會有人跳出來說,棒球的分數哪裡是這樣生成的
03/08 15:11, 74F

03/08 15:12, , 75F
所以這個不對怎麼樣的
03/08 15:12, 75F

03/08 15:16, , 76F
岔題,Z score,12-13 trout 2.6,01-02 Pujols 1.5
03/08 15:16, 76F

03/08 15:17, , 77F
樣本為PA qualified打者。待會做全打者
03/08 15:17, 77F

03/08 15:18, , 78F
12-13比01-02近似常態,1213 avg .338, stdev .078
03/08 15:18, 78F

03/08 15:19, , 79F
01-02 avg .351 stdev .062. 做完再上圖
03/08 15:19, 79F

03/08 15:20, , 80F
用wOBA做的?
03/08 15:20, 80F

03/08 15:21, , 81F
問一下資料來源是http://www.baseball-databank.org/
03/08 15:21, 81F

03/08 15:23, , 82F
IQR/1.35 0102=0.03 1213=0.04
03/08 15:23, 82F

03/08 15:24, , 83F
看跟實狀況預測起來吻不吻合?是要叫張飛跟岳飛真的打一場?
03/08 15:24, 83F

03/08 15:24, , 84F
03/08 15:24, 84F

03/08 15:25, , 85F
若有興趣,不如隨便找兩個 mean 不是零的分佈,然後各抽樣
03/08 15:25, 85F

03/08 15:26, , 86F
樣個幾百個,然後自己看一下,z-score 跟 xxx+ 那個比較準
03/08 15:26, 86F

03/08 15:27, , 87F
海放 XDDDDDDDD我每天鑽這個都沒這自信了你什麼豹子膽啊XD
03/08 15:27, 87F

03/08 15:27, , 88F
多做幾次,或許就有感覺,這為什麼根本沒什麼好爭論的
03/08 15:27, 88F

03/08 15:28, , 89F
找exponential distribution 出來的結果不就好了
03/08 15:28, 89F

03/08 15:32, , 90F
如果你認為 exponential distribution 合理,那你贏了
03/08 15:32, 90F

03/08 15:32, , 91F
前面已經推過,除非已知取 log 後來處理是比較有意義的
03/08 15:32, 91F

03/08 15:33, , 92F
已知已知,不要忘了已知是怎麼來的
03/08 15:33, 92F

03/08 15:33, , 93F
你認為那些數據該先取 log 的話,那我也不便多說什麼了
03/08 15:33, 93F

03/08 18:12, , 94F
為什麼一定要張飛打岳飛,可不可以關羽打項羽?
03/08 18:12, 94F

03/08 19:25, , 95F
都不要看數據 就好了(誤
03/08 19:25, 95F

03/08 19:56, , 96F
任何數據都不是完美的qq
03/08 19:56, 96F

03/11 15:58, , 97F
海放勒,超好笑的
03/11 15:58, 97F
文章代碼(AID): #1J6cHy-k (MLB)
討論串 (同標題文章)
文章代碼(AID): #1J6cHy-k (MLB)