Re: [討論] 超級賽爾提克人

看板NBA作者 (美夢)時間16年前 (2008/01/02 23:38), 編輯推噓52(52089)
留言141則, 40人參與, 最新討論串3/6 (看更多)
juby 27板友我想先問你個問題,你如果棒球跟籃球都有在看的話,那你 認為目前棒球統計學發展的比較成熟還是籃球統計學呢?是棒球統計學在 解釋棒球場上的問題時解釋的比較清楚還是籃球統計學在解釋籃球場上的 問題比較清楚呢? 籃球統計學應用在球場上的效力會比棒球統計學應用在球場上的效力來的 大嗎? 如果你認為籃球統計學的發展還不夠成熟到單獨拿來解釋球場上的問題, 為什麼你如此執著在於單單以籃球統計學來解讀比賽呢? 我從來不會反對拿籃球統計學來解釋球場上的事件,問題是我不會只拿籃 球統計學就來解釋籃球場上的事件,因為我知道籃球統計學這塊領域的成 熟度跟棒球統計學比起來還差的很遠,很多事件並沒有在籃球統計學中得 到滿意的解答,所以你覺得光用籃球統計學能解釋出多有用的資訊呢?特 別是你整篇文章就只秀出籃球統計學的資料時,你認為有多大的說服力呢 ? 如果你是提出看Celtics 比賽時的防守站位與戰術,再搭配籃球統計學的 觀點來論證的話,那起碼有一定的說服力,可是你卻只從籃球統計學的角 度就直接斷定Celtics 的防守失分一定要再上修,這會讓我感覺你覺得籃 球統計學無所不行,甚至可以完美預測未來的離群值走向(Celtics 目前 的防守失分),可是籃球統計學真的可以嗎? 重申那句話,你要使用這個統計學方法前,要先知道這個統計學方法的效 力與限制,你給我的感覺就是籃球統計學無敵,可以完美解釋出籃球場上 的事件,問題是籃球統計學的發展真的有你想像的這麼成熟嗎? 我寫文章也會引用數據來佐證,但是我不會把籃球統計學的數據就當成真 理去相信,因為我知道籃球統計學還有許多不完美之處,籃球統計學要讓 我全盤相信前,必須先發展到一個成熟的階段。 還有很重要很重要的一點,如果你也熟悉棒球統計學的話,你會發現棒球 統計學應用在解釋過去的發生事件有很大的發展,但是應用在預測未來的 事件時卻遇到不少瓶頸,尤其尤其是應用在預測那些right tail outliers 時更是屢次出現預測不準的狀況發生。就像你很愛舉的A-Rod 來說好了, 他 06 年低潮後,你要不要重新去看看棒球統計學預測他 07 年成績預測 成怎樣呢?而 A-Rod 在 07 年的表現又是怎樣呢? 除了 A-Rod 之外, 棒球統計學在預測鈴木一朗與王建民時又出現什麼樣 的問題呢? 只要是統計學的 model,在預測離群值時,都會出現很大的落差與不準, 所以你認為籃球統計學可以拿來預測目前Celtics 失分這個離群值嗎? 最近Yankees 板也有討論到統計學這方面的問題,我下面就引述某 版友的文章讓你看看。 研究最常見的問題就是用通則去套一個單一例子,研究人員常犯一個錯誤 ,就是把一個已經存在的model 去套用在一個新的例子上,說一定會打回 原形,或是一定不是常態。但一個好的研究人員知道,以前的準則只是以 當初的例子去推論,很久以前有研究指出人類100公尺的極限是9.8秒,就 是犯了這個錯誤。 以上摘錄自 Yankees 板,某版友的文章。 所以你知道你犯了什麼錯誤嗎? 在 Jordan 還沒出來以前,沒有人會認為一個得分後衛能主宰比賽成這麼 誇張的境界;在 Shaq 沒有出來以前,沒有人會認為以後會再出現一個能 夠比擬 Chamberlain 宰制禁區能力的中鋒;在 Kobe 沒有出來以前, 人 們甚至不認為現代的球員能夠單場拿下八十分以上;在 Kobe 沒有出來以 前,人們也認為單季當場平均 35 分以上的球員應該不會再出現了。 可是上面這些例子不就都活生生在我們眼前發生嗎?看了這麼多的例子, 為什麼你還執著去用以前的例子所堆積出來的統計學model 來預測未來的 離群值呢? 我前面一直在提的就是不要舉特例,因為統計學的效力常常無法涵蓋到右 邊與左邊的 outliers, 在這種情況下,你要拿統計學來預測一個離群值 會有多大的問題發生啊? Celtics 本季的防守能力是不是統計學裡的離群值啊?而你現在要拿以前 的資料所堆積出來的統計模型來預測未來的離群值?恕我說的坦白一點, 請你不要濫用統計學,統計學不是這樣用的。 雖然我很不喜歡在 NBA 板提到棒球的例子, 這一點我在前面幾篇就已經 講過了,真正了解棒球的人不會輕易地把籃球與棒球這兩門運動拿來類比 ,因為光是本質上就有很大的不同。不過你既然又舉了那麼多棒球的例子 ,那我就來聊聊對於你這些例子的看法。 棒球統計學發明出許多數據來衡量一位球員的貢獻與能力,並且把數據經 過年代、聯盟、球隊強度的調整,如:Win Shares、 VORP、 WPA、EqA、 BRAA、FRAA、WARP 等數據。 而現在的籃球統計學呢? 就問你一個問題就好,如果光看數據統計的話,你要怎麼去解釋 Ray Allen 、Paul Pierce、Kevin Garnett等三人的數據在Celtics 為什麼都下滑下 來呢? 難道是他們三個人都開始退化了? 這裡的變化能夠從數據本身解讀出什麼東西嗎? 而棒球統計學行不行呢? 在這裡舉一個粗淺到不行的棒球統計學例子。 今年明星賽前 Dan Haren 的成績是 2.30 ERA,基本上以過去的例子告訴 我們美聯要出現低於 2.50 ERA 的投手是相當相當少見的,但是這只是以 過去的例子來解釋而已,如果棒球統計學只能做到這樣的話,那就犯了跟 juby27 你前面一樣的錯誤,以過去的統計 model 來預測未來的離群值。 很遺憾地,棒球統計學能做到的不僅僅是以過去來預測未來而已,Haren 前半季的好成績有一個很重要的原因是他的 BABIP 低到只有 .234 而已 ,FB 玩家看到這裡就會知道 Haren 的好成績是基於他異常的 BABIP,而 不是他本身的實力表現。在明星賽後,等到 Haren 的 BABIP 升到 .357 之後,他的成績就慢慢又調回來了。 而現在的籃球統計學光是看數據統計要如何去解讀 Allen、Pierce、Garnett 三人的數據下滑呢? 你不看比賽只看數據看的出來為什麼數據下滑嗎? 要先搞清楚籃球統計學的限制,然後再去使用它,而不是動不動就想要用 籃球統計學來解釋球場上的任何事件,如果你正在做這種事情,那很抱歉 ,我覺得你濫用籃球統計學的精神。 還有你一直在舉 A-Rod 在 07 年四月的高潮演出來證明他的全壘打數會下 修。你是不是搞錯了什麼?A-Rod 今年四月的打數是多少?是 93 個AB , 而他整季是幾個打數啊?583 個AB。才 16 % 的打數而已,這完全就是小 樣本的數據啊! 任誰都知道這種小樣本的數據拿來預測任何東西都會有很 大的偏差。 你這個例子就像是拿籃球的例子來舉也是一樣,上個球季 Kobe 曾經連續 四場比賽拿到 50 分以上,這四場比賽 Kobe 的總合 FGA 是 140 個(四 場平均是一場 35 個 FGA),而他整季下來的 FGA 是 1757 個( 一場平 均是 22.8 個 FGA),這很顯然也是小樣本數據下的結果,拿這個來預測 2006-07 球季的 Kobe 在未來幾場會得到平均50分以上也是會有相當相當 大的誤差,這不是很顯然易見的道理嗎? (我當然知道得分不是光看 FGA 而已,只是這邊我著眼在於提出 Kobe 在那四場球誇張的 FGA 數與整個球季的常態有很大的落差。) 所以你反覆提A-Rod的例子是想證明什麼呢?不就是小樣本下的結果嗎? 而現在整個賽季的比賽裡,Celtics 已經打超過三分之一的賽季了,這跟 你前面舉的小樣本數據有一樣嗎?可以拿來一起比較嗎? 我上面的論點簡單總結就是: 1、籃球統計學還有許多發展空間,也還不夠成熟,它還不能夠讓你來完美 的詮釋球場上發生的事件,所以千萬不要以為拿出籃球統計學就是真理 。 2、統計學是拿以前的資料來做分析並建立模形,在解釋以前發生的事件時 會有很不錯的效力,但是拿來預測未來的事件會有相當大的誤差,尤其 是你拿來預測未來事件的離群值時會出現更大的偏差。 如果你認為今年球季Celtics 的防守失分能力是個離群值,那你還執意要用 過去資料所組成的model 來預測今年Celtics 的失分能力,那很抱歉,這個 系列我就只回文到這邊,因為我想講的話都在上面說了。 ps:在這邊講太多棒球的例子不太應該,我本身也反對在籃球討論群組談棒 球的例子,回文只是針對 juby27 的一些盲點做出回應,對不喜歡在籃 球討論群組看到棒球文的板友說聲抱歉。 -- http://blog.pixnet.net/IZXNHSO 個人 Blog,歡迎參觀指教。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.168.15.85

01/02 23:38, , 1F
我早就準備好雞排了 科科
01/02 23:38, 1F

01/02 23:41, , 2F
01/02 23:41, 2F

01/02 23:41, , 3F
我叫好小姐了..
01/02 23:41, 3F

01/02 23:41, , 4F
因此打籃球還不是算數 但打棒球已經是了
01/02 23:41, 4F

01/02 23:42, , 5F
半夜不要發宵夜文拉
01/02 23:42, 5F

01/02 23:44, , 6F
看這種文章真爽 科科 真正的頂尖對決...
01/02 23:44, 6F

01/02 23:43, , 7F
頂尖統計學家都研究醫學領域的 真希望來個研究運動領域
01/02 23:43, 7F

01/02 23:44, , 8F
先推再看 比較贊同你的><
01/02 23:44, 8F

01/02 23:44, , 9F
放心 數據派已經開始介入NBA了 火箭總管就是
01/02 23:44, 9F

01/02 23:45, , 10F
只是如同我前篇的推文 數據派還沒在NBA取的成功 還有待
01/02 23:45, 10F

01/02 23:46, , 11F
考驗 如果火箭GM能成功帶起火箭 能預見的是更多數據派進
01/02 23:46, 11F

01/02 23:46, , 12F
入NBA做GM...
01/02 23:46, 12F

01/02 23:48, , 13F
籃球統計學正在起步,我也希望它能發展的很健全與成熟。
01/02 23:48, 13F

01/02 23:49, , 14F
但是現在就認為籃球統計學是真理恐怕就走錯方向了。
01/02 23:49, 14F

01/02 23:49, , 15F
推 打從拿數理來做例子就已經註定他先入為主的觀念
01/02 23:49, 15F

01/02 23:51, , 16F
有道理 受教了
01/02 23:51, 16F

01/02 23:51, , 17F
推推 棒球統計學真的是歷史悠久成熟...籃球還真是一百人有
01/02 23:51, 17F

01/02 23:52, , 18F
一百種看法 XD
01/02 23:52, 18F

01/02 23:54, , 19F
juby版友請趕快來看這篇 真理越辯越明...也許就靠你們兩人
01/02 23:54, 19F

01/02 23:54, , 20F
推 邏輯清楚
01/02 23:54, 20F

01/02 23:55, , 21F
把籃球統計學給搞起來哩 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
01/02 23:55, 21F

01/02 23:56, , 22F
目前籃球數據的確太過貧乏,不過我覺得籃球還是要往數據
01/02 23:56, 22F

01/02 23:58, , 23F
的方向發展,將世界數字化雖然不保證一定能夠觸及所有真
01/02 23:58, 23F

01/02 23:59, , 24F
理,但某程度上經常是通往真理的捷徑。當然這必須有高度
01/02 23:59, 24F

01/03 00:00, , 25F
成熟的計量與分析方法論來輔佐才行,應該是努力的方向。
01/03 00:00, 25F

01/03 00:01, , 26F
不要忘了就算是成熟的棒球統計學也無法成功的預測離群值
01/03 00:01, 26F

01/03 00:01, , 27F
謙和的態度 嚴謹的推論 豐富的資訊 只能說高下立判
01/03 00:01, 27F

01/03 00:02, , 28F
所以還是那句老話嗎? 打籃球 不是在做算術 XDDDDDDDDDDDDDD
01/03 00:02, 28F

01/03 00:02, , 29F
推邏輯清楚的這篇~
01/03 00:02, 29F

01/03 00:03, , 30F
統計又不是算命 還想預測未來哩
01/03 00:03, 30F

01/03 00:03, , 31F
是啊,我並未忽略這點,但我想如何繼續發展統計方法,以
01/03 00:03, 31F

01/03 00:04, , 32F
推 不過以"隊"的觀點和以"人"為觀點 哪個比較不容易失真?
01/03 00:04, 32F

01/03 00:04, , 33F
其將來能更準確預測,應該是比較好的努力方向吧。
01/03 00:04, 33F

01/03 00:04, , 34F
不過統計在籃球上勢必會遭遇困難,在蒐集數據上,如何在流
01/03 00:04, 34F

01/03 00:05, , 35F
只是籃球數據目前連分析過去資料的能力都還不夠好就是了
01/03 00:05, 35F

01/03 00:05, , 36F
講真的,兩位都言之有物,極具研討的價值~
01/03 00:05, 36F

01/03 00:05, , 37F
我覺得juby版友的想法並不是要預測離群值 而是以統計的角
01/03 00:05, 37F

01/03 00:05, , 38F
動的籃球比賽中紀錄,本身就很有難度!
01/03 00:05, 38F

01/03 00:06, , 39F
度去推斷超賽未來的表現
01/03 00:06, 39F
還有 63 則推文
01/03 01:08, , 103F
BIG的數據為什麼下滑,不是看數字就能知道原因的..推~
01/03 01:08, 103F

01/03 01:09, , 104F
推 TheDream的文章看起來就是舒服 不亢不卑
01/03 01:09, 104F

01/03 01:09, , 105F
所以我說或許根本是你們2位對統計學信仰的不同呀 這真的是
01/03 01:09, 105F

01/03 01:09, , 106F
不到最後結果出來 誰也說服不了誰 但所以我說2位都有理
01/03 01:09, 106F

01/03 01:11, , 107F
連不亢不卑都出來了
01/03 01:11, 107F

01/03 01:11, , 108F
如果只看結果的話,大家都不用分析了啊!XDDD
01/03 01:11, 108F

01/03 01:11, , 109F
monmo 我文章是指出juby27用統計學的方式錯誤了,一開始
01/03 01:11, 109F

01/03 01:12, , 110F
不是這樣說的啦 分析本來就不見得確定誰有理 重要的收穫是
01/03 01:12, 110F

01/03 01:12, , 111F
BIG3
01/03 01:12, 111F

01/03 01:12, , 112F
彼此激發對於思考過程中的各種角度 我個人是覺得2位都讓我有
01/03 01:12, 112F

01/03 01:12, , 113F
他的分析方法就無法站住腳,結論當然也就不用看了啊!
01/03 01:12, 113F

01/03 01:13, , 114F
收穫...美夢你說的我了解 不過我想judy兄想法跟你應該不同
01/03 01:13, 114F

01/03 01:14, , 115F
除非他真的認為籃球統計學能預測很準,且能預測離群值。
01/03 01:14, 115F

01/03 01:14, , 116F
而那不同可能就牽涉到彼此對統計學能做到的事情的不同觀感了
01/03 01:14, 116F

01/03 01:14, , 117F
不然的話,他的其他內容都是基於這兩點下去建立的。
01/03 01:14, 117F

01/03 01:15, , 118F
對 就像你說的...不過我認為他信服的是"團隊"的統計數字
01/03 01:15, 118F

01/03 01:15, , 119F
這也是我認為美夢你比較多舉"個人"來談籃球統計 其實大概也
01/03 01:15, 119F

01/03 01:15, , 120F
籃球統計學如何從人的數據轉換成隊的數據又是另外一項功
01/03 01:15, 120F

01/03 01:16, , 121F
說服不了他的原因 這也是我提到個體經濟VS總體經濟原因
01/03 01:16, 121F

01/03 01:16, , 122F
課了,隊的數據是由人的數據堆積出來的,要讓人信服隊的
01/03 01:16, 122F

01/03 01:17, , 123F
我認為還是可以引入 Time series的去預測趨勢,不過目前
01/03 01:17, 123F

01/03 01:16, , 124F
數據以前,籃球統計學必須先做到人的數據完整性。
01/03 01:16, 124F

01/03 01:16, , 125F
這門功課我不行XD 只能提出我看到的討論差異 如果可以 能否
01/03 01:16, 125F

01/03 01:17, , 126F
還沒有看過有人用這個工具。 ^想法
01/03 01:17, 126F

01/03 01:17, , 127F
請你從這角度切入呢? 拿"隊"數據之於籃球統計學的發展來探討
01/03 01:17, 127F

01/03 01:18, , 128F
其實我也跟各位一樣還在摸索籃球統計學。
01/03 01:18, 128F

01/03 01:19, , 129F
我被你對離群值的不可預測性說服 但judy來長期"隊"於全聯盟
01/03 01:19, 129F

01/03 01:19, , 130F
而且統計學老實說不是我的強項。XD
01/03 01:19, 130F
※ 編輯: TheDream 來自: 118.168.15.85 (01/03 01:21)

01/03 01:19, , 131F
的數據有參考價值我也認同 不過我也認為judy太高估統計數據
01/03 01:19, 131F

01/03 01:21, , 132F
所能達到的預測或評估效果...
01/03 01:21, 132F

01/03 01:24, , 133F
我是覺得籃球的統計學比之棒球可能難發展太多啦
01/03 01:24, 133F

01/03 01:25, , 134F
籃球的團隊影響比棒球的大太多
01/03 01:25, 134F

01/03 01:26, , 135F
而且籃球場上的對抗因子更多,所以心理層面的影響也大
01/03 01:26, 135F

01/03 01:27, , 136F
用統計學是難以解讀關鍵play所造成的影響的
01/03 01:27, 136F

01/03 04:14, , 137F
juby27大 認為目前樣本不足 也認為超賽不是特例
01/03 04:14, 137F

01/03 04:15, , 138F
所以用統計學論述 應該可以接受吧
01/03 04:15, 138F

01/03 04:16, , 139F
就算統計學不成熟也還是能參考看看
01/03 04:16, 139F

01/03 08:17, , 140F
好文 真正抓到point
01/03 08:17, 140F

01/03 12:12, , 141F
真的很厲害…我佩服u
01/03 12:12, 141F
文章代碼(AID): #17Uw_j0M (NBA)
文章代碼(AID): #17Uw_j0M (NBA)