[外絮] How to be statistically biased: Henr …
這是對先前Henry Abbott文章的回應
網誌版: http://cf-young.sytes.net/blog/?p=215
How to be statistically biased: Henry Abbott on Kobe Bryant
by C.A. Clark on Jan 28, 2011 1:59 PM PST in Editorial
http://tinyurl.com/4vpx2vj
如何使用籃球的進階數據時常令我陷入掙扎。 一方面,我喜歡這些從不同角度觀看數據
所提供的資訊,我發現統計的論據是如此迷人且令人信服的。在如何運用進階數據與令他
們更加容易被大眾理解上我下了許多功夫。我也堅信有了這些進階數據,可以讓我們從之
前不可能的角度中去了解比賽。
但在另一方面,進階數據卻常常提出與我意見相左的論點。我得坦率地承認其中很大一部
分來自於我對洛杉磯湖人隊的偏愛。進階數據很少為我認為湖人隊所應得的讚揚背書,而
且它們常常被用來將Kobe從球迷(NBA中大部分的GM、球員)築起的高台上擊落。 沒有一個
球員比Kobe在統計數據上更引人爭議。 人們喜愛用數據引證為什麼Kobe並沒有我們認為的
那麼好。很多論點並不為我所同意。
我們很難客觀地去反對一個統計論據,畢竟數據就是一個冷酷、確鑿的事實。無論你怎麼
解讀,Fisher今年38%的命中率就有如巨石般難以撼動。而做統計的人馬上就能從這個他
們的訊息中指出這個事實。在這方面,他們是無庸置疑的正確。問題在於一個統計論據在
被呈現的時候所含的偏見也可以一點都不少於一個非統計的論據。一個典型的例子就是
Henry Abbott最新的大作。(http://tinyurl.com/63plju8)
只是我們要清楚,這不是一篇反數據的文章,而是一篇反Abbott的文章。
Abbott今天指出,Kobe在關鍵時刻的表現並不符合先前我們大家所稱呼的「關鍵之王」。
他的論點並沒有錯,但也並非正確。簡單地說,無論從個人私心或 (希望是)非私心的角
度來看,這個論點是有缺陷的。以下讓我們一一來檢視這個論點。
過時的資料
在定義關鍵時刻的表現時,如何定義「關鍵時刻」一直是這問題的癥結點。所以Abbott確
保可以涵蓋所有…一部分的標準。他從Kobe投進關鍵一擊的能力開始,引入了
82games.com的數據顯示,在五年的時間裡面,Kobe還能在「比賽終結者」的爭論裡保有
一席之地的唯一理由是因為它在關鍵時刻遠遠超出其他球員的出手數。Kobe繳出了令人沮
喪的數字。在這些情況下,Kobe在56次的出手中只命中了14球,外加僅僅一個助攻。而像
是Lebron James和Vince Carter,不管是在命中數或是命中率上,都在這份排名裡佔據了
較高的位置。在這份名單中,有許多球員,從角色球員到明星球員,都繳出了比Kobe更高
的命中率。十分令人信服的數據,但只有一個問題… 所有的數據都取自2003到2009球季
,而且2009球季的數據只取了一半。
讓我們在腦中快速(且痛苦地)檢視一次這幾個球季。03-04是OK連線的最後一年,也是
Kobe身陷強暴案事件的一年,而所有說他是個自私的球員的指控也到達了最高點。下個球
季Shaq離開,留下的是Kobe和一個殘破的陣容,直到2008年Bynum開始展露頭角和Gasol加
入。所以Abbott用來指控Kobe的第一個樣本是取自Kobe最獨,球隊陣容最殘破的時候。非
常有趣的是,接下來他引用了ESPN數據部門的某人給他的資料來說明Kobe整個15年的職業
生涯中的表現也沒有比較好。OK,同意。
要澄清的是,我並沒有要幫Kobe找任何可以開脫的藉口。是的,在2004年時他打得非常自
私,也很有可能是他使球隊喪失了總冠軍的機會。是他使球隊的陣容在接下來的幾年中如
此殘破,並且持續他自我第一的球風好幾年。如果Abbott是在兩三年前提出這個論點,我
沒有任何一個比「Abbott是個反科迷。」更好的論點來反駁他。
但是,Abbott用的數據恰好有一點點過時,讓我補完這段缺漏:自從2009球季開始,Kobe
在同樣的情況下繳出了22投11中的成績,同時外帶三個助攻,他的助攻/出手數的比例要
高於2003-2009的Lebron James。但同時令人震驚的是,Kobe在季後賽卻是4投0中。注意
,這個小樣本可以被拿來推翻我的整個論述,但我還是將它包含了進來。為什麼?因為我
試著盡可能讓這個論述不帶有個人偏見。此外,即使Kobe在季後賽中錯失了4次出手,他
在超過兩季的常規賽中卻繳出了50%的命中率。這不是也讓我們能從不同的面向中來看事
情嗎?
低命中率的原罪
沒有什麼東西在本質上比使用過時的數據更帶有偏見。他使用這些數據但是在他們有著大
幅的改變後卻不加以更新是非常草率,甚至偷懶的行為。下一個他用的手段就更卑劣了。
看看轉自他文章的一部分:
只要一次命中就能贏得所有的掌聲及喝采。即使他投不進的次數比命中數的兩倍
還多,整個NBA卻仍然同意他就是執行最後一擊的那個人?
他在關鍵時刻的產出在今年上半季稍微好(http://tinyurl.com/4ohxuw5)一些,但在
聯盟中依然算不上最好。不管你分析多少場球賽,一年、五年、十五年,或是不管你
如何定義「關鍵時刻」都改變不了這個事實 (你可以有很多種方法來切割這些比賽)。
關鍵時刻定義與切割方法:
http://www.82games.com/0809/CSORT11.HTM
http://www.82games.com/0910/CSORT11.HTM
http://www.82games.com/1011/CSORT11.HTM
http://tinyurl.com/4sdqxav
如果你錯過了,這個段落的轉變表示他要停下來談論「關鍵一擊」並接著談論「關鍵時刻
」的定義 ─ 剩下5分鐘內,差距小於或等於5分的比賽。
我不能怪罪你錯過了這一段,因為沒有任何的跡象顯示他會在中途轉變他對「關鍵時刻」
的定義。如果我們繼續使用先前的定義,湖人這季在最後24秒時落後不到兩分的情況只有
兩次而已。這兩次落後的情況下,Kobe投1中1 (諷刺的是,這球並不是致勝一擊,最後是
Fisher在槍響時的上籃終結了快艇) 並且傳出了一次助攻給了Blake投出致勝一擊 (正好
就是本季的第一場比賽)。
我很確定,如果我直截了當的問,Abbott會說他只是試著涵蓋所有可能的比較基準,但你
應該會想讓人們知道哪些情況被包括在內,尤其當不同的標準分別給出了不同的論述的時
候。喔,等等,他們並沒有做出不同的論述。注意原文的第二段的第一句「他在關鍵時刻
的產出在今年上半季稍微好一些,但在聯盟中依然算不上最好。」如果你真的按下了那個
連結,你會發現這句話確實正確…因為前六名都是控衛。在這球季的前半段,Kobe顯然是
非控衛中在關鍵時刻表現最好的,這也是原本統計這數據的作者不得不痛苦承認的事實 (
你知道的,這是當人們發現不帶偏見的數據違反自己的意見的時候常有的反應)。不過
Abbott卻把這個連結拿來當作支持他的證據。
(連結: http://tinyurl.com/4svmsla)
接著是一個關於這個檢視關鍵時刻的方法是否給了控衛一些不公平的優勢的小爭議。在這
份名單中的前30名有17個是控衛,甚至包含Jordan Farmar跟Ty Lawson?你至少會問這個
問題沒錯吧?控衛在關鍵時刻的時候每次持球的確都製造了大量的分數。控衛的共通點是
什麼?是助攻。當控衛傳給隊友而隊友卻失手時會怎麼樣?Bingo。控衛傳出助攻會得到
相應的報酬,但控衛的傳球沒有發生作用時卻沒有相應的扣分機制。然而像是Kobe這種得
分者無論做了什麼都會歸到他身上,這並不是說所有排在Kobe前面的球員在關鍵時刻的產
出都應該比Kobe低,也不是在說假如Kobe在關鍵時刻時多傳點助攻會比較好。這是在質問
這些數據做出的「替補控球後衛在關鍵時刻的表現甚至比一些球賽中的主要球員還要好」
的結論是否正確。如果你沒問這個問題的話,至少是不負責任的,而最壞的情況下是不誠
實的。
過去15 年不關鍵的湖人隊
是的,這是個關於球隊的論述。這裡我們再一次檢視Abbott鑽研Kobe 15年的職業生涯後
所得出的「Kobe不是關鍵時刻之王」的結論。不知道為什麼,我就是不覺得1998年時GM跟
其他球員會選擇Kobe作為執行最後一擊的人選。我們得到以下這個結論:
在Kobe的生涯裡,有11支球隊在關鍵時刻時有更好的表現,這份名單的榜首是黃蜂,
平均100次持球可以得到107分,這要大大地歸功於 Chirs Paul在關鍵時刻的表現。
今年是Kobe的第15個球季,Chris Paul在聯盟中的第六個球季。然而,Abbot卻將Kobe的
生涯中,黃蜂在關鍵時刻領先全聯盟的表現歸功給Chris Paul。這其中一定是有什麼誤會
。
除了這點之外,你猜怎麼著?他的論述還提到了湖人隊在關鍵時刻的表現不錯。我不知道
他指的是指哪段時間。不過這些連結都是非常早的。我可以接納這些數據,因為我正在盡
我所能做一個公正的論述。如果數字是公正的,而我沒有辦法證明他不是,那麼用這點來
說明Kobe不是關鍵時刻的最佳領袖便會使人非常信服。
不過光只有一點還不夠,Abbott還為這段下了個結論:
一個進攻火力兇猛的隊伍卻只繳出了平均水準的成績,隊中的球星還創下了出手數的
紀錄,隊友卻都是空檔(http://tinyurl.com/4j28lga)。顯然地,Kobe的打法將球隊
帶入一個不必要的緊張處境。
沒錯,朋友們,就是個獨王。
我發覺這個連結實在非常幽默。這個連結連到Artest在對太陽的比賽中所投進的致勝補籃
,原本有空檔的是Derek Fisher,原本守他的人試著去蓋Kobe火鍋。先不說時間只剩不到
3秒 (你看過幾次在剩下一點點時間的情況下,還做兩次以上的傳導?) 或是放Fisher空
檔的人一開始跟Fisher還有Kobe的距離根本一樣。的確,這球顯示了Kobe是個獨王,並支
持所有證據所提出的論述。
證據又一次的從Kobe的生涯中被挑出來,準備好面對另一個驚人的事實了嗎?在Kobe的生
涯中的確有段時間是個獨王。從他想要證明自己是個明星球員開始,到Shaq-Kobe連線的
最後一年,他想從Shaq手中搶走主控權結束。在後Shaq時代時,他別無選擇只能做個獨王
。即使是現在,仍然會有一些比賽Kobe沒讓隊友參與進攻。如果你只聚焦在這些比賽上,
你可以說Kobe仍然是個獨王。當然,在最近有些時候,Kobe參與了球隊的進攻,做他該做
的事,並試著分球給隊友。一個一個球季過去,這情況變得更加常見。要是Abbot知道聽
到Kobe這季繳出了自從2005年後最高的助攻比率,或是自從Gasol加入後最高的 PER,他
一定會非常驚訝。
人們只會看到他想看的
Abbott用了最後的兩段來試著解釋為什麼人們會高估了Kobe在關鍵時刻的價值。他的理論
立基於,透過大量的出手,Kobe在我們的印象中製造了許多神奇的時刻,以致於我們一提
到關鍵時刻時便自動想起Kobe。我們只記得他的進球,而忽略了他的失手,這就是為什麼
我們被愚弄的原因。不只是我們的球迷,這也是為什麼NBA的球員、GM、教練們也都認為
Kobe是執行關鍵一擊的最佳人選的原因。我們都被自己的大腦誤導了,因為我們只想看到
我們想看的。
誠實的說,他很有可能是對的。不過再次地,他的論據反對自己的成分反而比贊成的成分
還多。我們再次跟著Abbott檢視Kobe的生涯數據,然後他從Phil Jackson地書中找到了這
位湖人教練對Kobe的看法,發掘出了這些寶石:
然而,別被Kobe大量的持球以及Jackson對此的背書感到迷惑。 在同一本書中,
Jackson同時也透露出他對Kobe在關鍵時刻的黏球感到煩惱。舉個例子來說,在2004年
對火箭的季後賽中,Jackson制訂了一個有多重選擇的戰術,Kobe毀了這一切的選擇。
捨棄了O’neal在底線做的掩護,他直接上前持球。「當24秒時間到後」Jackson寫道
,「Kobe被迫做一個遠距離的跳投,一個發生在比賽最重要的一次進攻的糟糕投射,
結果是球連籃框都沒碰到…」
Jackson也談論到他的對抗,不只一次的,他走進Mitch Kupchak的辦公室要求湖人交
易Kobe Bryant。就像他寫的:
「Kobe傾向於持球超過所需的時間導致進攻停滯」
「他從不聽任何人的指揮。」「我已經受夠這個傢伙了。」
「一直以來,Kobe熱衷於一個人接管比賽。」
先不管在寫完書後,Jackson決定給Kobe另一次機會。也不管Jackson跟Kobe又再聯手贏下
兩座冠軍,以及很有機會再多一座。也不管Jackson在過去兩季已經瀕臨退休,而Kobe費
盡唇舌說服他再回來執教。沒錯,Kobe曾經是一個獨王,Phil Jackson這樣講過,而現在
它被記載在石碑上。
貫穿整篇文章的主題就是,Abbott從Kobe的生涯中挑選出符合他論述的數據,然後選擇忽
略,或是丟棄,那些違背他理論的數據。他指責球迷、球員、GM只記得Kobe的偉大,而混
淆了我們的判斷力。不過這跟他所做的有什麼不同呢?事實上,有個很大的不同。我們犯
錯是因為我們忘記了,但他是故意選擇犯錯。
朋友們,這是個偽善者。
真相
有關Kobe在關鍵時刻表現的真相就是沒有真相。Kobe並不完美,甚至離得很遠。即使我願
意讚揚他的偉大,但他曾經讓我對他感到沮喪,就跟那些Abbott拿來攻擊他的理由一樣。
他花了超過2500字試著說服你們Kobe是個大獨王,在關鍵時刻表現不佳。三年前,他可能
是對的。他用的數據看起來似乎十分有說服力,因為他選擇不採用那些違背他論述的那些
數字。然後他竟然還有膽量說任何願意心態開放的人看了他數據後都不得不承認他的論點
。最後,這篇文章似乎是更加反映了Abbott的為人而不是Kobe。
Kobe是最佳關鍵球員嗎?目前看來仍然有爭議。這爭議會持續演化。基於我提出的數據,
我認為我闡明了Kobe持續在進化。唯一沒進化的是Abbott對Kobe的看法。
只要你的心智對上面的事實保持開放,你也就對Abbott對Kobe能保持客觀性這件事情保持
封閉了。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.25.251.193
※ 編輯: gaga19900329 來自: 114.25.251.193 (01/30 00:27)
推
01/30 00:28, , 1F
01/30 00:28, 1F
推
01/30 00:29, , 2F
01/30 00:29, 2F
→
01/30 00:30, , 3F
01/30 00:30, 3F
推
01/30 00:33, , 4F
01/30 00:33, 4F
推
01/30 00:33, , 5F
01/30 00:33, 5F
推
01/30 00:34, , 6F
01/30 00:34, 6F
推
01/30 00:35, , 7F
01/30 00:35, 7F
推
01/30 00:36, , 8F
01/30 00:36, 8F
推
01/30 00:36, , 9F
01/30 00:36, 9F
→
01/30 00:39, , 10F
01/30 00:39, 10F
推
01/30 00:39, , 11F
01/30 00:39, 11F
※ MJKobeLBJ:轉錄至看板 Lakers 01/30 00:41
推
01/30 00:41, , 12F
01/30 00:41, 12F
推
01/30 00:41, , 13F
01/30 00:41, 13F
推
01/30 00:41, , 14F
01/30 00:41, 14F
推
01/30 00:41, , 15F
01/30 00:41, 15F
→
01/30 00:42, , 16F
01/30 00:42, 16F
→
01/30 00:42, , 17F
01/30 00:42, 17F
推
01/30 00:43, , 18F
01/30 00:43, 18F
推
01/30 00:43, , 19F
01/30 00:43, 19F
推
01/30 00:45, , 20F
01/30 00:45, 20F
推
01/30 00:49, , 21F
01/30 00:49, 21F
推
01/30 00:50, , 22F
01/30 00:50, 22F
推
01/30 00:50, , 23F
01/30 00:50, 23F
推
01/30 00:51, , 24F
01/30 00:51, 24F
推
01/30 00:52, , 25F
01/30 00:52, 25F
推
01/30 00:59, , 26F
01/30 00:59, 26F
推
01/30 00:59, , 27F
01/30 00:59, 27F
推
01/30 01:00, , 28F
01/30 01:00, 28F
推
01/30 01:03, , 29F
01/30 01:03, 29F
推
01/30 01:03, , 30F
01/30 01:03, 30F
推
01/30 01:03, , 31F
01/30 01:03, 31F
推
01/30 01:03, , 32F
01/30 01:03, 32F
推
01/30 01:06, , 33F
01/30 01:06, 33F
→
01/30 01:06, , 34F
01/30 01:06, 34F
推
01/30 01:10, , 35F
01/30 01:10, 35F
推
01/30 01:13, , 36F
01/30 01:13, 36F
推
01/30 01:14, , 37F
01/30 01:14, 37F
→
01/30 01:16, , 38F
01/30 01:16, 38F
推
01/30 01:19, , 39F
01/30 01:19, 39F
推
01/30 01:19, , 40F
01/30 01:19, 40F
推
01/30 01:23, , 41F
01/30 01:23, 41F
推
01/30 01:25, , 42F
01/30 01:25, 42F
推
01/30 01:28, , 43F
01/30 01:28, 43F
推
01/30 01:28, , 44F
01/30 01:28, 44F
→
01/30 01:30, , 45F
01/30 01:30, 45F
→
01/30 01:30, , 46F
01/30 01:30, 46F
推
01/30 01:30, , 47F
01/30 01:30, 47F
推
01/30 01:42, , 48F
01/30 01:42, 48F
推
01/30 01:46, , 49F
01/30 01:46, 49F
→
01/30 01:48, , 50F
01/30 01:48, 50F
→
01/30 01:50, , 51F
01/30 01:50, 51F
推
01/30 01:55, , 52F
01/30 01:55, 52F
→
01/30 01:56, , 53F
01/30 01:56, 53F
→
01/30 01:59, , 54F
01/30 01:59, 54F
推
01/30 02:02, , 55F
01/30 02:02, 55F
推
01/30 02:04, , 56F
01/30 02:04, 56F
→
01/30 02:05, , 57F
01/30 02:05, 57F
推
01/30 02:06, , 58F
01/30 02:06, 58F
推
01/30 02:07, , 59F
01/30 02:07, 59F
推
01/30 02:07, , 60F
01/30 02:07, 60F
→
01/30 02:08, , 61F
01/30 02:08, 61F
→
01/30 02:11, , 62F
01/30 02:11, 62F
→
01/30 02:12, , 63F
01/30 02:12, 63F
→
01/30 02:13, , 64F
01/30 02:13, 64F
→
01/30 02:14, , 65F
01/30 02:14, 65F
推
01/30 02:15, , 66F
01/30 02:15, 66F
推
01/30 02:16, , 67F
01/30 02:16, 67F
推
01/30 02:17, , 68F
01/30 02:17, 68F
→
01/30 02:23, , 69F
01/30 02:23, 69F
推
01/30 02:31, , 70F
01/30 02:31, 70F
推
01/30 02:43, , 71F
01/30 02:43, 71F
推
01/30 03:01, , 72F
01/30 03:01, 72F
推
01/30 03:06, , 73F
01/30 03:06, 73F
推
01/30 03:35, , 74F
01/30 03:35, 74F
→
01/30 03:35, , 75F
01/30 03:35, 75F
推
01/30 03:44, , 76F
01/30 03:44, 76F
推
01/30 03:52, , 77F
01/30 03:52, 77F
推
01/30 04:38, , 78F
01/30 04:38, 78F
→
01/30 04:39, , 79F
01/30 04:39, 79F
→
01/30 04:40, , 80F
01/30 04:40, 80F
推
01/30 07:55, , 81F
01/30 07:55, 81F
推
01/30 08:08, , 82F
01/30 08:08, 82F
→
01/30 08:09, , 83F
01/30 08:09, 83F
推
01/30 08:31, , 84F
01/30 08:31, 84F
→
01/30 08:32, , 85F
01/30 08:32, 85F
推
01/30 08:51, , 86F
01/30 08:51, 86F
推
01/30 10:54, , 87F
01/30 10:54, 87F
推
01/30 11:02, , 88F
01/30 11:02, 88F
推
01/30 11:04, , 89F
01/30 11:04, 89F
推
01/30 11:19, , 90F
01/30 11:19, 90F
→
01/30 11:21, , 91F
01/30 11:21, 91F
→
01/30 12:34, , 92F
01/30 12:34, 92F
→
01/30 12:35, , 93F
01/30 12:35, 93F
推
01/30 12:55, , 94F
01/30 12:55, 94F
→
01/30 12:55, , 95F
01/30 12:55, 95F
→
01/31 00:11, , 96F
01/31 00:11, 96F