[轉錄][足球] 足球的數據革命
足球的數據革命
By Simon Kuper
Published: June 17 2011 17:01 | Last updated: June 17 2011 17:01
翻譯:http://bbs.goalhi.com/2472295.html
現在,足球比賽的每個微小細節都能被記錄下來供人查閱。《金融時報週末雜誌》委託藝
術家雷維爾(Giles Revell)運用數據分析公司Prozone採集到的獨家比賽數據,創作出
了一系列以近來巴賽隆納和曼聯的冠軍聯賽決賽為主題的圖畫 ( http://ppt.cc/z-6z )
筆者近來探訪了曼城位於卡林頓村安靜的訓練基地。那是一個陽光明媚的早晨,大門外的
雇員們正在清洗球員們的SUV和跑車。後衛科洛‧圖雷開著一輛電影《教父》裡那種引人
側目的黑色大轎車滑行而過。卡林頓對於那樣的車已經司空見慣——曼聯也在這個村子
訓練。
“歡迎到阿布達比旅遊”,曼城天藍色訓練中心的正面如是寫道。阿布達比王室是曼城的
所有者,他們買下俱樂部後所做的諸多事情之一就是雇用了一個龐大的資料分析團隊。筆
者在大樓裡找到了加文-弗雷格(Gavin Fleig),曼城的球員表現分析負責人:他穿著一
套整齊的曼城黑色運動服,棕色頭髮,是個有禮貌的人。雖然卡林頓以外很少有人聽說過
他,但弗雷格卻是英格蘭足球數據革命的一位主要推動者。儘管大多公眾和媒體未有察覺
,但球員資料已經開始驅動俱樂部的決策——尤其是在買賣球員的決策方面。許多俱樂部
裡,正是那些身居後臺不起眼的統計人員在繪製今夏轉會市場的藍圖。
弗雷格給筆者做了一些專業的展示,那些東西看上去就像是投行的某個“資料控”做出來
的。讓他興奮的是,曼城最近已經獲得了英超每一名球員的統計資料。試想——弗雷格說
道——你在考慮簽下一個攻擊型中場。你想要一個出勤率上乘、傳球成功率80%(以上)
的球員。弗雷格將這兩項要求輸入他的筆記型電腦,英超裡邊符合要求的幾個球員的肖像
立刻浮現在螢幕上。有兩人是顯而易見的:阿森納的法布雷加斯和利物浦的傑拉德。但除
了他們以外還有一張讓人驚訝的面孔:紐卡斯爾的諾蘭。這些數字還不足以促使你立刻簽
下他,但可能會讓你做更仔細的觀察。
近些年來,在多次嘗試未果後,英格蘭大球會的資料分析人員終於提煉出了那些真正重要
的球員統計資料。例如,弗雷格說道,“排名前四的球隊在前場都穩定保持著更高的傳球
成功率。自我們球隊買入特維斯、席爾瓦、亞當‧強森和亞亞‧圖雷之後,單是在過去六
個月裡,我們在前場的持球能力就上升了7.7個百分點。”
溫格早在上世紀80年代末期就在摩納哥使用了名為Top Score的電腦軟體但他們擴充陣容
的計畫與這個統計資料並沒有必然的聯繫,弗雷格提醒道。實際上,有些俱樂部對統計資
料可能比曼城還要重視得多。筆者近來訪問了幾位足球數據革命的參與者,並為這場革命
的進展之迅猛而感到震撼。二月份的一個早晨,在斯坦福橋一個空無一人的看臺上,切爾
西的球員表現分析總監福德(Mike Forde)告訴筆者:“我們現在大概有超過12000到
13000場比賽的3200萬項資料點”。足球正在變成一項越來越需要智慧的運動。
或許自第一台個人電腦(PC)誕生以來,幾位足球領域的先鋒人物就已經嘗試用資料來判
斷球員的表現了。第一批人物裡邊就包括未來的阿森納主帥,溫格,一個經濟學專業的畢
業生,也是一個執著的數學人。溫格上世紀80年代末擔任摩納哥隊主帥的時候,就採用了
一套朋友開發的名為Top Score的電腦程式。另一位不太顯眼的先鋒人物是嗜飲伏特加的
已故烏克蘭偉大主帥洛巴諾夫斯基(Valeri Lobanovski)。筆者1992年到基輔時,洛巴
諾夫斯基的御用科學家,澤倫特索夫(Anatoly Zelentsov)教授讓筆者玩了一些基輔迪
納摩隊開發的用來測試球員的電腦遊戲。
“一支犯錯率不高於15到18個百分點的球隊是不可戰勝的”,當洛巴諾夫斯基說出這樣的
話的時候,他不是靠猜的。這些資料已經得到了澤倫特索夫團隊的驗證。
但更大的突破發生在1996年,OPTA指數公司開始搜集英超聯賽的“比賽數據”之後——德
國人比爾曼(Christoph Biermann)在他所著的足球與數據的先鋒性著作,
《足球矩陣(DieFussball-Matrix)》一書中闡述道。俱樂部第一次瞭解到每個球員場均
跑了多少公里,場均有多少次搶斷和傳球。其他資料公司也隨之進入到市場中。而統計資
料則開始被一些足球主教練所關注。2001年8月曼聯經理弗格森突然將後衛斯塔姆賣給了
拉齊奧隊。這一轉會震驚了所有人。有人認為荷蘭人是因為在他剛出版的自傳中愚蠢爆料
而受到了弗格森的懲罰。
而事實上,儘管弗格森沒有公開表示,但這單買賣部分原因正是出於比賽數據分析。弗格
森研究資料後發現,斯塔姆的攔截不如以前頻繁。他認定這位當時29歲的後衛在走下坡路
,並因此賣掉了他。
弗格森後來承認,這是一個錯誤。正如許多早期涉足比賽資料的足球人一樣,這位(足球
)名帥參考了錯誤的資料。斯塔姆完全沒有走下坡路——之後幾年他在義大利的狀態出色
依舊。不過,這個事件在足球史上仍然具有里程碑式的意義:這是很大程度上受到統計數
字驅使的一次轉會。
而在阿森納,溫格欣然接受了新的比賽資料。他曾說過,比賽過後隔天早上,他就像個癮
君子一樣需要“嗑藥”——閱讀資料表格。大概是2002年的時候,他開始在比賽後期將前
鋒柏格坎普換下。後者免不了向溫格抱怨。“然後他就會拿統計表格來說話,”柏格坎普
後來回憶道,“‘鄧尼斯你看,70分鐘過後你的跑動就開始減少了,還有你的速度也下降
了。’溫格就是足球領域的教授。”
很少人會把這和西漢姆聯隊的新任主帥“大山姆”阿勒代斯聯繫到一塊,然而,這位足球
教練實際上是被他略顯粗獷的外貌掩飾了其專業的理念。球員時代的阿勒代斯在佛羅里達
的坦帕灣呆過一年,在那他對美國體育界運用科學方法和資料分析的模式產生了濃厚興趣
。
1999年他成為了博爾頓主帥。這家小球會負擔不起最好的球員,於是阿勒代斯就轉而請了
幾位優秀的統計人員。他們挖掘出了一項讓阿勒代斯欣喜不已的統計數字。“平均每場比
賽中,皮球會在兩隊之間易手400次”,切爾西的福德複述道,當年他正是在阿勒代斯手
下開始了自己的足球事業。“大山姆”把這句話灌輸給了自己的球員。對他來說,這句話
直接體現了失去球權後迅速回防到位的重要性。
更具體地說,統計資料讓阿勒代斯找到了一個簡單易行的進球來源:角球、界外球和任意
球。弗雷格,阿勒代斯的另一位前同事回憶說,博爾頓有百分之45到50的進球是來自這樣
的定位球,相比之下聯賽裡的平均比率大約僅為三分之一。弗雷格說道,“我們會觀察,
‘如果後衛將界外球解圍,球會落到哪裡?哦,這裡就是球最經常落入的區域。沒錯,那
就是我們會安排自己球員站位的地方。’”
2003年,足球的資料革命從大西洋彼岸獲得了新的動力。邁克爾-路易斯(Michael Lewis
)發表了自己關於棒球的重要著作《魔球(Moneyball)》,英國足球圈的一些人讀後茅
塞頓開。《魔球》回顧了奧克蘭運動家隊總經理比恩(Billy Beane)如何運用新的統計
方法來評估棒球運動員的經歷。在數據的説明下,運動家這支小球隊的表現遠遠超乎想像
,直到大俱樂部也開始雇用統計人員為止。而波士頓紅襪隊的老闆亨利(也是現在的利物
浦老闆)本身就是個在商品交易中發家的“數字魔人”,他的球隊運用“魔球”方法也贏
得了兩次職棒大聯盟的冠軍。
今年二月,筆者在奧克蘭體育場拜訪了比恩。我們在奧克蘭球員那間淩亂程度堪比儲藏室
的更衣室裡展開了交談。比恩很樂於談論足球領域的數據革命,很快,在電影《魔球》中
我們就能看到由布萊德-彼特扮演的他了。正如過去十年的許多美國人一樣,比恩以一種
近乎于不正常的熱情轉身接受了這項盛行於歐洲的運動。人們經常能發現他平躺在更衣室
裡的破沙發上觀看歐洲的足球比賽。
比恩認為,正如棒球已變得“更為科學”,足球也會這樣。他說道,“假設率性而為可以
保證你在百分之30的時候是對的,而改用某種方法之後,你能獲得百分之35的正確率,那
麼你就創造了5個百分點的利益差額,而在體育界,這百分之5將足以影響到比賽勝負。
”如果運用資料能讓你佔有優勢的話,那麼所有人都不得不這麼做,比恩如是認為。
福德曾在比恩的家鄉聖地牙哥求學並追隨美式體育,當時他專程來到奧克蘭拜訪比恩,並
向其請教關於數據使用的問題。結果這次拜訪相當棘手——最初幾個小時裡都是比恩在問
福德足球的問題。“最後半個鐘頭我總算把話題轉移到他在棒球界的角色上了”,福德笑
道。他成了比恩的朋友,正如溫格的前任助手,法國人科莫利那樣。2005年科莫利成為托
特納姆隊的足球總監,並從那時開始使用數據。
科莫利在熱刺的三年是數據革命早期許多紛爭的一個縮影。英國足球對於受過(良好)教
育的人總抱有懷疑的態度。典型的足球教練應該是在16歲就輟學的前球員;應該像獨裁者
一樣管理自己的俱樂部。他依靠的應該是“血性”,而不是數字。他不會聽從一個從未踢
過職業足球,滿腦都是資料表格的法國人。科莫利總是不得不去打一場場“書呆子對運動
員”的戰役。憑藉敏銳的觀察,他給熱刺發掘了數位優秀的球員:莫得裡奇、貝爾巴托夫
、戈麥斯以及17歲的貝爾。但最終科莫利還是被迫離職。
有一個問題是書呆子不得不反覆回答的。沒錯,傳統主義者會說,統計資料對於像棒球這
樣起起停停的運動可能很有效。投手投球,打擊手擊球,這一過程給書呆子們提供了大量
可研究的清晰資料。但足球果真就是一項因為流暢度太高而難以測量的運動嗎?
福德回應道:“不錯,我覺得這是個確實存在的問題。這個問題我們時刻也在問自己。”
然而,書呆子們能回答這個問題。首先,好的數學家能夠應付複雜的系統。例如,在切爾
西,福德手下的統計人員之一過去就從事過保險建模的工作。足球——這項22人在一塊有
限的場地上,根據給定規則進行的運動——其複雜程度並不是高不可攀。
其次,近年來資料分析在籃球這項流暢的運動中得到了很好的應用。比恩說道:“如果數
據能用在這,它也就能被用在足球場上。”再者,足球場上三分之一的進球都不是發生在
運動戰情形中,而是來自角球、任意球、點球和界外球——你能像分析棒球裡的擊球那樣
來分析足球裡的定位球,它們都一樣有停有起。
新一代書呆子們能夠指出足球場上許多顯而易見的非理性行為,尤其是在轉會市場中,還
有許多地方是聰明的俱樂部可以改進的。例如:守門員的職業生涯比前鋒更長,但賺得更
少,轉會費也低得多。俱樂部經常簽下高大的球員,但後來意識到其身高的價值被高估後
,實際上又傾向於使用個頭較小的球員。而絕大多數俱樂部甚至從未問過自己像這樣的基
本問題:當一些特定球員在場上的時候,他們是否拿到了更多的分數?
考慮到即使雇上30個統計人員,每年可能也只需150萬英鎊——而這僅相當於英超球員的
平均年收入,你會覺得付錢給一群書呆子研究這些問題或許是物有所值的。但不管怎樣,
足球對於數字的懷疑在某種程度上總是存在的。“即使是一個頂級的統計學家,把他和一
個趨於保守的足球教練放一塊也不是什麼合適的組合”,福德曾這樣向筆者表示。他本人
看上去像個足球人:精瘦、頭髮有些灰白、操地方口音、穿漂亮的西裝。這會在他把數據
推銷給老式的足球人時有所幫助。但在許多俱樂部,書呆子們只是在緩慢地獲得權力。現
在,可能英超所有的俱樂部都雇用了分析人員,但這些人員裡的一部分只能呆在堆滿電腦
的後臺房間裡,而從未和主帥謀面。
因此,在那些走在數據革命前沿的俱樂部中,其主帥也必然是數字的信徒。阿森納和阿勒
代斯的博爾頓過去就已開始像金融投資者對待牛肉期貨一樣來對球員進行估值。以博爾頓
2004年收購34歲的中場球員斯比德為例。表面上看,斯比德似乎太老了。但博爾頓“可以
觀察他的體力資料,並和當時與其位置相同的頂級年輕球員,如傑拉德、蘭帕德等進行比
較。對於一個體力支出持續與頂級球員處於同一水準,而且之前兩個賽季沒有明顯下滑跡
象的34歲球員而言,你完全可以有底氣地說,‘知道麼,年齡並不是什麼大問題。’”
弗雷格說道。
斯比德一直為博爾頓效力到了38歲。
足球界最精明的資料分析人員一直明白這一點:資料只能作為輔助手段來支持關於某一名
球員的決策,而不能獨立作出決定。比爾曼講述了溫格在2004年是怎樣給體力充沛的中場
維埃拉尋找接班人的。溫格需要一個覆蓋面積大的球員。他通過搜索歐洲不同聯賽的資料
,注意到了馬賽隊一個名不見經傳的年輕人——場均奔跑14公里的弗拉米尼。單靠這項數
字是不夠的。弗拉米尼的風格是否合適?他的技術如何?溫格去現場觀摩,確定他沒有問
題,便廉價簽下了他。弗拉米尼在阿森納逐漸冒尖,後來為更高工資而去了米蘭。
反過來,那些靠“血性”而不是資料的俱樂部開始吃到了苦頭。2003年,皇家馬德里以
1700萬英鎊的價格把馬克萊萊賣給了切爾西。對於一名並不顯眼的30歲防守型中場來說,
這似乎是一筆大價錢。“我們不會想念馬克萊萊”,皇馬主席弗洛倫蒂諾說道。“他技術
一般,缺乏帶球過人的速度和技巧,他的傳球有90%都是回傳或橫傳。他頭球不好,而且
傳球的距離很少超過3米。年輕球員將會讓人忘記馬克萊萊。”
弗洛倫蒂諾的評價並不是完全沒有道理,然而皇馬犯下了一個巨大的錯誤。馬克萊萊將在
切爾西繼續奉獻五年出色的表現。現在的足球場上甚至還有個位置是以他來命名的——
“馬克萊萊角色”。 (Makelele Role 經典後腰的代名詞)
只要皇馬研究過資料,他們可能就會發現馬克萊萊的獨到之處。福德解釋道:
“從高強度運動的角度來說,多數球員都是在靠近對方球門的時候才顯得非常活躍。但反
過來卻很少球員在靠近本方球門的時候還能保持強勢。如果觀察馬克萊萊,你會發現他進
行高強度運動的時間裡有84%的部分都是在對方拿球的時候,這相當於隊裡其他球員的兩
倍之多。”
如果只是看比賽的場面,你可能會忽略馬克萊萊。而如果看過資料,你就會明白他的重要
。類似地,如果只看曼城隊亞亞‧圖雷略顯懶散的跑動方式,你可能會覺得他速度很慢。
而如果看到數字,你就知道他並不慢。比恩說道,“統計資料可以讓你不會單從表面來評
價事物。那種認為親眼所見比統計資料更可靠的想法我並不買帳,因為我看過魔術師從帽
子裡掏出兔子來,而我就知道兔子並不在那裡面。”
但到了本世紀頭10年的中期,足球界的資料分析人員開始不安地覺察到,許多自己信任了
多年的統計數字其實毫無用處。在任何一個行業裡,從業者所採用的都是他們已有的資料
。數據公司最初計算的是每個球員的傳球、搶斷和跑動公里數,因而俱樂部也就用這些數
字來對球員作出評判。然而,一個越發清晰的事實是:這些原始的統計資料——也就是現
在電視直播大型賽事時所顯示的那些數字——並沒有太大的意義。福德回憶起了早期對跑
動距離資料之意義的探求:“我們能否找出跑動總距離和勝利(場次)的相關性?答案始
終都是否定的。”
搶斷數看起來也是個差勁的指數。一個尷尬的問題體現在偉大的義大利後衛瑪爾蒂尼身上
。“他每兩場比賽才有一次搶斷”,福德恨恨地說道。瑪律蒂尼站位實在太好了,以至於
根本不需要作出搶斷。這對於用搶斷數判斷後衛的方式提出了有力質疑,而弗格森賣掉斯
塔姆正是出於類似的方式。福德說道,“我在博爾頓參加了許多會議,而現在我回顧過去
會想‘哎,我們打造球隊時所依據的都是我們現在覺得不相干的東西。’”回顧早年的數
據,弗雷格總結道:“我們本應該關注一些重要得多的東西。”
現在事情正朝著這樣的方向發展。足球場上的“數據魔人”們正在分離提煉出那些重要的
數字。“那些資料有很多都是私有的”,福德告訴筆者,“俱樂部對這一特定領域非常支
持,所以我們要有所保留。”但數據魔人們也會討論在足球界逐漸成為共識的一些發現。
比如,俱樂部現在更看重全速奔跑的距離而不是跑動的總公里數。“衝刺的次數和勝利之
間存在著某種相關性,”AC米蘭的首席體能教練托格那奇尼(Daniele Tognaccini)在
2008年向筆者表示。
這就是弗雷格之所以關注“球員高強度的輸出”的原因。不同數據公司對此項素質有著不
同的測算方式,他說道,“但它最終還是要取決於球員將速度提升到每秒7米這個臨界值的
能力。”
如果你重視這項素質,你或許就不會犯像尤文圖斯1999年把亨利賣給阿森納那樣的錯
誤。“對亨利來說,達到每秒7米只是小菜一碟”,弗雷格讚賞道。法國人幾乎每次啟動
都能達到那個速度。
另一項同等重要的素質是球員反復衝刺的能力。曼城的小個子前鋒特維斯有點像個上了發
條的人偶:他急衝了又急停,緊接著又再次開始衝刺。弗雷格說道,“如果我們想採用
前場壓迫打法,我們可以看看特維斯的體力支出,然後就會知道他有能力保持90分鐘以上
的連續衝擊。”
正如俱樂部已懂得將衝刺和其他跑動區分開來一樣,他們也懂得了將有效傳球與無意義的
導腳區別看待。在卡林頓,弗雷格在螢幕上調出一份曼城的球員名單,將他們按其所創造
的機會數進行排列。一個名字隨即凸顯出來:席爾瓦傳出的機會球比他的任一個隊友都要
多出至少三分之一。
數據領域的新一輪洗牌使得人們更容易進行球員之間以及俱樂部之間的比較。例如,維岡
因對手傳中而失球的比例比英超任何其他球隊都要高。如果你對陣維岡的話,瞭解這件事
情會對你有所幫助。俱樂部們越來越多地根據資料行事。一個數據控已經在阿森納坐鎮了
15年,而去年秋天,數據人員又接管了另一家英超豪門。曾在2002年試圖雇用比恩的波士
頓紅襪隊的老闆約翰‧亨利買下了利物浦隊,並立即雇用比恩的朋友科莫利,開始打造
“足球版的魔球”。
自君臨安菲爾德的那一刻起,科莫利就經常與相距5000英里之外的魔球之父談話。比恩說
道:“你什麼時候打電話給他都行。我在那邊還是淩晨兩點的時候發電子郵件給他,他就
會冒出來,回復我的電子郵件說,‘嗨,我正在看(奧克蘭)運動家隊的比賽’,因為他
是在電腦上看的。這傢伙從來不睡。”科莫利在利物浦擁有實實在在的權力。他曾表示在
購入卡羅爾和蘇亞雷斯,總值達到6000萬英鎊的交易中,資料也為俱樂部提供了參考。
而足球場上的數據革命才剛剛起飛。弗雷格提出了繪製場上球員交互關係圖的想法,而其
中則蘊藏著一個令人興奮的未來:誰把球傳給誰,誰將發動球隊的致命一擊?如果你的對
手是巴賽隆納,那這個人顯然會是哈維。但如果是其他隊,則資料告訴你的攻擊發起人可
能是某個出乎意料的球員。如果你知道他習慣傳出關鍵球的區域,你就可以嘗試去阻止他
。在足球統計資料的遠景應用問題上,有一個人比大多數人做出了更多的思考,這個人就
是奧克蘭運動家隊的棒球運營總監。紮伊迪(Farhan Zaidi)畢業于麻省理工學院的經濟
學專業,是個很有幽默感的人。你會覺得這種人應該出現在音樂會過後,深夜裡的大學城
酒吧,而不是某個職業體育俱樂部。紮伊迪的工作是研究棒球統計資料。但他和比恩把在
體育場裡的大部分時間都用在了爭論他們的其他愛好上:英國的綠洲樂隊,還有足球。
2006年,當棒球賽季還在進行中的時候,他們卻一同跑到德國看足球世界盃去了。紮伊迪
笑道:“我們在一起的時間太多了,如果我們談的還都是表格上那些資料的話,我們早就
把對方給殺了。”由於紮伊迪知道棒球數據革命的發展過程,因此,他也可以對足球數據
革命作出預測。他認為,體育的聖杯在於一項被他稱為“進球機率增加值”的統計資料。
這項資料會顯示每個球員在其職業生涯中的活動會使其球隊進球的機率增加或下降多少
(例如一個球員在中線處成功傳出一記距離五碼的球;或是他的傳球沒有成功)。
筆者向紮伊迪問道,是否有一天專家會說出這樣的話,“蘇亞雷斯的進球機率增加值是
0.60,而卡羅爾只有0.56。”紮伊迪回答:“我覺得那是會發生的,因為這在棒球界已
經發生了。我們現在談論球員的方式是我們在10或15年前做夢也不會想到的。”
在與運動員之間這場曠日持久的戰役中,書呆子們終於揚眉吐氣了。
先用word簡→繁,再掃過文章一次,把不順的地方對照英文原文略改了一點點。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.55.26
※ 編輯: Nodick 來自: 114.45.55.26 (07/12 02:54)
→
07/12 02:54, , 1F
07/12 02:54, 1F
推
07/12 03:01, , 2F
07/12 03:01, 2F
推
07/12 05:20, , 3F
07/12 05:20, 3F
推
07/12 10:08, , 4F
07/12 10:08, 4F
→
07/12 10:09, , 5F
07/12 10:09, 5F
推
07/12 11:32, , 6F
07/12 11:32, 6F
推
07/12 11:48, , 7F
07/12 11:48, 7F
推
07/12 18:58, , 8F
07/12 18:58, 8F
推
07/12 18:59, , 9F
07/12 18:59, 9F
推
07/14 18:49, , 10F
07/14 18:49, 10F
→
08/08 06:26, , 11F
08/08 06:26, 11F
→
09/10 21:11, , 12F
09/10 21:11, 12F
→
12/09 10:33,
7年前
, 13F
12/09 10:33, 13F
→
04/17 20:58,
6年前
, 14F
04/17 20:58, 14F