昨天晚上ptt的斷線與我白痴的pcman設定讓我損失了完成一半的文章...
不過這或許好事,畢竟多了一個晚上的時間整理想法。
但我得老實說,我有點...遺憾。
一個模型可不可信?拿來預測未來有多可信?
這都是可以試圖量化的東西。
用籃球統計數據來處理問題的可信度有多高我們可以討論,當然也可以懷疑,
只是讓我遺憾的是...不是用這樣方法。
一、關於真理
物理大師費曼這樣說,
「今天我們稱之為科學知識的東西是一堆我們不能確定的敘述,
只不過不確定的程度不一。其中有些我們很沒有把握,有些則幾乎敢肯定是對的,
但是沒有任何一項是可以絕對確定的。」
是的,能量守恆、動量守恆都可能會錯,這些理論上面都有一把劍
隨時在新現象發現時落下,修正舊的理論,產生新的。
只是...能量或動量守恆錯誤的機率,在今天來看很小很小,趨近於0。
我也讀物理,很認同費曼大師的價值觀,因此我很難相信所謂「真理」。
因為連能量守恆都不是「真理」,又有什麼理論可以誇言真理?
只是在我看來,你似乎沒搞懂不確定的程度不一的含意。
如果不是真理就不能用,那科學早垮了
「 籃球統計學還有許多發展空間,也還不夠成熟,
它還不能夠讓你來完美的詮釋球場上發生的事件,
所以千萬不要以為拿出籃球統計學就是真理。」
在現在還沒「死掉」的學問可多了
任何一套我都可以用類似的句型描述,那請問我們是否不作研究了?
當然不是!!!
這要看我們有多「確定」理論的正確性。
你知我知連獨眼龍都知道籃球的統計數據可信度比不上棒球
so what?所以我們就不用數據分析了嗎?
為什麼籃球不能「只」用數據分析?因為可信度不夠高?
那是多不高呢?
到底要到怎樣的標準才能「只」用數據分析?
願不願意給我一個操作型定義,我願意盡力去算出來給大家看確切的「數字」。
譬如說,過去三年進攻防守效益與勝率的相關係數或RMSE?
附帶一提,那棒球就可以嗎?
在你給的「操作型定義」中,棒球的數字又是多少呢?
(譬如ops與得分的相關係數:0.739,RSME:0.268)
而這有超過「可以只用數據分析」的下限嗎?
萬一有新的籃球數據超過下限是不是就「可以只用數據分析」呢?
我可以拿出經過30場之後Celtics三巨頭的與之前的數據變化
02-03以後的藉由82games甚至可以查到出手區域、時間、受助攻率等等
不過我得先提醒,
第一,由於籃球團隊運動的特性,
個人數據的準確度比團隊數據低。
第二,這個問題跟Celtics是否有數據顯示的這麼強
或者是Celtics能不能維持現在的def eff到季末,是不同難度的問題
在我看來,我辛苦算出來之後會對這個討論應該不會有幫助。
畢竟這個問題的答案,如果想要有我能接受的可信度,那勢必得加上一些戰術分析。
二、戰術眼光?
「如果你是提出看Celtics 比賽時的防守站位與戰術...」
「 一個球隊上有至少三位具有良好防守觀念的球員,這對形成一支
球隊的團體防守是幫助很大的。Celtics 在對上 Magic 時, 甚
至敢用 Perkins 與 Rondo 把 Howard 包夾在另一邊,而 KG、
Pierce、Ray Allen 負責 cover 另外四人的防守工作, 在這種
情況下 Howard 連把球傳出去都很困難。」
這...
如果這就叫用戰術分析的眼光觀察比賽,就當我一個字都沒回應過。
我想稍微涉獵防守戰術的人都知道,在多數的情況下,其實包夾不是讓人開心的選項。
為甚麼會需要包夾?多半是因為一對一守不住了
譬如說你舉的例子...
姑且不論那個play中到底發生了哪些事導致Howard連把球傳出去都很困難
不斷強調「站位」,不過看完了之後我連Howard是在哪裡被包夾的都不知道...
這叫那門子的戰術分析?
還有,包夾跟掩護很像,都很講究時機與角度
在nba等級的比賽中,想要達到「完全擋住」跟「把球傳出去都很困難」的效果
九成就是犯規了。
真的懂防守戰術,我想會明白需要演練的不是讓人把球傳出去都很困難
而是讓他傳的時機角度不好,在外加迅速的守住其他人
為甚麼?
這可以回到前面的問題,為甚麼多半包夾不是好事?
因為防守方在局部多打少也意味著,在其他地方進攻方同樣是多打少
如果包夾是否能壓迫被包夾者的攻擊與傳球,與傳球後是否有效輪轉才會是防守的關鍵。
「如果你昨天有看Celtics 對上湖人的比賽,
相信你也可以感覺到何謂防守觀念。
Celtics 本季可是一支大溶爐的球隊喔,這樣的情況下,
你更可以知道有一群良好防守觀念的球員對於團隊防守的幫助有多大。
Celtics在面對這些隊伍時的防守陣形又是怎麼擺呢?
這其實很值得去分析,就像是兩次對上湖人時,
Celtics 是如何去防守 Kobe 的呢?
這在國外的一些論壇或是 blogger 都已經引起熱烈的討論,
國內的球迷反而比較少注意防守這方面 Celtics 下的功夫。
相信我,多觀察 Celtics 的防守會得到更多東西。 」
要談防守佔位與戰術觀察比賽,我很不客氣的說,
只用「防守觀念」四個字而不舉出實際的例子,又有什麼本錢可以嘲諷糗爺呢?
我不用看比賽都可以用類似句型寫個一百篇文章。
在我看來,「值得分析」+「防守觀念」並外加一些問號的可信度實在相當相當低。
當然我不否認,這樣的描述跟勝率的相關係數可以高到籃球數據一萬年也達不到高度。
三、質疑的點在?
我提出了兩步論述,你提了一大推問題。
我盡量的解答,可是我還是搞不懂問題在那裡。
1.從數據來看,本季到目前為止Celtics的防守有多好?
相同規則下的史上最佳,而且超過過去三年的極限很多
(如果和聯盟平均相減的話,比過去三年的極限好上70%以上)
2.Celtics的防守有數據顯示的這麼好嗎?又為什麼?
我「推測」沒有,可能Celtics的防守相當好,
不過今天數據顯示的程度是比「史無前例」還要更好。
這樣的描述,到底是那個環節出問題?
我搞不清楚你的主要質疑,
整篇文章「只」秀出籃球統計學的資料時,說服力不夠,不能這樣用
你是想說這個嗎?
可是偏偏我的論述,第一句就是「從數據來看」
這不是很讓人...
老實說,在我明白這一點之後,我有浪費兩整晚時間的感覺。
如果打定主意整篇文章「只」有籃球數據就「莫再提」
那也麻煩「莫再提」樣本大小、已賽賽程、東西區的強弱、
練習防守與攻擊所需的時間心力、標準差、變異數等東西
因為你可能只是隨口提一下,我卻得查資料算個1小時...
回到最一開始,不確定的程度不一的論述上。
我的看法是沒有什麼能不能,只有確不確定的問題
籃球數據本來就是一個「不確定」的東西,
有不同看法也很正常。對個人來說說服力夠不夠我不關心
我的文章一開頭就擺明從數據來看
如果你認為前提就錯了,那是你的自由
不過就麻煩不要繼續下去...
統計學是拿以前的資料來做分析並建立模形,在解釋以前發生的事件時會有很不錯的效力,
但是拿來預測未來的事件會有相當大的誤差,
尤其是你拿來預測未來事件的離群值時會出現更大的偏差。
還是你想說的是這個?
首先,我用數據的眼光看Celtics到目前為止的防守強度有多高(這是解釋以往吧)
然後我說這可能不是常態,是短期現象,也就是說,以後很可能會調回去
(有預測未來了)
所以你質疑的其實是後面的推論?
那你同意我之前的推論嗎?
(從數據來看,Celtics到目前為止的防守強度)
我先假設你同意了。
「只要是統計學的 model,在預測離群值時,都會出現很大的落差與不準,
所以你認為籃球統計學可以拿來預測目前Celtics 失分這個離群值嗎?」
我是學科學的,所以我並不喜歡沒有數字的形容詞,
不過我自己也常常用,因為方便。
但既然我們都有誠意「認真」討論這些東西,那勢必得用到更精確的描述方式。
所謂的「預測未來」有更詳細的定義嗎?
我先介紹這四個字的能耐
就我所知的所有科學中,
只要能
1.完整的「解釋過去」
2.準確的「預測未來」
3.沒有邏輯矛盾
即便理論再怎麼弔詭,科學人都會接受
所以物體運動時質量比較大又或是觀察會影響實驗這種「荒謬」的理論
被現在科學人廣泛地相信。
現在回到
「統計學是拿以前的資料來做分析並建立模形,拿來預測未來的事件會有相當大的誤差」
我的統計老師沒教過這件事,你沒給我預測未來和相當大誤差的定義,
我也很難說我相不相信這句話,只是...
我退一步,假設這句話成立,那我們打算預測未來,有更好的工具嗎?
像我這樣的鄉民當然可以不在乎,預測不準大不了不預測就是了。
但是gm可以嗎?那要怎麼交易?怎麼選秀?擲茭杯嗎?
所以即使萬一真的不夠準,但是只要找不到更準的,他們也只好摸著鼻子用下去
今天我不用數據來分析(預測)Celtics的失分,又要用什麼呢?
我知道可能會有人馬上開始說「觀察比賽」、「戰術」云云
因為實際上gm也是用數據加上球探「觀察比賽」的結果來作決定
但是但是,這些東西難道不該由問題本身決定嗎?
不觀察比賽就不能用數據做出可信度高的判斷嗎?
沒可能!!!
我沒看過任何一場西甲足球,只是世界盃的一日球迷
不過我可以打包票,這個賽季西甲的一場的平均進球數小於7
我有99.9999%的把握這會對。
為甚麼gm會需要觀察比賽?為什麼會gm需要統計數據?
因為他們面臨的問題很困難,很難預測,價值很多美金。
所以他們當然要進一切可能「優化」他們的選擇。
但這不代表所有問題都需要這麼多的步驟才能得到可信度夠高的答案。
不用看比賽我也知道A-rod 99.9999%下一季打不出一百隻全壘打。
在搞不清楚問題是什麼的時候,
「統計學的 model,在預測離群值時,都會出現很大的落差與不準」
或許有一般性描述價值
但你今天真的知道我在討論什麼問題嗎?
如果用前三季其他球隊+本季Celtics的def eff當樣本
本季Celtics會落在多少標準差之外嗎?
我就是不看比賽也有百分之90的信心Celtics的Def eff最後會上調。
我說過,我信仰科學。
科學答案的判準在於實驗(或觀測)。
如果實驗結果與理論推測不符,理論就是錯的。
再等52場比賽,實驗結果就會出來了。
拭目以待。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.144.177
推
01/03 16:18, , 1F
01/03 16:18, 1F
→
01/03 16:20, , 2F
01/03 16:20, 2F
→
01/03 16:22, , 3F
01/03 16:22, 3F
推
01/03 16:23, , 4F
01/03 16:23, 4F
推
01/03 16:22, , 5F
01/03 16:22, 5F
推
01/03 16:25, , 6F
01/03 16:25, 6F
→
01/03 16:27, , 7F
01/03 16:27, 7F
→
01/03 16:26, , 8F
01/03 16:26, 8F
推
01/03 16:28, , 9F
01/03 16:28, 9F
推
01/03 16:29, , 10F
01/03 16:29, 10F
推
01/03 16:29, , 11F
01/03 16:29, 11F
推
01/03 16:30, , 12F
01/03 16:30, 12F
→
01/03 16:31, , 13F
01/03 16:31, 13F
推
01/03 16:32, , 14F
01/03 16:32, 14F
→
01/03 16:32, , 15F
01/03 16:32, 15F
推
01/03 16:33, , 16F
01/03 16:33, 16F
推
01/03 16:33, , 17F
01/03 16:33, 17F
→
01/03 16:34, , 18F
01/03 16:34, 18F
推
01/03 16:34, , 19F
01/03 16:34, 19F
推
01/03 16:34, , 20F
01/03 16:34, 20F
推
01/03 16:34, , 21F
01/03 16:34, 21F
→
01/03 16:35, , 22F
01/03 16:35, 22F
推
01/03 16:35, , 23F
01/03 16:35, 23F
→
01/03 16:36, , 24F
01/03 16:36, 24F
推
01/03 16:36, , 25F
01/03 16:36, 25F
→
01/03 16:37, , 26F
01/03 16:37, 26F
推
01/03 16:40, , 27F
01/03 16:40, 27F
推
01/03 16:42, , 28F
01/03 16:42, 28F
推
01/03 16:44, , 29F
01/03 16:44, 29F
→
01/03 16:44, , 30F
01/03 16:44, 30F
推
01/03 16:44, , 31F
01/03 16:44, 31F
推
01/03 16:46, , 32F
01/03 16:46, 32F
推
01/03 16:47, , 33F
01/03 16:47, 33F
推
01/03 16:46, , 34F
01/03 16:46, 34F
→
01/03 16:47, , 35F
01/03 16:47, 35F
→
01/03 16:48, , 36F
01/03 16:48, 36F
→
01/03 16:52, , 37F
01/03 16:52, 37F
推
01/03 16:53, , 38F
01/03 16:53, 38F
推
01/03 16:54, , 39F
01/03 16:54, 39F
還有 161 則推文
推
01/03 21:24, , 201F
01/03 21:24, 201F
推
01/03 21:31, , 202F
01/03 21:31, 202F
推
01/03 21:53, , 203F
01/03 21:53, 203F
推
01/03 21:57, , 204F
01/03 21:57, 204F
推
01/03 21:58, , 205F
01/03 21:58, 205F
推
01/03 22:13, , 206F
01/03 22:13, 206F
推
01/03 22:20, , 207F
01/03 22:20, 207F
推
01/03 22:27, , 208F
01/03 22:27, 208F
推
01/03 22:36, , 209F
01/03 22:36, 209F
噓
01/03 23:00, , 210F
01/03 23:00, 210F
推
01/03 23:07, , 211F
01/03 23:07, 211F
推
01/03 23:13, , 212F
01/03 23:13, 212F
→
01/03 23:15, , 213F
01/03 23:15, 213F
→
01/03 23:23, , 214F
01/03 23:23, 214F
噓
01/03 23:28, , 215F
01/03 23:28, 215F
推
01/03 23:42, , 216F
01/03 23:42, 216F
推
01/04 00:33, , 217F
01/04 00:33, 217F
推
01/04 01:11, , 218F
01/04 01:11, 218F
推
01/04 01:28, , 219F
01/04 01:28, 219F
推
01/04 01:48, , 220F
01/04 01:48, 220F
→
01/04 01:50, , 221F
01/04 01:50, 221F
→
01/04 01:51, , 222F
01/04 01:51, 222F
推
01/04 01:54, , 223F
01/04 01:54, 223F
推
01/04 03:57, , 224F
01/04 03:57, 224F
噓
01/04 06:02, , 225F
01/04 06:02, 225F
推
01/04 08:01, , 226F
01/04 08:01, 226F
推
01/04 09:10, , 227F
01/04 09:10, 227F
推
01/04 11:55, , 228F
01/04 11:55, 228F
→
01/04 11:56, , 229F
01/04 11:56, 229F
推
01/04 16:08, , 230F
01/04 16:08, 230F
噓
01/04 16:23, , 231F
01/04 16:23, 231F
→
01/04 16:25, , 232F
01/04 16:25, 232F
推
01/04 19:09, , 233F
01/04 19:09, 233F
推
01/04 22:00, , 234F
01/04 22:00, 234F
推
01/04 22:24, , 235F
01/04 22:24, 235F
噓
01/04 23:47, , 236F
01/04 23:47, 236F
噓
01/05 01:23, , 237F
01/05 01:23, 237F
推
01/05 02:14, , 238F
01/05 02:14, 238F
→
01/05 02:15, , 239F
01/05 02:15, 239F
推
01/05 07:40, , 240F
01/05 07:40, 240F
討論串 (同標題文章)