[討論]進攻選擇跟罰球數的相關性

看板NBA作者 (科大港仔)時間1年前 (2023/05/05 01:45), 1年前編輯推噓64(71794)
留言172則, 70人參與, 1年前最新討論串1/1
→ ratzeial: 那你要不要順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒 有match? 問得好! 最喜歡這種想要進行學(筆)術(戰)交流的朋友了! 我們先不要把範圍限縮在場均高罰球次數的球員上,我首先比較好奇的是這個「出手距離跟 獲得罰球」的相關性,如果再細分到一個一個球員上,會不會也成立呢? 首先,如果是用所有球員(我們算有出賽超過20場的)例行賽的數據去比較,那會長這樣: https://i.imgur.com/21BoZjf.png
欸怎麼變正相關?因為會有一堆低出手數低罰球數的球員堆在左下角那邊,整個分析就沒意 義了。 所以找出「場均出手多少次以上的球員才是有參考價值的樣本」就很重要了。 這邊歡迎各位版友提出更好的方法,我自己是用了帕雷托法則(就是鼎鼎大名的80/20法則 )去做假設。 為了讓文理組都不得罪,這邊解釋一下80/20法則。大致上的意思是說80%的結果,都是源自 20% 的成因。 換句話說,小比例的原因就能帶來結果帶來巨大的影響。比如公司80%的營收大多來自前20% 的客戶、國家80%的GDP來自前20%的企業等等。 上NBA版還能學統計學,想不到吧。 回到主題,NBA的出手次數雖然沒有集中到80/20,但70/30卻是有的。 本季例行賽,NBA官網登錄539名球員,全聯盟出手了217220次。 而出手次數前30%的球員(前162名)的加總出手數是142926次,佔了全NBA的出手數的66%。 所以拿出手次數前30%的球員作為樣本,來比較「球員出手距離跟獲得罰球數量」的相關性 ,應該很有代表意義了吧: https://i.imgur.com/HeDrGir.png
嗯…還是正相關,我想了一下,發現我忽略了一個簡單的事實: 「越常出手的球員,本來就越容易有罰球啊。」 所以我再用這前30%的球員資料比較了場均出手數跟罰球數的關係: https://i.imgur.com/peXXGwp.png
果然有夠相關。 但仔細觀察圖表之後,發現隨著出手次數的增加,資料點開始逐漸發散,尤其以出手數15次 附近為分水嶺。 場均出手15次以上的「罰球數跟出手次數」相關性減弱了。代表有其他的變數在影響這個相 關性。 那我們把場均出手15次以上的數據(其實是14.7次以上因為我想把Poole也擺進來XD)拿來 比較,於是就得到了這張圖: https://i.imgur.com/NiJvay2.png
能場均出手14.7次以上,應該可以說是各隊主力球員(共58位),大家應該都認得就加了名 字上去。 順手標了幾個大家會感興趣的球員給大家當吵架素材,請珍惜帳號。 所以分析完數據之後下個結論: 1. 出手次數越多,就越有拿到罰球的機會(廢話 2. 球隊「主力球員」的攻擊選擇,則會受到出手距離的影響。出手距離越遠,得到的罰球 數越少。 有不少推文有提到相關係數太低的問題,的確這篇拿來當論文應該會被教授洗臉洗到翻過去 。 與罰球多寡有相關性的變數應該非常多,之後有空的話打算再抓多點數據做多變量分析。 這篇就當拋一個想法給大家討論,研究方式不嚴謹請見諒。 也附上這篇跟上一篇回歸線公式的比較: 上一篇回歸線: https://i.imgur.com/IjizhdM.png
這一篇回歸線: https://i.imgur.com/TIc7CZx.png
上一篇推文有人說要附上P value證明顯著性,好啦都來啦: https://i.imgur.com/XD5l4jZ.png
最後應你要求,「順便看一下場均罰球高的球員出手距離跟罰球,跟你的公式有沒有match? 」 我就抓場均最高的10位球員,自己看: https://i.imgur.com/kLnrWhu.png
商科算文組的話我文理組都待過啦。大家聊球就好。不要亂開戰場:) 以上一點小分享,感謝大家。有看到推文說想看太陽46罰的分析,要是最後西決湖人打太陽 我就做XD 數據都這裡抓的,有興趣歡迎各位多多利用[Teams Traditional | Stats | NBA.com](http s://www.nba.com/stats/teams/traditional?SeasonType=Regular+Season) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.239.48.62 (香港) ※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1683222309.A.199.html

05/05 01:51, 1年前 , 1F
太神啦...
05/05 01:51, 1F

05/05 01:52, 1年前 , 2F
有些球員是投很多中距離,有些是切入+外線
05/05 01:52, 2F

05/05 01:53, 1年前 , 3F
單純用出手距離來看,似乎不太精確?
05/05 01:53, 3F

05/05 01:57, 1年前 , 4F
其實有太多因素影響罰球
05/05 01:57, 4F

05/05 01:58, 1年前 , 5F
球員會不會惡意萊犯規 和團隊是否為加分狀態
05/05 01:58, 5F

05/05 02:01, 1年前 , 6F
或許該用三種出手距離各自取得的罰球數來判斷球商
05/05 02:01, 6F

05/05 02:03, 1年前 , 7F
怎麼不把罰球數/出手數
05/05 02:03, 7F

05/05 02:06, 1年前 , 8F
不用理那個人浪費自己時間其實
05/05 02:06, 8F

05/05 02:06, 1年前 , 9F
他還能回你嗎 沒被水桶也太瞎
05/05 02:06, 9F

05/05 02:12, 1年前 , 10F
我大半夜看版不是為了看到統計課本的QAQ
05/05 02:12, 10F

05/05 02:15, 1年前 , 11F
弱弱問,戰場是哪篇阿
05/05 02:15, 11F

05/05 02:18, 1年前 , 12F
未看先推 戰起來戰起來
05/05 02:18, 12F

05/05 02:18, 1年前 , 13F
太神啦看NBA版學統計
05/05 02:18, 13F

05/05 02:21, 1年前 , 14F
勇湖G2快開打了 這裡還在打G1 OT5 777777
05/05 02:21, 14F

05/05 02:26, 1年前 , 15F
以後一定要讓孩子好好讀書再去網路筆戰
05/05 02:26, 15F

05/05 02:29, 1年前 , 16F
推統計學
05/05 02:29, 16F

05/05 02:32, 1年前 , 17F
推統計
05/05 02:32, 17F

05/05 02:33, 1年前 , 18F
Y軸放罰球數/出手數 X軸放出手距離加權
05/05 02:33, 18F

05/05 02:33, 1年前 , 19F
推 戰場在前面同一個作者 跳投大隊vs切入大隊那篇
05/05 02:33, 19F

05/05 02:33, 1年前 , 20F
05/05 02:33, 20F

05/05 02:33, 1年前 , 21F
推統計,比起只會留言跳針球商罰球好多了=_=
05/05 02:33, 21F

05/05 02:45, 1年前 , 22F
超屌欸 課文應該寫這個有趣多了
05/05 02:45, 22F

05/05 02:51, 1年前 , 23F
他的前提是"場均罰球高的球員"
05/05 02:51, 23F

05/05 02:51, 1年前 , 24F
MVP的球商好高
05/05 02:51, 24F

05/05 02:51, 1年前 , 25F
所以圖表裡不能列入場均低於大約3~4次的
05/05 02:51, 25F

05/05 02:54, 1年前 , 26F
你做的應該叫"出手數高的球員 出手距離跟罰球關係"
05/05 02:54, 26F

05/05 02:55, 1年前 , 27F
而不是"場均罰球高的球員 出手距離跟罰球關係"
05/05 02:55, 27F

05/05 02:57, 1年前 , 28F
G1 OT打不完呀
05/05 02:57, 28F

05/05 02:57, 1年前 , 29F
你好像有點刻意繞一圈用出手數高 罰球數高的"相關"
05/05 02:57, 29F

05/05 02:57, 1年前 , 30F
去把這兩個前提直接替代掉
05/05 02:57, 30F

05/05 02:59, 1年前 , 31F
你要有你自己的篩選標準可以 不過跟別人問的就有差
05/05 02:59, 31F

05/05 02:59, 1年前 , 32F
用腳想也知道有相關 重點是有沒有合理 公平吹判每個
05/05 02:59, 32F

05/05 02:59, 1年前 , 33F
play
05/05 02:59, 33F

05/05 02:59, 1年前 , 34F
05/05 02:59, 34F

05/05 03:01, 1年前 , 35F
05/05 03:01, 35F

05/05 03:02, 1年前 , 36F
場均罰球數低於3.5/4/4.5的拿掉 看看趨勢線如何
05/05 03:02, 36F

05/05 03:14, 1年前 , 37F
後來看到你在結論完以後補充地方才做 後面那圖可以
05/05 03:14, 37F

05/05 03:17, 1年前 , 38F
不過抓到TOP10 7.9罰 有點標準太高 多幾個篩選門檻
05/05 03:17, 38F

05/05 03:18, 1年前 , 39F
不如抓個5 剛好有Curry Poole 比較多人想看
05/05 03:18, 39F
還有 93 則推文
還有 4 段內文
05/05 09:35, 1年前 , 133F
必再爭論下去,原po 也已經知道自己的結論過於粗糙
05/05 09:35, 133F

05/05 09:35, 1年前 , 134F
,等看看他修正後的文再說吧
05/05 09:35, 134F

05/05 09:57, 1年前 , 135F
看完就覺得難怪我薪水漲很慢QQ
05/05 09:57, 135F

05/05 10:07, 1年前 , 136F
結果兩天過去了 也只有原po在分析
05/05 10:07, 136F

05/05 10:11, 1年前 , 137F
老哥辛苦了==
05/05 10:11, 137F

05/05 10:29, 1年前 , 138F
樣本數篩成這樣結果相關.1老實說啥都沒證明到……
05/05 10:29, 138F

05/05 11:51, 1年前 , 139F
因為認真的誤導沒什麼好推的 這麼愛看認真製圖
05/05 11:51, 139F

05/05 11:51, 1年前 , 140F
外面有很多地方都有在做這種製圖工程 專門把數據弄
05/05 11:51, 140F

05/05 11:52, 1年前 , 141F
好猛
05/05 11:52, 141F

05/05 11:52, 1年前 , 142F
得好像很顯著一樣 是哪些我就不說了
05/05 11:52, 142F

05/05 11:53, 1年前 , 143F
座標軸比例就一個最基本的玩法
05/05 11:53, 143F

05/05 11:54, 1年前 , 144F
或是改變座標軸起點 讓只差平移的看起來像倍數差的
05/05 11:54, 144F

05/05 11:55, 1年前 , 145F
如果是在這種地方認真 不值得給予掌聲吧(非指本文)
05/05 11:55, 145F

05/05 12:31, 1年前 , 146F
嗯,看不懂。有沒有大神認真解釋一下這篇的名詞跟
05/05 12:31, 146F

05/05 12:31, 1年前 , 147F
重點QQ
05/05 12:31, 147F

05/05 12:47, 1年前 , 148F
反駁的要不要把你想要的條件直接用數據算出來
05/05 12:47, 148F

05/05 12:47, 1年前 , 149F
起碼人家有算出東西給你看,別又在那憑感覺在討論
05/05 12:47, 149F

05/05 13:12, 1年前 , 150F
統計數據圖表不是已經說明原po 解釋的問題點了,哪
05/05 13:12, 150F

05/05 13:12, 1年前 , 151F
裡看不懂?
05/05 13:12, 151F

05/05 13:29, 1年前 , 152F
上面講的製圖工程哈哈哈
05/05 13:29, 152F

05/05 19:18, 1年前 , 153F
上面提scale的論述,我認為也是錯誤的,因為XY軸的
05/05 19:18, 153F

05/05 19:19, 1年前 , 154F
單位根本不一樣,就沒有所謂哪一種scale才是正確的
05/05 19:19, 154F

05/05 19:19, 1年前 , 155F
畫法,還是要回到回歸分析本身來評判解釋力夠不夠、
05/05 19:19, 155F

05/05 19:19, 1年前 , 156F
相關性高不高
05/05 19:19, 156F

05/05 21:48, 1年前 , 157F
上面講的應該是同樣的數據 分不同的球員群體(CFG)
05/05 21:48, 157F

05/05 21:49, 1年前 , 158F
圖的長寬就不一樣 顯得好像某球員特別離群
05/05 21:49, 158F

05/05 21:49, 1年前 , 159F
不是單純的xy長度比
05/05 21:49, 159F

05/06 09:24, 1年前 , 160F
你都知道scale 單位不一樣,不就是我說的不能直接
05/06 09:24, 160F

05/06 09:25, 1年前 , 161F
畫出來看起來是正的斜率就說正相關嗎?哪裡論述有
05/06 09:25, 161F

05/06 09:25, 1年前 , 162F
問題
05/06 09:25, 162F

05/06 10:56, 1年前 , 163F
你用錯誤的論述去批評另一個錯誤的論述,就會變成一
05/06 10:56, 163F

05/06 10:56, 1年前 , 164F
個無毫意義的討論
05/06 10:56, 164F

05/06 13:05, 1年前 , 165F
笑了,我說原po沒考慮到兩軸的scale不一樣,所以畫
05/06 13:05, 165F

05/06 13:05, 1年前 , 166F
出來的圖才會像是很有正相關的回歸線,如果兩軸調
05/06 13:05, 166F

05/06 13:05, 1年前 , 167F
整,可能就不會覺得很有正相關,這句話根本跟你說
05/06 13:05, 167F

05/06 13:05, 1年前 , 168F
的單位毫無關係
05/06 13:05, 168F

05/06 13:17, 1年前 , 169F
btw,通常這種scale 差異過大的狀況,會透過標準化
05/06 13:17, 169F

05/06 13:17, 1年前 , 170F
等方式來讓不同單位的資料可以盡量的比較,所以也
05/06 13:17, 170F

05/06 13:17, 1年前 , 171F
不是沒有方法可以來觀察
05/06 13:17, 171F

05/06 20:39, 1年前 , 172F
邏輯、條件都合理~給推
05/06 20:39, 172F
文章代碼(AID): #1aK-yb6P (NBA)