Re: [閒聊] 嘗試以機器學習排出P+前三隊

看板basketballTW作者tony790927 (Chiao)時間1年前 (2022/07/08 10:45)推噓13(13推 0噓 22→)

留言35則, 16人參與討論串2/2 (看更多)

感謝大大有趣的文～剛看了下UCLA論文後有幾個機器學習的問題想問，因文長用回文形式，若不適合本版我再刪文 1. 關於features數目，原論文似乎自己挑18個數據，把一些數據如總籃板數、失誤（他們? 得失誤比較無法顯示好壞表現）等拿掉而原po似乎是遠多於18再用2次降維方式後再K-Mean 不過論文看起來他們只是拿降維後的做2D visual而已（下圖） https://i.imgur.com/XbFWIRD.jpg

拿去K-Mean的是沒降維的，畢竟只有18維。這邊或許可以自己挑出類似features，才不會太雜亂數據影響。以下是他們選的 https://i.imgur.com/pYlMp8f.jpg

2. 論文最後是有說到其實「每個群是類似的」如下圖, 每個群跟隊伍排名的線性關係p-value都很大（p-value 越大信心程度很小） https://i.imgur.com/nx3TZqw.jpg

“This suggests that there is no relationship between how good a team is and mem bership in a particular cluster. “ 就是幾乎沒關係的意思文中提到重點是「離每個分群質心的距離」才能顯現好壞球員，例如在x群中的離x群的中心越遠，則球員越猛 https://i.imgur.com/FZ7CUxK.jpg

可看到p-value才0.02左右（0.98的信心）簡言之，如果直接拿每個群當成一二三隊似乎不適合，可能用與跟質心的距離排出各個球員才比較好。而原PO現在分群中的第一隊，可能有些人是比較靠近質心，有些人則是遠離質心，比較好的式可以多列出他們與質心的距離，越大則是越厲害不過上述都是建立在你是follow這論文的作法，如果你有修改的話可能就不是我上述所說的一樣了。話說我也可能有錯，只是小弟的一些看法，歡迎指正。發此文的用意只在推崇科學與運動的結合，很感動台籃版越來越活絡，也感謝原PO的effort ---- Sent from BePTT on my iPhone 7 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.99.29.154 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/basketballTW/M.1657248300.A.D9E.html

推

csro7788

07/08 10:48, 1年前 , 1^F

07/08 10:48, 1^F

→

Joshuaian

07/08 10:49, 1年前 , 2^F

07/08 10:49, 2^F

推

a21215540

07/08 10:50, 1年前 , 3^F

07/08 10:50, 3^F

推

YYYero

07/08 10:52, 1年前 , 4^F

07/08 10:52, 4^F

推

bobon0921

07/08 10:54, 1年前 , 5^F

07/08 10:54, 5^F

→

tony790927

07/08 10:57, 1年前 , 6^F

07/08 10:57, 6^F

→

tony790927

07/08 10:57, 1年前 , 7^F

07/08 10:57, 7^F

→

shifa

07/08 11:00, 1年前 , 8^F

07/08 11:00, 8^F

→

shifa

07/08 11:00, 1年前 , 9^F

07/08 11:00, 9^F

我的理解：這篇UCLA的論文是先找出”類似的球員”的分群，然後根據所有30隊nba隊伍算出每隊nba隊伍含有第一群、第二群的比例，（例如咖喱、k湯在第四群, 勇士隊含有第四群球員比例是2/n, 同樣地算出含有第一、二…群比例，以及其他隊如籃網隊的各群比例），? 現算出來含有各群比例跟不同nba 隊伍之間的排名沒有實質線性關係，進而間接發現其實每個分群其實都是均勻，沒有明顯哪個群比哪個群厲害。後來他們發現是群中的球員到群的質心距離才能代表球員好壞

推

a034506618

07/08 11:02, 1年前 , 10^F

07/08 11:02, 10^F

推

pupss93101

07/08 11:04, 1年前 , 11^F

07/08 11:04, 11^F

推

johnbill

07/08 11:11, 1年前 , 12^F

07/08 11:11, 12^F