[課業] 迴歸作業
作者 wearytolove (奪真書生A.W.) 站內 Baseball
標題 [分享] 本次冠軍戰前六戰的迴歸分析
時間 Sun Oct 25 18:18:30 2009
───────────────────────────────────────
因為這次比賽太有趣了,所以就來分析一下
獲勝code為win,有贏=1,沒贏=0
得分code為scores
安打code為hits
失誤code為error
對方的失誤code為erroroth
要跑迴歸,假設win為dependent variable,其他為independent
也就是以是否獲勝為應變數,其他數值為自變數
假設 獲勝=β0+β1得分+β2安打數+β3失誤+β4對方失誤+誤差項
要跑迴歸,所以先對自變數做兩兩相關性,避免correlation
此時就發現一些很有趣的事.........
corr scores hit(obs=12)
| scores hit
-------------+------------------
scores | 1.0000
hit | 0.1118 1.0000
對兩隊來說,得分跟安打是低度相關..........XDDDDDDDDDDDDDDDDDDDDDDD
. corr hit error(obs=12)
| hit error
-------------+------------------
hit | 1.0000
error | 0.2612 1.0000
相對得分來說,自己隊上失誤越多,安打似忽也越多,這是將功贖罪
. corr scores erroroth(obs=12)
| scores erroroth
-------------+------------------
scores | 1.0000
erroroth | -0.2592 1.0000
更白癡的東西出現了....自己隊的得分跟對方的失誤是負相關,
對方失誤越多我們得分越少
其它項都是低度相關的,包括我們與對方的失誤之間不會傳染
我方安打與對方失誤之間也是沒關的
總之,看起來是沒有高度相關,是可以跑個迴歸分析了
因為win這個變數是二元變數,應該要用二元勝算對數模型
可是因為這次比賽有太多5分,所以自由度太低,因此只好將就用迴歸來跑
. reg win scores hit error erroroth, level(90)
Source | SS df MS Number of obs = 12
-------------+------------------------------ F( 4, 7) = 2.95
Model | 1.8823801 4 .470595025 Prob > F = 0.1009
Residual | 1.1176199 7 .159659985 R-squared = 0.6275
-------------+------------------------------ Adj R-squared = 0.4146
Total | 3 11 .272727273 Root MSE = .39957
------------------------------------------------------------------------------
win | Coef. Std. Err. t P>|t| [90% Conf. Interval]
-------------+----------------------------------------------------------------
scores | .1484783 .0635332 2.34 0.052 .0281096 .2688469
hit | -.0084895 .0414875 -0.20 0.844 -.0870909 .0701119
error | .1206245 .0564339 2.14 0.070 .0137061 .2275428
erroroth | -.0662256 .0560804 -1.18 0.276 -.1724743 .040023
_cons | -.2758375 .513328 -0.54 0.608 -1.248378 .6967028
------------------------------------------------------------------------------
跑完迴歸後,對係數不拒絕等於0的跑F-test,不拒絕,hit跟erroroth可以同時等於零
也就是......發生了很好笑的事了..................
幾個結論(假設90%信心水準)
1.每多得1分,勝率約增加15%
2.我方安打數量與我方是否會獲勝是獨立的,完全沒影響
3.我方每多失誤一次,勝率約增加12%,跟我方安打效果一樣
4.對方失誤數量與我方是否會獲勝是獨立的,完全沒影響
------------
對於樣本抽樣來說,總冠軍賽有其特殊性,
考量到兩隊都會認真打的情況下,其資料理應更接近棒球比賽實際情況
而跑完迴歸分析後,發現這樣的值顛覆了一般人對棒球的常識
對於兩隊總教練來說,....
隊員是否打安打不重要
是否要詛咒對方失誤不重要
重要的是,要我方求員盡量失誤!!!!!!!!!!
XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.5.19
推
10/25 18:18,
10/25 18:18
推
10/25 18:18,
10/25 18:18
→
10/25 18:19,
10/25 18:19
→
10/25 18:19,
10/25 18:19
推
10/25 18:19,
10/25 18:19
推
10/25 18:19,
10/25 18:19
→
10/25 18:19,
10/25 18:19
噓
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
→
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
→
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
→
10/25 18:20,
10/25 18:20
→
10/25 18:20,
10/25 18:20
推
10/25 18:20,
10/25 18:20
→
10/25 18:20,
10/25 18:20
→
10/25 18:21,
10/25 18:21
推
10/25 18:21,
10/25 18:21
推
10/25 18:21,
10/25 18:21
→
10/25 18:21,
10/25 18:21
推
10/25 18:23,
10/25 18:23
→
10/25 18:24,
10/25 18:24
推
10/25 18:24,
10/25 18:24
推
10/25 18:24,
10/25 18:24
→
10/25 18:24,
10/25 18:24
→
10/25 18:24,
10/25 18:24
→
10/25 18:25,
10/25 18:25
推
10/25 18:25,
10/25 18:25
→
10/25 18:25,
10/25 18:25
推
10/25 18:25,
10/25 18:25
→
10/25 18:25,
10/25 18:25
補上當時後續推文
噓
10/25 18:30,
10/25 18:30
推
10/25 18:32,
10/25 18:32
噓
10/25 18:33,
10/25 18:33
推
10/25 18:39,
10/25 18:39
推
10/25 18:59,
10/25 18:59
--
[Both at top speed on the New Goblin's glider]
Spider-Man: This thing got any more?
New Goblin: Hang on!
Spider-Man: To what?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.36.74
→
10/25 18:35, , 1F
10/25 18:35, 1F
推
10/27 00:36, , 2F
10/27 00:36, 2F
→
10/27 00:53, , 3F
10/27 00:53, 3F
※ 編輯: jasonkeen 來自: 140.114.36.74 (10/27 00:53)