線性模型 作業二
注意事項:
1. 助教字很醜 , 請見諒!!!
2. 如果題目要 fit a model , 至少把係數給寫出來 ,
比較好的方式是把整個summary附在上面。
但是未來有在model selection , 會出現非常多個model 的時候 ,
放上係數跟重要的部份 t-test , F-test , R-square 就好了。
這次兩題都要 fit model , 如果連係數都沒附上的話 , 一個model會被扣一分。
3. 解釋的部份 , 老師通常會請學生解釋一些現象 , 因為有發生了有趣現象 ,
所以老師希望最好大家能夠解釋到這個部份。 所以會依照大家解釋上的程度給分!!
--------------
題目問題!!!
第一題:
(i) 至少 1/3 的人covarance都因為R內建而有所誤會。
summary( . )$cov ==== (X'X)^(-1)
他並非beta的covariance matrix , 少了sigma^2
正解: summary( . )$cov*(summary(.)$sigma^2)
知道大家被R耍了 , 所以扣一分。
(iii) & (iv)
這兩題解釋的部份依照程度的不同給分 , 大約有1/3班拿到滿分 ,
題目是要比較他們與原始model的差異 , 並且用數學的解釋方式。
(1)如果只有講什麼 t-test , R-square.....etc 哪些不同,
當然不會給錯!!! 但太簡短了 , 所以扣 1.5分。
(2)有些同學加入用文字和幾何的方式來解釋,這當然比(1)好許多 ,
但是像是 R-square = 1 , 係數完成一樣亦或全部等於零 ,
如此神奇的事情發生 , 文字和幾何解釋力沒有那麼強烈!!! 扣1分!!
(3) 大部分的人都有用數學式子來證明 beta=0 or beta_new=beta_old
這非常的夠力 , 如果一些小地方 , 比如 R-square = 1 , F-statistic=0
...etc 如此神奇的事情 , 沒有證明到 皆扣 0.5分
(4) 拿滿分的同學 文字和數學皆有不錯的解釋與證明 , 非常的厲害 ,
所以除了打勾之外 , 旁邊會多了 very good 以示讚賞!!
第二題:
(v) 這一題是說其他解釋變數固定情況下 , temp多了10單位 , Press多了多少!!
有幾個同學說 Press增加了!!! 這叫我如何是好!!!
(vi)
這一題的第一個model , R跑出來某個變數會有 NA 值。
解釋方面 , 問題還不少!!! 很抱歉 , 我比較龜毛一點 ,
沒寫到 key point 會扣 0.5分!!!
想法:
因為加入了一個由其他兩個解釋變數的column進入了X
根據理論 det(X'X) = 0 , so X'X is singlur
i.e. inverse is not existence
Beta變成無法估計 , 因此在這邊有3個 vector有線性組合 ,
R內建丟除了一個column vector使得 X'X is nonsinglur
在這邊R他只丟HCHO-catalyst , 所以那一列才出現NA值。
(1) 有些人寫"共線性" , 當然跟 "線性組合" 不大一樣!!!
x 與 x^2 這兩個變數是產生共線性 , 但並非線性組合 。
如果寫"完全共線性"較佳!!!
(2) 還不少人說跟原始model會長的一樣 , 這當然是美中不足 ,
學過實驗設計有個東西叫做 aliasing , 就是效應的 "混合" ,
HCHO-catalyst 的效應事實上 , 被混合在於
HCHO 和 catalyst之中了!!! 不是完全不見!!!
想要回分數的同學 , 可以找我討論!!!
映像當中 , 有一兩個我扣的好像過重了。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.36.81
推
10/22 12:54, , 1F
10/22 12:54, 1F
推
10/22 14:15, , 2F
10/22 14:15, 2F
推
10/22 14:33, , 3F
10/22 14:33, 3F
→
10/22 14:33, , 4F
10/22 14:33, 4F
→
10/22 19:56, , 5F
10/22 19:56, 5F
推
10/22 21:17, , 6F
10/22 21:17, 6F
推
10/22 21:52, , 7F
10/22 21:52, 7F
推
10/22 23:02, , 8F
10/22 23:02, 8F