作者查詢 / anovachen
作者 anovachen 在 PTT [ Statistics ] 看板的留言(推文), 共443則
限定看板:Statistics
看板排序:
2F推:http://en.wikipedia.org/wiki/Cantelli's_inequality03/18 08:01
1F推:mu已知還是未知???03/13 14:38
1F推:模型去掉其中一個解釋變數就可能造成其他迴歸係數出問題03/12 23:54
2F→:而且小樣本+迴歸係數母數很小的時候更容易發生這問題03/12 23:58
3F→:所以才要看VIF03/12 23:59
4F→:另外,ridge regression是偏誤估計量...03/12 23:59
5F推:純粹從實務經驗來講,迴歸係數可以反應效果大小,03/13 00:08
6F→:共線性會讓去掉某個解釋變數後,另外某個變數迴歸係數03/13 00:09
7F→:由顯著變不顯著(或反之),由正變負(或反之)...03/13 00:09
8F→:這樣研究人員根本不曉得要怎麼解釋研究結果。03/13 00:09
9F→:英文維基百科Consequences of multicollinearity上寫的03/13 00:20
10F→:大致上是我懂的,某些情況甚至也是經歷過的03/13 00:20
11F→:您可以評論維基百科的那個段落...03/13 00:21
12F→:如果要把全部的解釋變數都放進模型,之前我試過主成分03/13 00:25
13F→:迴歸03/13 00:25
14F→:在當時的情況,我不會去解釋迴歸係數,因為我是做03/13 00:27
15F→:資料探勘,要做預測模型03/13 00:27
16F→:如果是流行病學研究遇到這問題,就要考慮干擾因子03/13 00:28
17F→:通常我會把干擾因子配對後作conditional logistic迴歸03/13 00:30
18F→:但那是因為資料屬性的關係((都是二分類型的反應變項03/13 00:31
19F→:而不會把干擾因子也丟進模型裡03/13 00:31
20F→:同意你的說法...但有些學生是一股腦的把資料庫的變數03/13 00:42
21F→:丟進去模型裡....03/13 00:42
22F→:然後上台報告時就開始不曉得怎麼解釋了= =03/13 00:42
23F→:不過作預測模型時,共線性的影響都是參考別人的經驗,03/13 00:42
24F→:我不確定有共線性時,模型是否會因此不穩定(如何證明?03/13 00:43
25F→:維基講共線性那邊提到的statistically robust03/13 00:44
26F→:可能換了某組sample就預測不準這樣...03/13 00:46
2F推:如果你是念Kutner的書,那應該是誤解文意...03/12 23:38
12F推:s是σ的漸近不偏估計量02/24 10:30
13F→:↑常態母體有此特性02/25 11:02
21F推:好像要用到卡方分配去證明E(S)=c(n)σ, c(n)是n的函數02/27 14:56
22F→:http://imgur.com/a/6uhwV02/27 15:12
2F推:在同一間超商內兩種品牌的銷售量有一定的相關性02/17 23:34
1F推:先抽一小部分(約1000筆資料)跑一次,如果跑得出結果01/21 10:42
2F→:那就是電腦運算速度的問題...01/21 10:42
3F→:可是65萬資料取殘差值也太勉強了。記憶體塞得下嗎?01/21 10:42
1F推:感謝分享!! 這是比較有效率的寫法。12/29 16:02
6F推:從你的圖我看不到p=0.014的資訊。12/29 16:07
7F→:另外,你有做中心化嗎?(mean centering)12/29 16:09
8F→:最好用標準化係數來畫交互作用圖會比較好...12/29 16:09
9F推:其實藍色線也是有可能迴歸係數不顯著,如果虛無假設12/29 16:17
10F→:b1=0為真,那麼這條線就變成水平線了,可是因為紅色線12/29 16:17
11F→:拒絕虛無假設,所以是斜線,兩者仍然會相交(有交互作用)12/29 16:17
1F推:如果標準差差異很大 也不能用ANOVA檢定...12/24 06:18
2F→:如果違反常態假設 用kruskal-wallis test會比較好12/24 06:22