[問題] 回歸兩個不同的random walks
考慮兩個隨機產生的 100 步 random walk 如下:
在 R 裡面, 輸入
set.seed(5678) -----> 固定隨機產生的數據
x=cumsum(rnorm(100)) ----> 產生一百個隨機常態數據取累計量 (相當於random walk)
y=cumsum(rnorm(100)) ----> 同上
summary(lm(y ~ x)) ----> 回歸
用一個回歸另一個得出結果
Residuals:
Min 1Q Median 3Q Max
-5.6096 -2.0235 -0.1894 1.5088 6.3555
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.0170 0.3277 6.155 1.65e-08 ***
x -0.2820 0.0452 -6.240 1.12e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.741 on 98 degrees of freedom
Multiple R-squared: 0.2843, Adjusted R-squared: 0.277
F-statistic: 38.93 on 1 and 98 DF, p-value: 1.119e-08
請教一下, 這個要怎麼分析?
直觀來說兩個 uncorrelated random walks 回歸出來有意義嗎?
數據中 R^2 = 28.4% 表示 poor regression fit 沒錯吧
但是斜率參數的 p-value 很小 表示斜率不為零 這要怎麼解釋?
先謝了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 130.15.100.1
→
09/26 19:33, , 1F
09/26 19:33, 1F
→
09/26 19:34, , 2F
09/26 19:34, 2F
→
09/30 02:08, , 3F
09/30 02:08, 3F
→
09/30 10:05, , 4F
09/30 10:05, 4F
→
09/30 10:55, , 5F
09/30 10:55, 5F
我的想法是, p-value 指出的 both intercept & slope are significant 這點
並不能表示他們就是線性相關
這個結論是在 "假設他們線性相關" 的前提下得出的結論
但另一方面 R^2 不夠大 顯出這個假設站不住腳
我後來又隨機產生其他組 發現 R^2 都不大 最大的才 65% 平均則是 20% 左右
→
09/30 19:47, , 6F
09/30 19:47, 6F
→
09/30 19:48, , 7F
09/30 19:48, 7F
from the plot it doesn't look like the homoscedaticity holds
我還在想要怎麼用公式 show it rigorously
※ 編輯: limit 來自: 130.15.100.1 (10/01 07:23)
→
10/01 07:45, , 8F
10/01 07:45, 8F