[問題] 回歸兩個不同的random walks

看板Statistics作者 (魁北克很美)時間16年前 (2009/09/26 16:04), 編輯推噓0(008)
留言8則, 3人參與, 最新討論串1/1
考慮兩個隨機產生的 100 步 random walk 如下: 在 R 裡面, 輸入 set.seed(5678) -----> 固定隨機產生的數據 x=cumsum(rnorm(100)) ----> 產生一百個隨機常態數據取累計量 (相當於random walk) y=cumsum(rnorm(100)) ----> 同上 summary(lm(y ~ x)) ----> 回歸 用一個回歸另一個得出結果 Residuals: Min 1Q Median 3Q Max -5.6096 -2.0235 -0.1894 1.5088 6.3555 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.0170 0.3277 6.155 1.65e-08 *** x -0.2820 0.0452 -6.240 1.12e-08 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 2.741 on 98 degrees of freedom Multiple R-squared: 0.2843, Adjusted R-squared: 0.277 F-statistic: 38.93 on 1 and 98 DF, p-value: 1.119e-08 請教一下, 這個要怎麼分析? 直觀來說兩個 uncorrelated random walks 回歸出來有意義嗎? 數據中 R^2 = 28.4% 表示 poor regression fit 沒錯吧 但是斜率參數的 p-value 很小 表示斜率不為零 這要怎麼解釋? 先謝了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 130.15.100.1

09/26 19:33, , 1F
你先思考一個基本問題:linear regression 的假設是什麼
09/26 19:33, 1F

09/26 19:34, , 2F
random walk滿足這些假設嗎?
09/26 19:34, 2F

09/30 02:08, , 3F
有趣的問題。
09/30 02:08, 3F

09/30 10:05, , 4F
謝謝一樓 討論p-value得先接受線性相關的假設 沒錯吧
09/30 10:05, 4F

09/30 10:55, , 5F
還有呢?
09/30 10:55, 5F
我的想法是, p-value 指出的 both intercept & slope are significant 這點 並不能表示他們就是線性相關 這個結論是在 "假設他們線性相關" 的前提下得出的結論 但另一方面 R^2 不夠大 顯出這個假設站不住腳 我後來又隨機產生其他組 發現 R^2 都不大 最大的才 65% 平均則是 20% 左右

09/30 19:47, , 6F
you are ahead of me... how about the homoscedasticity
09/30 19:47, 6F

09/30 19:48, , 7F
assumption for linear regression? Does it hold?
09/30 19:48, 7F
from the plot it doesn't look like the homoscedaticity holds 我還在想要怎麼用公式 show it rigorously ※ 編輯: limit 來自: 130.15.100.1 (10/01 07:23)

10/01 07:45, , 8F
這個從random walk生成的公式就可以看出來了
10/01 07:45, 8F
文章代碼(AID): #1AlSidXE (Statistics)