[問題] 年份資料跑迴歸時設變數的問題

看板Statistics作者 (再也不要心碎了。)時間14年前 (2011/11/05 18:12), 編輯推噓1(1018)
留言19則, 5人參與, 最新討論串1/1
寫作業時想到一個問題,為什麼年份資料在跑迴歸時,必須將年份設為t呢? 比如說我的原始資料如下: 年份 營收 1995 6144 1996 6230 1997 6432 假設年份做X,營收為Y 1998 6950 1999 7377 則跑出來的迴歸線為:Y = 568.86X-10^6 2000 8655 2001 9536 2002 9825 2003 10253 2004 10555 但課本解答的作法是先令第一年為t=1,第二年為t=2,其餘依此類推, 再以下面的資料跑迴歸: t 營收 1 6144 2 6230 跑出來的迴歸線為:Y = 568.86t+5067 3 6432 ..... 10 10555 我想問的是: 1. 為什麼這兩條線會不一樣? >"< (令X=t+1994 將X和t代換以後發現,兩條線斜率相同,但位置差很多。 可是明明橫軸每一筆資料間距都是差1呀,感覺上代換後應該是同一條線不是嗎? ) 2. 為什麼年份必須先設為t 才能跑迴歸呢? 感謝各位高手!!! >"< -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 211.74.88.148 ※ 編輯: bufala 來自: 211.74.88.148 (11/05 18:15)

11/05 18:33, , 1F
所以你覺得橫軸改成100001 100002..100010跑出來會一樣?
11/05 18:33, 1F

11/05 19:34, , 2F
你拿兩種點去畫散佈圖就知道了
11/05 19:34, 2F

11/05 20:16, , 3F
樓上,我有跑散佈圖耶,從1、11、101、1001之類的試了很多
11/05 20:16, 3F

11/05 20:17, , 4F
前面跑出來的回歸線差別不大,但在大約快2000那一帶,
11/05 20:17, 4F

11/05 20:18, , 5F
回歸線突然往上位移很多,可是我不曉得背後的原因是什麼...
11/05 20:18, 5F

11/05 20:18, , 6F
ˊˋ
11/05 20:18, 6F

11/05 20:20, , 7F
1.你的解釋變數設的不同, intercept當然會不同.
11/05 20:20, 7F

11/05 20:21, , 8F
2.嚴格講,這是一個time series,不能用一般的regression分析
11/05 20:21, 8F

11/05 20:23, , 9F
3.X=t+b,僅intercept會不同,若X=at+b,則連slope也會不同喔
11/05 20:23, 9F

11/05 20:39, , 10F
樓上,我知道解釋變數不同,截距也會不同,但是如果我把
11/05 20:39, 10F

11/05 20:40, , 11F
X=t+1994帶回 X的回歸線,整理得到的t回歸線,是否會和
11/05 20:40, 11F

11/05 20:41, , 12F
直接用t跑出來的迴歸線相同呢? @@
11/05 20:41, 12F

11/05 20:42, , 13F
QQ 感覺我這樣敘述好亂...
11/05 20:42, 13F

11/05 21:29, , 14F
沒有人規定一定要用 t 代表年份, 也沒有規定說時間起點怎麼
11/05 21:29, 14F

11/05 21:30, , 15F
定. 但時間數列上的自相關, 或稱序列相關, 是需要注意的.
11/05 21:30, 15F

11/05 21:31, , 16F
更一般來說, 普通迴歸所需要的條件, 這樣的資料是否滿足, 這
11/05 21:31, 16F

11/05 21:31, , 17F
才是重點.
11/05 21:31, 17F

11/05 21:56, , 18F
嗯嗯~所以主要是因為時間序列的自身相關所造成的囉?
11/05 21:56, 18F

11/05 21:57, , 19F
感謝樓上所有回答的大家~~ T^T 謝謝~~
11/05 21:57, 19F
文章代碼(AID): #1EjGmLvy (Statistics)