Re: [問題] 有關Panel Data的疑惑?
※ 引述《iinnttww (必勝客)》之銘言:
: 本來我用Stata直接跑Panel Data
: time variable設year
: ID variable設code
: 但是時間才9年而code公司太多了(上千家)
: 聽說會犧牲很多自由度~
: 所以有人建議用產業虛擬變數~
: 直接加入時間虛擬變數和產業虛擬變數跑OLS就是在跑Panel Data(是不是固定效果?)
: 本來用Stata跑Panel Data
: xtreg y x1 x2
: 現在跑一般迴歸(期間94-97;產業1-4)
: y=x1+x2+D95+D96+D97+IND2+IND3+IND4
: ^^^^^^^^^^^^^^當固定效果
: 請問這樣跑真的可以處理縱橫資料特殊的資料特性?
: 還蠻懷疑它只是純在跑一般迴歸,而非固定效果模型?
: 不知是否有人這樣處理過Panel Data的?
: 這樣跑的話~可以Hausman Test嗎?
: 謝謝
就使用上 Panel data還是迴歸
只是說犧牲很多自由度這樣的說法
並不是那麼正確
以OLS來跑panel data
模型設定如下
y=x1+x2+time1+time2+...+timet+firm1+firm2+...+firm1000
這樣子跑出來的係數值是正確的
但是你的變項會很多
這在模型的簡約性原則 不是很好
而在balance panel data裡面
又必須限定 每家公司要在所有的樣本時間內都存在
光這一點 就讓我不想使用 (unbalance panel data 也就順便沒有研究了)
因為這有樣本選擇性問題
如果有一家公司在樣本期間的第三年上市 排除
有一家公司在樣本期間的第五年下市 排除
這不是很符合真實世界的情況
接下來
我們來談談設虛擬變數的意義
設虛擬變數最主要的意義
就在殘差項的處理
Greene (2002) 在其著作中提到下列這段話
[話說已經有第六版了,我還在用第五版的書]
在傳統的Panel data中,是處理短期間內大數目的橫斷面單位的資料,
其焦點放在處理橫斷面變異 (cross-sectional variation),或者異質
變異性,但是在時間序列上的控制則較弱。
所為異質變異性 就是殘差項非為常數
他跟著你的樣本公司而有所變動
如果你在使用產業 虛擬變數的跑法
發現所有的產業虛擬變數都不顯著
這代表放產業虛擬變數就沒有甚麼意義了
最後 不要因為你的資料是縱橫資料
就認為僅能適用於Panel data (我亦不否認 Panel 可能較佳)
回到研究的最起點
你該了解的是
你的資料的常態性、異質性、...等狀況
如果都OK
連虛擬變數都不設也可以
不為什麼
因為你的資料就是適合這樣的東西
如果有問題
才開始討論其他的東西
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.225.34.35
推
03/11 10:56, , 1F
03/11 10:56, 1F
推
03/11 10:58, , 2F
03/11 10:58, 2F
→
03/11 10:59, , 3F
03/11 10:59, 3F
推
03/11 12:00, , 4F
03/11 12:00, 4F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):