Re: [問題] 有關Panel Data的疑惑?

看板Statistics作者 (咖啡王子)時間17年前 (2009/03/11 10:49), 編輯推噓3(301)
留言4則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《iinnttww (必勝客)》之銘言: : 本來我用Stata直接跑Panel Data : time variable設year : ID variable設code : 但是時間才9年而code公司太多了(上千家) : 聽說會犧牲很多自由度~ : 所以有人建議用產業虛擬變數~ : 直接加入時間虛擬變數和產業虛擬變數跑OLS就是在跑Panel Data(是不是固定效果?) : 本來用Stata跑Panel Data : xtreg y x1 x2 : 現在跑一般迴歸(期間94-97;產業1-4) : y=x1+x2+D95+D96+D97+IND2+IND3+IND4 : ^^^^^^^^^^^^^^當固定效果 : 請問這樣跑真的可以處理縱橫資料特殊的資料特性? : 還蠻懷疑它只是純在跑一般迴歸,而非固定效果模型? : 不知是否有人這樣處理過Panel Data的? : 這樣跑的話~可以Hausman Test嗎? : 謝謝 就使用上 Panel data還是迴歸 只是說犧牲很多自由度這樣的說法 並不是那麼正確 以OLS來跑panel data 模型設定如下 y=x1+x2+time1+time2+...+timet+firm1+firm2+...+firm1000 這樣子跑出來的係數值是正確的 但是你的變項會很多 這在模型的簡約性原則 不是很好 而在balance panel data裡面 又必須限定 每家公司要在所有的樣本時間內都存在 光這一點 就讓我不想使用 (unbalance panel data 也就順便沒有研究了) 因為這有樣本選擇性問題 如果有一家公司在樣本期間的第三年上市 排除 有一家公司在樣本期間的第五年下市 排除 這不是很符合真實世界的情況 接下來 我們來談談設虛擬變數的意義 設虛擬變數最主要的意義 就在殘差項的處理 Greene (2002) 在其著作中提到下列這段話 [話說已經有第六版了,我還在用第五版的書] 在傳統的Panel data中,是處理短期間內大數目的橫斷面單位的資料, 其焦點放在處理橫斷面變異 (cross-sectional variation),或者異質 變異性,但是在時間序列上的控制則較弱。 所為異質變異性 就是殘差項非為常數 他跟著你的樣本公司而有所變動 如果你在使用產業 虛擬變數的跑法 發現所有的產業虛擬變數都不顯著 這代表放產業虛擬變數就沒有甚麼意義了 最後 不要因為你的資料是縱橫資料 就認為僅能適用於Panel data (我亦不否認 Panel 可能較佳) 回到研究的最起點 你該了解的是 你的資料的常態性、異質性、...等狀況 如果都OK 連虛擬變數都不設也可以 不為什麼 因為你的資料就是適合這樣的東西 如果有問題 才開始討論其他的東西 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.225.34.35

03/11 10:56, , 1F
感謝您這麼精闢的分析,讓我對Panel Data又更進一步的了解
03/11 10:56, 1F

03/11 10:58, , 2F
犧牲自由度是就以上千家公司當固定效果還以20產業當固定
03/11 10:58, 2F

03/11 10:59, , 3F
若以公司當固定是否真得會犧牲?(公司有上千家)
03/11 10:59, 3F

03/11 12:00, , 4F
若以OLS可否跑RE?回歸是怎樣的表示法?=_=a
03/11 12:00, 4F
文章代碼(AID): #19joRLaI (Statistics)
文章代碼(AID): #19joRLaI (Statistics)