Re: [問題] heckman model 主要變數被drop掉

看板Statistics作者 (應天風)時間16年前 (2010/03/17 15:44), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/3 (看更多)
※ 引述《ahomai (ahomai)》之銘言: : 想要請問一下一個搞了很久一直搞不定的問題: : 在下論文的主題與自選擇(self selection)有關 : 所以選用heckman two stage model : 並以stata的heckprob指令來跑....跑出結果 : 主要研究x1對於y的影響 : 第一階段是選擇模型 為probit model : x1是dummy variable 且因涉及到個人的選擇 : 所以以x1為因變數 其他x2 x3 x4 x5 x6為自變數 : 估計出一個lambda 來修正自選擇問題 : 第二階段是主要模型 用MLE : y為因變數 其他x1 x2 x3 x4 x5 lambda : (很多書都強調至少要有一個變數和第一階段不同,所以既然x6對y不顯著 就不放) : ==================================== : 問題是: : 用SAS也好 STATA也好 x1在第二階段都會被drop掉 : stata 是說 because of collinearity : sas 是說 x1 = intercept : 那麼我不就沒有辦法研究x1對y的影響了嗎? : (我看皮耳森相關係數 x1 與 x2 x3 x4的p值都是0.000 是否是這個緣故呢??) 不是沒辦法研究 可能需要換一個方法 在 heckman selection model 中 x1(DV=0,1) 不該納入 第二階段的估計 以消費者對有機農產品的願付價格為例 1st stage 願不願意多付錢購買有機農產品 (0,1) 樣本數為n1 2nd stage 願意多付錢的人 再問願付價格 樣本數為n2 從以上例子我們可以發現 在第二階段中 僅剩下願意付的人 (所以 n1 > n2) 因此 願不願意付這個問題(x1變數) 在第二階段中 都只剩 "1" 的值 所以不能納入模型中估計 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.86.205
文章代碼(AID): #1Be8XiCB (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1Be8XiCB (Statistics)