[問題] LASSO Regression的另類用法
有個LASSO的問題想請教各位。
我的模型基本上是SEM架構,有5個大類別分別為X1, X2, X3, X4, X5,全部用來解釋Y,
也就是說,
Y = a0 + a1* X1 + a2*X2 + a3*X3 + a4*X4 + a5*X5 + error
資料上面來說,X1一共有10個變數,X2有15個變數,X3有8個變數,X4有6個變數,X5有12
個變數。目前做法是用Principle Component Analysis (PCA)把每個類別全部縮減成一個
變數,也就是X1到X5。
我的問題是:
1) 有沒有可能在每個類別先做LASSO,然後再做PCA。以X1來說,以Y為dep. Var,先
做LASSO縮減到5個變數,接著再利用這5個變數做PCA來得到X1。
2) 直接取X1的10個變數,利用LASSO來計算latent variable,這樣同樣可以達到變數
縮減的目的。
希望我有把問題描述清楚,歡迎各位的意見,或是有推薦的paper也歡迎分享。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 98.235.233.212 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1644340680.A.CC0.html
→
02/09 10:30,
2年前
, 1F
02/09 10:30, 1F
→
02/09 10:35,
2年前
, 2F
02/09 10:35, 2F
→
02/09 10:38,
2年前
, 3F
02/09 10:38, 3F
→
02/09 12:37,
2年前
, 4F
02/09 12:37, 4F
→
02/09 12:39,
2年前
, 5F
02/09 12:39, 5F