[問題] dummy variable檢定
第一次處理categorical的資料~對dummy variable還不是很熟
如果預測模型裡有一個nominal predictor 我要將他轉成dummy variables
但這predictor有上百個群(值), Y = b0 + b1X + b2D1 + b3D2 +...+ b(i+1)Di
例如 D這組dummy variables 是代表使用者名稱 且有兩百位使用者
Di in {'user1','user2',...,'user200'}
如果是跑回歸 會有每個 Di的p-value,但我的模型並沒有要拿掉任何Di
無論使用者有沒有影響 Y 我都得列入predictor,
所以回歸的p-value對我就比較沒參考意義, 有沒有哪種檢定方法是針對D整組
直接看這組D變數對Y的影響, 或是有啥公式可計算這組D跟Y的相關性
而不是D1,D2,...D200 分別對Y的相關係數
感恩~~~~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 161.130.178.168
→
01/06 20:07, , 1F
01/06 20:07, 1F
→
01/06 20:08, , 2F
01/06 20:08, 2F
→
01/06 21:35, , 3F
01/06 21:35, 3F