[問題] 多元迴歸轉換虛擬變項
各位統計前輩好:
小弟目前正在跑多元迴歸,但現在有幾個問題想請前輩們解惑:
一、間斷(名義)變項轉換為虛擬變項:
以年齡為例:30歲以下,31-40歲,41-50歲,51歲以上
目前看到的轉法有兩種:
(1)在Dummy variables,將水準數減一,也就是4個轉成3個
預設參照組為51歲以上,30歲以下在dummy成不同變數過程是
1-->1 2-->0 3-->0 4-->0 ,輸出名稱是"年齡1"
第41-50歲那組就是
1-->0 2-->0 3-->1 4-->0,輸出名稱是"年齡3"
出來的資料名稱也會只有三組(因為全部都0的那組就是51歲這組)
(2)將四組各自分別dummy,水準數就是原本的四組
也就是30歲以下在dummy成不同變數過程是
1-->1 2-->0 3-->0 4-->0 ,輸出名稱是"年齡1"
依此類推,51歲以上那組就是
1-->0 2-->0 3-->0 4-->1 ,輸出名稱是"年齡4"
我看吳明隆和陳正昌的書都是用(1),但我不知道我這樣解讀是對還錯?
所以想請大家解惑,到底哪一種才是對的?
二、如果跑迴歸,是要將所有被背景變項都丟進去嗎?小弟的背景變項有8個,
每一項再各自轉成虛擬變項,也有20個以上
不是不能跑,只是小弟在想有什麼可以事先篩選的方式
以小弟研究為例,所有背景變項中,什麼性別、學歷、年資
在F檢定時都沒有顯著,
就只有年齡一項有達顯著,
這樣可以再丟回歸的變項時,可以假設性別、學歷、年資
這些沒有預測力而先剔除丟入嗎?
(意即我只要丟入年齡的虛擬變項就好)
小弟這樣的推論正確嗎? (當然我知道大絕招是全部丟進去,
我只是想知道一些可能篩選的依準)
另外,還有一個更窘的情況,假設真的某些虛擬變項有預測效力,
如年資的其中一個虛擬變項好了,可是解釋力實在很低,
大約只有1%-3%,其他設定的自變項解釋力遠高於年資,
假設是領導魅力的其中一項(關懷領導),佔了15%,
那這樣,年資的解釋還有存在的意義嗎?
以上是小弟目前深切的疑惑,望請各位先進指導~~謝謝大家 ^^~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 112.105.89.196
→
01/11 05:39, , 1F
01/11 05:39, 1F
→
01/11 05:41, , 2F
01/11 05:41, 2F
→
01/11 05:42, , 3F
01/11 05:42, 3F
→
01/11 05:42, , 4F
01/11 05:42, 4F
→
01/11 05:43, , 5F
01/11 05:43, 5F
→
01/11 05:44, , 6F
01/11 05:44, 6F
→
01/11 05:45, , 7F
01/11 05:45, 7F
→
01/11 05:46, , 8F
01/11 05:46, 8F
→
01/11 05:50, , 9F
01/11 05:50, 9F
→
01/11 06:23, , 10F
01/11 06:23, 10F
→
01/11 06:23, , 11F
01/11 06:23, 11F
→
01/11 06:25, , 12F
01/11 06:25, 12F
→
01/11 06:25, , 13F
01/11 06:25, 13F
→
01/11 06:27, , 14F
01/11 06:27, 14F
→
01/11 06:29, , 15F
01/11 06:29, 15F
→
01/11 06:31, , 16F
01/11 06:31, 16F
推
01/11 07:18, , 17F
01/11 07:18, 17F
→
01/11 07:24, , 18F
01/11 07:24, 18F
→
01/11 07:26, , 19F
01/11 07:26, 19F
推
01/11 08:06, , 20F
01/11 08:06, 20F
→
01/11 14:51, , 21F
01/11 14:51, 21F
→
01/11 14:52, , 22F
01/11 14:52, 22F
→
01/11 21:00, , 23F
01/11 21:00, 23F
→
01/11 21:01, , 24F
01/11 21:01, 24F
→
01/11 21:02, , 25F
01/11 21:02, 25F
→
01/11 21:02, , 26F
01/11 21:02, 26F
→
01/11 21:03, , 27F
01/11 21:03, 27F
→
01/11 21:04, , 28F
01/11 21:04, 28F
→
01/11 21:05, , 29F
01/11 21:05, 29F
→
01/11 21:06, , 30F
01/11 21:06, 30F