[問題] 類別變項跑迴歸
我要跑迴歸的時問其中有幾個變項是類別,一些是連續。
類別變項超過三類,我知道要設dummy variable
但是有個問題:
A變項(類別)有三類,但我如果只想知道A變項是不是會對Y照成影響
那要怎麼辦呢?單獨跑ANOVA嗎?
如果全部的資料要跑迴歸,超過三類的類別變項是不是一定要用dummy variable跑?
另外,我設的dummy variable是以第一類為00,第二類為10,第三類為01,這樣沒錯吧?
而連續變項,因為有些range很大,所以想分組。
請問分組的依據有什麼規定嗎?目前是使用樣本數分組…盡量把每組控制人數差不多。
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.125.68
→
11/29 17:59, , 1F
11/29 17:59, 1F
→
11/29 18:00, , 2F
11/29 18:00, 2F
→
11/29 18:00, , 3F
11/29 18:00, 3F
→
11/29 18:01, , 4F
11/29 18:01, 4F
→
11/29 18:03, , 5F
11/29 18:03, 5F
→
11/29 18:04, , 6F
11/29 18:04, 6F
→
11/29 18:04, , 7F
11/29 18:04, 7F
→
11/29 18:05, , 8F
11/29 18:05, 8F
→
11/29 18:06, , 9F
11/29 18:06, 9F
→
11/29 18:07, , 10F
11/29 18:07, 10F
謝謝回答
關於分組,因為這個變項有大約有四分之三的人都是0
其餘的四分之一的人數是從個位數到千、萬都有
因此才想把他們分組,目前是以0為一組,其他的數值在一人數分為兩組…
因為不知道這個變項的數據可以從那個點分組,所以依人數來分
這樣可以嗎?
還是有什麼方法可以看出從那個點分組可以讓資料更好呢?
謝謝
※ 編輯: HermioneTYY 來自: 114.36.250.92 (11/29 19:20)
→
11/30 09:03, , 11F
11/30 09:03, 11F
→
11/30 09:04, , 12F
11/30 09:04, 12F
→
11/30 09:05, , 13F
11/30 09:05, 13F
呃
我是很認真的…
數據的單位是平方公分。
100以下的也只有16個,300~4000的有16個,一萬的有1…
※ 編輯: HermioneTYY 來自: 140.112.125.68 (11/30 12:18)