[問題] 類別變項跑迴歸

看板Statistics作者 (Hermione)時間13年前 (2012/11/29 14:57), 編輯推噓0(0013)
留言13則, 1人參與, 最新討論串1/1
我要跑迴歸的時問其中有幾個變項是類別,一些是連續。 類別變項超過三類,我知道要設dummy variable 但是有個問題: A變項(類別)有三類,但我如果只想知道A變項是不是會對Y照成影響 那要怎麼辦呢?單獨跑ANOVA嗎? 如果全部的資料要跑迴歸,超過三類的類別變項是不是一定要用dummy variable跑? 另外,我設的dummy variable是以第一類為00,第二類為10,第三類為01,這樣沒錯吧? 而連續變項,因為有些range很大,所以想分組。 請問分組的依據有什麼規定嗎?目前是使用樣本數分組…盡量把每組控制人數差不多。 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.125.68

11/29 17:59, , 1F
(1) 看整個類別變項是否加入模型產生什麼變化...用 F 檢定,
11/29 17:59, 1F

11/29 18:00, , 2F
如同迴歸分析教本所談的: 同時看模型中幾個解釋變數是否
11/29 18:00, 2F

11/29 18:00, , 3F
顯著的 F 檢定.
11/29 18:00, 3F

11/29 18:01, , 4F
(2) 兩個 dummy, Z2, Z3; 第一類均設為0, 第二類 Z2=1,Z3=0;
11/29 18:01, 4F

11/29 18:03, , 5F
第三類Z2=0,Z3=1. 這是以第一類為比較基礎, Z2 的係數顯
11/29 18:03, 5F

11/29 18:04, , 6F
示的是第二類與第一類的差, Z3係數顯示的是第三類與第一
11/29 18:04, 6F

11/29 18:04, , 7F
類的差.
11/29 18:04, 7F

11/29 18:05, , 8F
(3) 分組要 "有意義". 以人數為分組準則, 通常比以數值等間
11/29 18:05, 8F

11/29 18:06, , 9F
距分組更不具實務意義. 例如年齡分組, 可以考慮不同 "世
11/29 18:06, 9F

11/29 18:07, , 10F
代" 為分組準則, 或以常用的年齡等間距分組.
11/29 18:07, 10F
謝謝回答 關於分組,因為這個變項有大約有四分之三的人都是0 其餘的四分之一的人數是從個位數到千、萬都有 因此才想把他們分組,目前是以0為一組,其他的數值在一人數分為兩組… 因為不知道這個變項的數據可以從那個點分組,所以依人數來分 這樣可以嗎? 還是有什麼方法可以看出從那個點分組可以讓資料更好呢? 謝謝 ※ 編輯: HermioneTYY 來自: 114.36.250.92 (11/29 19:20)

11/30 09:03, , 11F
完全不知道是什麼資料, 也不知資料分佈情況, 更不知變數間具
11/30 09:03, 11F

11/30 09:04, , 12F
體的關係如何. 這種情形要提建議, 可以說是: 瞎話.
11/30 09:04, 12F

11/30 09:05, , 13F
就提一個瞎建議吧! 0單獨一組, 1-10, 11-100,101-1000,1001+
11/30 09:05, 13F
呃 我是很認真的… 數據的單位是平方公分。 100以下的也只有16個,300~4000的有16個,一萬的有1… ※ 編輯: HermioneTYY 來自: 140.112.125.68 (11/30 12:18)
文章代碼(AID): #1GjmTRAv (Statistics)