[問題] 依變項為類別資料是否可以使用ols?

看板Statistics作者 (兔)時間16年前 (2009/07/15 15:03), 編輯推噓1(1010)
留言11則, 4人參與, 7年前最新討論串1/1
不好意思想請問大家一個觀念的問題, 通常我們處理依變項是類別資料,只能使用logistic or probit等 看不同自變項對依變項發生機率的影響。 如果我希望獲得類似OLS那樣,透過自變項來預測依變項的值 能否將分組資料直接取組中點的值然後帶入呢? 舉例來說:許多問卷資料對於所得都是採類別資料。 1. 20000以下 2. 20000-40000 3. 40000-60000 4. 60000-80000 5. 80000以上 我是否可以直接取各組的組中點作為取代的依變項呢? 那如果這樣的分組資料是自變項的話,我可以直接取組中點帶入嗎? 如果分組資料不是所得,而是類似比率的數字, 如 你的人生中有多少比重的時間浪費掉了? 1. 5%以下 2. 5%-10% 3.10%-15%..以此類推 如果是這類資料的話,是否可以取組中點的數值取代類別? 會有這樣的疑問是多數的問卷都是類似這樣的分組資料, 但書中沒說我們可以這樣做。 好奇這樣做可能會產生的問題,以及有文章是以這種方式計算的嗎? 先謝謝大家的回答了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.123.181.42

07/15 16:03, , 1F
為什麼要這樣做?用ordinal regression就好了阿?
07/15 16:03, 1F

07/15 16:04, , 2F
可以貼近真實的情況時,為什麼還要把他拉遠?不懂
07/15 16:04, 2F

07/15 16:39, , 3F
用 OLS 可以. 至於其缺點: (1) 因為以組中點取代未知真值,
07/15 16:39, 3F

07/15 16:40, , 4F
且實務上組距甚大, 因此誤差不小; (2) 實際反應不一定接近常
07/15 16:40, 4F

07/15 16:41, , 5F
態誤差, 分組後取組中點更非常態. 但 CLT 適用時無妨.
07/15 16:41, 5F

07/15 16:43, , 6F
又: 有時在調查設計上因考慮原反應分布之偏態而採用不等組距
07/15 16:43, 6F

07/15 16:44, , 7F
此時組中點或許不是好的代表值.
07/15 16:44, 7F

07/15 21:57, , 8F
因為我初學 手邊書上只有介紹ols跟logit & probit
07/15 21:57, 8F

07/15 21:59, , 9F
yhliu回應的 如果真的帶入可能產生的問題 所以謝謝兩位
07/15 21:59, 9F

07/15 22:02, , 10F
所以不知道有這種東西 Orz 但我同時也想知道帶入的問題
07/15 22:02, 10F

01/02 14:57, 7年前 , 11F
(1) 因為以組中點取 http://yofuk.com
01/02 14:57, 11F
文章代碼(AID): #1ANNydFr (Statistics)