[問題] 變數到底適不適合取對數

看板Statistics作者 (那就念吧~~)時間12年前 (2013/05/22 19:36), 編輯推噓1(1016)
留言17則, 5人參與, 最新討論串1/1
我看過有些論文在某些變數的規模很大時,會先取對數後再進行迴歸 例如....薪資,營業額....等等 我自己也有試過 有些時候,依變數取對數後再跑線性迴歸的話 會出現某些自變數從不顯著變成顯著 可是....這樣做合適嗎? 感謝解惑 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 36.227.118.118

05/22 19:41, , 1F
會取對數還是二次式交叉項之類的都是要湊到顯著XD
05/22 19:41, 1F

05/22 21:25, , 2F
真的!!!!!!
05/22 21:25, 2F

05/22 21:32, , 3F
取對數可以使得variance變小 使資料更為同質
05/22 21:32, 3F

05/22 21:32, , 4F
據說有位統計大師說 若資料全正 就先取log 再正 再取log
05/22 21:32, 4F

05/22 21:57, , 5F
嗯~可是這樣真的是正確的估計方式嗎??感覺有點...投機耶
05/22 21:57, 5F

05/22 22:00, , 6F
不知哪位 "大師" 說資料是全正就要取對數? 荒謬!
05/22 22:00, 6F

05/22 22:00, , 7F
取對數也,不是為了什麼要得到 "顯著" 結論的理由!
05/22 22:00, 7F

05/22 22:01, , 8F
資料是否要取對數或其他變換, 取決於一些因素, 例如:
05/22 22:01, 8F

05/22 22:02, , 9F
1. 在例如迴歸模型中可能需要某種變數變換以方便用線性式表
05/22 22:02, 9F

05/22 22:03, , 10F
現模型, 否則模型可能較複雜或難以解釋.
05/22 22:03, 10F

05/22 22:05, , 11F
2. 模型之依變數或單一變數之分析, 需要做變數變換以符合或
05/22 22:05, 11F

05/22 22:06, , 12F
近似符合某些分析上所要求的條件, 例如常態性條件.
05/22 22:06, 12F

05/22 22:08, , 13F
3. 長尾型偏斜分布的資料, 取如對數或平方根轉換, 可更好地
05/22 22:08, 13F

05/22 22:08, , 14F
表現分布特性或其他目的.
05/22 22:08, 14F

05/22 22:09, , 15F
4. 因資料之分布特性, 在做某些分析時自然導出需要或最好是
05/22 22:09, 15F

05/22 22:10, , 16F
做某些變數變換.
05/22 22:10, 16F

05/23 16:55, , 17F
推樓上!!!
05/23 16:55, 17F
文章代碼(AID): #1HdAtNpl (Statistics)