[問題] 對數據做平移 使不為 0

看板Statistics作者 (RungTai)時間10年前 (2015/07/04 10:56), 10年前編輯推噓0(009)
留言9則, 3人參與, 最新討論串1/1
有些時候,要取 Log, Natual Log, 幾何平均數..時 都要求數值不能有0 這時如果想算這些值,有人建議將原始數據平移 強迫全部不為0 如果是這樣的話,那應該加上什麼樣的值作為平移的標準? a. 0 以外的「最小值」 b. 0.000000000000000000000............00000000001 請問哪一個比較好呢? 如果是第一種 a. 似乎比較客觀 如果是第二種 b. 雖然可以讓「平移的量」達到最小,但到底要幾位數就變成人為任意 再者,像「幾何平均數」是 兩者相乘再開根號 如果是 b. 會使兩者相乘的結果,位數跟著往後一直移 造成「幾何平均數」與「算數平均數」的結果差異非常非常大 所以想問大家,是不是第一種 a. 的作法比較好? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 202.103.141.2 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1435978572.A.2C4.html ※ 編輯: RungTai (202.103.141.2), 07/04/2015 10:58:01

07/04 12:22, , 1F
一般最常見的是log(x+1) 但如果在解釋時 都轉回原本的
07/04 12:22, 1F

07/04 12:24, , 2F
scale 建議你想一下 為什麼你需要做log轉換 這問題可能
07/04 12:24, 2F

07/04 12:24, , 3F
比 +1, +0.1, +0.001 重要點
07/04 12:24, 3F

07/04 14:30, , 4F
如果是想把偏態資料轉換成常態 ,通常是先加上某一數
07/04 14:30, 4F

07/04 14:30, , 5F
值使最小值為1,再進行轉換,可參考: http://goo.gl/iNh
07/04 14:30, 5F

07/04 14:31, , 6F
KS2
07/04 14:31, 6F

07/04 14:31, , 7F
07/04 14:31, 7F

07/07 11:29, , 8F
但如果原始值就是介於 0~1之間呢
07/07 11:29, 8F

07/08 09:58, , 9F
介於0~1之間有什麼差別嗎 是所有值+1 不是只有0+1喔
07/08 09:58, 9F
文章代碼(AID): #1LbqjCB4 (Statistics)