[問題] DNN 回歸問題是否需要標準化

看板DataScience作者 (輝飛)時間5年前 (2018/12/19 17:14), 5年前編輯推噓3(305)
留言8則, 5人參與, 5年前最新討論串1/1
問題類別:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...) DNN 使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...) python 問題內容: 各位大大您好,目前使用DNN對時間序列進行預測 想問一下丟進去模型的訓練資料是否有一定要標準化(Normalization) 如果每個feature的區間範圍不一樣時,肯定需要標準化, 但像是我手邊的資料是銷售額的時間序列資料,這樣是否一定要標準化? 在之前的訓練,會發生predict出來的結果,皆預測成同一個值, 不知道是否是因為訓練資料被標準化到一定範圍,太過接近, 以至於預測結果為同一個值,這樣是否是模型沒學習好? 麻煩各位大大指教,非常感謝! 附上舉例給各位大大參考: 訓練資料有Normalization後的預測結果 [0.838, 0.838, 0.838, 0.838, 0.838, 0.838, 0.838, 0.838, 0.838, 0.838] 訓練資料沒有Normalization,直接丟入模型的結果 [369.643, -1579.206, -1570.955 ,-1001.645, -1721.018, 228.803, -221.869, -1368.03, -1210.812, -225.353] 實際資料: [-5556.167, -4843.999, -4869.553, -1570.44, 0.0, -4350.014, 2.387, -3172.07, 0.0, -658.111] -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.119.78.30 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1545210892.A.84A.html ※ 編輯: yanwu0105 (140.119.78.30), 12/19/2018 17:17:25

12/19 20:00, 5年前 , 1F
通常是對feature normalize而不是對label normalize吧
12/19 20:00, 1F

12/19 20:00, 5年前 , 2F
?(DNN 的feature我不確定需不需要?)
12/19 20:00, 2F

12/19 23:01, 5年前 , 3F
請問是使用DNN一次預測一整條時間序列嗎?
12/19 23:01, 3F

12/19 23:02, 5年前 , 4F
我的經驗是DNN對於這種資料很難train的好
12/19 23:02, 4F

12/19 23:08, 5年前 , 5F
可以嘗試改成regression的方式(通常需要normalize)
12/19 23:08, 5F

12/20 01:19, 5年前 , 6F
我不太相信你有這結果是因為Normalize 建議檢查訓練過程
12/20 01:19, 6F

12/20 10:11, 5年前 , 7F
categorical feature 不用normalize,餘則要。
12/20 10:11, 7F

12/23 17:22, 5年前 , 8F
Normalize的結果真的是這樣?建議檢查code
12/23 17:22, 8F
文章代碼(AID): #1S6WmCXA (DataScience)