[問題] 特徵與標籤的相關性拿來做特徵工程?已刪文

看板DataScience作者 (花若盛開)時間3年前 (2020/08/08 04:14), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
作業系統:win10 問題類別:ML,DL,NN,DS 使用工具:python,tensorflow,keras 問題內容: 大家好, 小弟是碩士研究生, 最近在做深度學習專題。 我將原始資料做minmax scaler後, 餵給神經網路,發現準確率不高。 我突發奇想, 把特徵(features)和標籤(label)的相關係數求出來, 如果是正相關, 就維持特徵原本的值, 反之,若是負相關, 就將特徵值乘上-1。 做完上述轉換後再做minmax scaler, 丟進神經網路後, 發現平均準確率上升不少 (用5折交叉驗證法) 原本開心的要收工了 凌晨突然想到: 我這樣算不算偷看答案啊? 監督式機器學習的資料前處理 是可以這樣做的嗎? 還是有其他「合法」的做法可以參考呢? 先謝謝各位點進來的大大 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.47.162 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1596831241.A.137.html
文章代碼(AID): #1VBRO94t (DataScience)