[問題] feature design 的概念性問題

看板Statistics作者 (Logit(odds))時間10年前 (2014/02/06 12:36), 編輯推噓1(101)
留言2則, 1人參與, 最新討論串1/1
假設擁有兩個很基本的向量 lm(Y~X) Y 與 X 都是 numeric variable , 這樣可以跑回歸或相關 但 numeric variable 可以降維 , 變成 multinomial 或 binomail 比方說溫度變項 , 可以變為 高/中/低溫組 , 也可以變成 熱/冷組 這樣可以變成 contingency table 也可以變成 logistic regression (二元或多元) 也可以變成 one-way ANOVA ---------------------------------------------- 總覺得不知如何是好 , 因為總有辦法可以找出 significant difference 是否降維就是損失? numeric 的 comparison 一定比 降維後的 categorocal data 容易顯著 所以能做 numeric comparison 就不必降維再做? 誠心請教 -- 我用名為真心的卡牌說服你 這是我最後一張牌 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.32.215.136 ※ 編輯: gsuper 來自: 114.32.215.136 (02/06 12:37)

02/06 14:33, , 1F
那個應該不叫做降維 叫離散化 看你在意的是什麼
02/06 14:33, 1F

02/06 14:33, , 2F
如果只在意高低 就高低 在意numerical value就不用
02/06 14:33, 2F
我是在 code systematical analysis flow 想說一次寫完 , 永久使用 但每種都寫又覺得怪怪的 ※ 編輯: gsuper 來自: 114.32.215.136 (02/06 14:41)
文章代碼(AID): #1Iyn57sX (Statistics)