[問題] 比較兩組數據 正規化的目的

看板Statistics作者 (呢喃)時間11年前 (2015/01/10 18:18), 11年前編輯推噓2(2010)
留言12則, 4人參與, 最新討論串1/1
google了些關於正規化(normalize)的資料 都只有公式和分布狀態的資訊 但我疑惑的點是 在比較兩筆資料時 為什麼要正規化呢? 舉例 現在我有六組data 分別是 第一次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫 第二次實驗 感冒後 黃人(10人) 白人(10人) 黑人(10人) 的體溫 我現在想要用兩次實驗得到的體溫 將這三個人種分群(clustering) 在做分群前必須先將資料normalize 但我就不太懂這邊normalize的意義在哪裡... 而且又要如何normalize呢? (我們當然可算出這三組data的各別平均和標準差) 統計新手有這疑問 還請高手講解觀念 謝謝各位 :) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.94.64 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1420885103.A.87E.html ※ 編輯: murmurer (140.112.94.64), 01/10/2015 18:45:26

01/10 18:53, , 1F
去掉單位
01/10 18:53, 1F

01/10 19:58, , 2F
這個例子不明顯。有時候測值是不同的量,單位不同。
01/10 19:58, 2F
※ 編輯: murmurer (140.112.94.64), 01/10/2015 20:05:32

01/10 20:05, , 3F
單位都是度C的話呢
01/10 20:05, 3F

01/10 20:06, , 4F
P大既然單位都是度C 為什麼還需要去掉單位~
01/10 20:06, 4F

01/10 20:06, , 5F
A大能舉個淺顯的例子嗎 QQ
01/10 20:06, 5F

01/10 20:40, , 6F
像身高和體重,有不同的單位和不同的分散呈度。
01/10 20:40, 6F

01/10 21:49, , 7F
不是很懂 QQ 大大方便用站內信討論嗎
01/10 21:49, 7F

01/11 01:21, , 8F
先看看中文的維基百科「標準化 (統計學)」吧。
01/11 01:21, 8F

01/11 10:22, , 9F
值代表的是單位,標準差代表的是刻度。
01/11 10:22, 9F

01/11 10:22, , 10F
比說我皮包裡面有5單位的錢,我的單位是1百還是1千
01/11 10:22, 10F

01/11 10:23, , 11F
意義是不同的。所以給值得同時也要給單位。
01/11 10:23, 11F

01/11 10:24, , 12F
而標準化(normalize)就是去掉單位的影響。
01/11 10:24, 12F
文章代碼(AID): #1KiFnlX- (Statistics)