[中學] 標準差定義?(為何用平方和開根號)

看板Math作者 (生死間有大恐怖)時間10年前 (2014/04/11 00:32), 編輯推噓18(18044)
留言62則, 18人參與, 4年前最新討論串1/2 (看更多)
標準差定義是 _ S = {[sigma(x_i - x)^2]/n}^(1/2) (離均差平方和平均再開根號) 為何不用絕對值就好? S = [sigma|x_i - x|]/n (離均差平方和開根號再平均) 當初在定義的時候有甚麼考慮嗎? 另外第二個 S 在統計中是否有用到? ORZ -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.255.89.133 ※ 文章網址: http://www.ptt.cc/bbs/Math/M.1397147556.A.CC5.html

04/11 00:37, , 1F
性質吧
04/11 00:37, 1F

04/11 00:41, , 2F
個人猜測 不用絕對值 是跟微積分有關
04/11 00:41, 2F

04/11 01:36, , 3F
平方誤差 絕對誤差?
04/11 01:36, 3F

04/11 01:38, , 4F
問一下第二個定義是不是要用中位數會比較好..
04/11 01:38, 4F

04/11 01:51, , 5F
第二個定義是我亂想的 不知有沒有這種
04/11 01:51, 5F

04/11 01:55, , 6F
我跟學生說的時候 是先講(2) 但由於性質或是不能微分
04/11 01:55, 6F

04/11 01:57, , 7F
的關係 數學家才換種方式用(1)來表達 差距的平均數
04/11 01:57, 7F

04/11 01:57, , 8F
但這僅僅是我用自己的方式去理解這樣的概念
04/11 01:57, 8F

04/11 02:07, , 9F
加絕對值得當然也有名字囉
04/11 02:07, 9F


04/11 02:14, , 11F
最直接的理由應該是中央極限定理
04/11 02:14, 11F

04/11 08:49, , 12F
因為假設是gaussian distribution是由該標準差刻劃
04/11 08:49, 12F

04/11 08:51, , 13F
正確來說 該S是假設之常態分佈的sigma之估計
04/11 08:51, 13F

04/11 09:59, , 14F
因為絕對值在做數學運算時比較難處理,所以不常用。
04/11 09:59, 14F

04/11 11:55, , 15F
樓上, 這對電腦而言應該不是問題吧= =
04/11 11:55, 15F

04/11 11:56, , 16F
我覺得應該是跟統計學/機率學某些理論有關
04/11 11:56, 16F

04/11 11:56, , 17F
不是因為難算...
04/11 11:56, 17F

04/11 12:46, , 18F
幫高調,想知道。
04/11 12:46, 18F

04/11 13:05, , 19F
樓樓上 在標準差定出來的時候 電腦還沒發展到那麼強
04/11 13:05, 19F

04/11 13:05, , 20F
大吧
04/11 13:05, 20F

04/11 13:07, , 21F
之前聽老師說 好像算是某種人為訂定出來的典範
04/11 13:07, 21F

04/11 13:16, , 22F
不過我比較在意的點是 為什麼是平均後在開根號
04/11 13:16, 22F

04/11 13:17, , 23F
而不是開根號後在平均...這樣連分母的n都被開根號了
04/11 13:17, 23F

04/11 13:18, , 24F
跟絕對值除以n的數量級感覺不一樣
04/11 13:18, 24F

04/11 13:31, , 25F
因為標準差的定義是 square root of "variance"
04/11 13:31, 25F

04/11 13:32, , 26F
描述一筆資料的 variance, 應該看當時的統計 model
04/11 13:32, 26F

04/11 13:36, , 27F
那是因為variance本身有平方才去取square root
04/11 13:36, 27F

04/11 13:36, , 28F
現在問題是為什麼定的時候要用平方還不是用絕對值
04/11 13:36, 28F

04/11 13:37, , 29F
04/11 13:37, 29F

04/11 13:42, , 30F
要看是用在甚麼地方啊, 例如拿到一筆資料{xi|i in A}
04/11 13:42, 30F

04/11 13:43, , 31F
假設 model 是 gaussian, 且各 sample 為 iid
04/11 13:43, 31F

04/11 13:45, , 32F
考慮 bias variance estimator 就會是那個型態
04/11 13:45, 32F

04/11 13:45, , 33F
所以當你用了 那個"統計量" 來描述一筆資料
04/11 13:45, 33F

04/11 13:46, , 34F
等於是認定背後有一種機率模型, 只是高中不會去談
04/11 13:46, 34F

04/11 13:54, , 35F
以刀子比喻, 刀子有 西瓜刀、美工刀、菜刀、...
04/11 13:54, 35F

04/11 13:55, , 36F
刀子型態各異,是因為要處理不同東西
04/11 13:55, 36F

04/11 13:55, , 37F
對高中生而言,老師就是負責給學生一把刀子
04/11 13:55, 37F

04/11 13:55, , 38F
學生不用管刀子型態為何長這樣,切就對了...
04/11 13:55, 38F

04/11 14:28, , 39F
第二個當然有人想過,很多書都有寫,只是不用它的解
04/11 14:28, 39F

04/11 14:28, , 40F
釋不能說服人
04/11 14:28, 40F

04/11 14:29, , 41F
中文好像叫作「平均絕對離差」還是「絕對差」的
04/11 14:29, 41F

04/11 14:30, , 42F
原來維基有,叫做「平均差」
04/11 14:30, 42F

04/11 14:34, , 43F
S大的問題,標準差算出來之後會比先開根號再除以n來
04/11 14:34, 43F

04/11 14:34, , 44F
的較貼近
04/11 14:34, 44F

04/11 14:35, , 45F
較貼近離散程度
04/11 14:35, 45F

04/11 14:36, , 46F
例如-2跟2,標準差是{[(-2)^2+2^2]/2}^(1/2)=2,你
04/11 14:36, 46F

04/11 14:38, , 47F
說的是{[(-2)^2+2^2]^(1/2)}/2=根號2,顯然是2較貼近
04/11 14:38, 47F

04/11 14:38, , 48F
原始離散程度,不過這樣講好像還是以絕對值來算最貼
04/11 14:38, 48F

04/11 14:38, , 49F
04/11 14:38, 49F

04/11 15:30, , 50F
何謂 "離散程度" ? 至少要給一個明確的定義出來
04/11 15:30, 50F

04/11 15:30, , 51F
連定義 or model 都沒有,談論工具好壞沒有任何意義
04/11 15:30, 51F

04/11 15:31, , 52F
就像問 菜刀 跟 美工刀 哪個好切, 有意義嗎?
04/11 15:31, 52F

04/11 16:03, , 53F
純粹是容易計算而已
04/11 16:03, 53F

04/11 16:03, , 54F
也有用絕對值計算的標準差
04/11 16:03, 54F

04/11 16:45, , 55F
別以為有電腦絕對值就好算....
04/11 16:45, 55F

04/11 19:00, , 56F
對 ieee754 而言, abs 不就只是把 sign bit 設 0
04/11 19:00, 56F

04/11 19:00, , 57F
會比 浮點數乘法器 快 ?
04/11 19:00, 57F

04/12 09:28, , 58F
離差計算的方法很多種,取平方計算是一種,取標準差
04/12 09:28, 58F

04/12 09:28, , 59F
是一種。
04/12 09:28, 59F

04/14 01:53, , 60F
統計老師是說因為絕對值不好運算
04/14 01:53, 60F

01/02 15:43, 5年前 , 61F
的關係 數學家才換種方 https://daxiv.com
01/02 15:43, 61F

07/07 12:01, 4年前 , 62F
加絕對值得當然也有名字 http://yofuk.com
07/07 12:01, 62F
文章代碼(AID): #1JHiUap5 (Math)
文章代碼(AID): #1JHiUap5 (Math)