Re: [問題] 偏離問題

看板Statistics作者 (攸藍)時間10年前 (2015/08/02 16:43), 10年前編輯推噓5(5024)
留言29則, 5人參與, 最新討論串2/2 (看更多)
※ 引述《chenfafa (fafa)》之銘言: : 如果是跟統計軟體有關請重發文章。 : 如果跟論文有關也煩請您重發文章。 : 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 : http://i.imgur.com/UGLc09A.jpg
: 不好意思 : 想問這上面的圖 : 為什麼median一定在mean跟mode中間? : 還有可以解釋為什麼左偏的平均數會在最左邊?反之亦然 : 有用假設一次考試大家都考很好去想 : 但還是不太能理解這三者間的關係 : 我有查一些網站了 : 但都沒有講的很清楚 : 謝謝大家~ : http://i.imgur.com/4AaPpvb.jpg
: 還有這張圖 感覺跟上面觀念有點像 : 解說是用outlier去解釋 : 但我還是有點不懂 : 再次謝謝大家 我自己教的時候是這樣說明的,提供參考: 平均數會受極端值影響, 會出現右偏(right-skewed)的圖形,比median小 反之,則是左偏(left-skewed),比median大 眾數則是出現在出現次數最多的次數 (就density來看就是density最高的地方) 一個右偏的分配,眾數會出現在較小的值,會比median小 反之,會出現在較大的值,會比median大 PS: median是比50%的資料大的值,所以右偏時,會出現在過最大density的地方 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.205.27.107 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1438504985.A.954.html

08/02 16:58, , 1F
還是不太懂也 能再講清楚mean的部分嗎 謝謝
08/02 16:58, 1F

08/02 18:51, , 2F
但圖上 右偏時 小的值叫多 平均值是比中、眾數大
08/02 18:51, 2F

08/02 18:51, , 3F
平均值是較大
08/02 18:51, 3F

08/02 18:51, , 4F
跟你講的不一樣也
08/02 18:51, 4F
抱歉,剛剛搞混,應該更正成,右偏時,有一些大的值就會把平均值拉大

08/02 20:09, , 5F
1 2 3的平均 跟1 2 19的平均
08/02 20:09, 5F

08/03 06:02, , 6F
以前似乎我曾說明過這問題, 可能是貼在 成大計中站 吧? 現
08/03 06:02, 6F

08/03 06:03, , 7F
在該站已關, 找不到了. orz
08/03 06:03, 7F

08/03 06:04, , 8F
正偏, 又稱 右偏, 是指右邊尾巴拉得較長. 以中位數為準, 中
08/03 06:04, 8F

08/03 06:05, , 9F
位數右邊的資料被拉開(拉長), 也就是說, 相對於中位數左邊
08/03 06:05, 9F

08/03 06:06, , 10F
有些資料離得比較遠, 因此平均數被拉高. 反之, 中位數左邊
08/03 06:06, 10F

08/03 06:07, , 11F
擠在較小範圍, 整個分布曲線被擠壓, 所以高峰可能出現在中
08/03 06:07, 11F

08/03 06:08, , 12F
位數左邊. 也就是說, 呈現 眾數 < 中位數 < 平均數 的樣子.
08/03 06:08, 12F

08/03 06:09, , 13F
負偏, 又稱左偏, 則是相反乎, 中位數之左被拉長, 因而比較
08/03 06:09, 13F

08/03 06:10, , 14F
少出現高峰; 而右邊被擠壓, 所以眾數可能在中位數之右.
08/03 06:10, 14F

08/03 06:11, , 15F
以上說明教本上對偏斜分布的一般描述, 中位數在眾數與平均
08/03 06:11, 15F

08/03 06:12, , 16F
數中間. 不過, 這都只是 "典型". 如果套用某種特定分布, 可
08/03 06:12, 16F

08/03 06:20, , 17F
能發現並不是這樣的, 例如 Weibull 分布之 shape parameter
08/03 06:20, 17F

08/03 06:21, , 18F
在某些範圍時可能出現 median < mode < mean, 另某些範圍時
08/03 06:21, 18F

08/03 06:22, , 19F
可能出現 median < mean < mode. 請參見
08/03 06:22, 19F

08/03 06:23, , 20F
telnet://bs2.twbbs.org 之 P_cjosephlu 版, "What about
08/03 06:23, 20F

08/03 06:24, , 21F
the skewness?" 討論串.
08/03 06:24, 21F

08/03 06:26, , 22F
第2張圖, 很明顯的正偏分布, 右邊尾巴拉得較長, 並不需要有
08/03 06:26, 22F

08/03 06:26, , 23F
outlier 才能解釋 mean > median.
08/03 06:26, 23F

08/03 06:28, , 24F
事實上該圖也沒顯示有無 outlier, 只是最簡單的盒形圖.
08/03 06:28, 24F
謝謝老師詳細的說明 我有到該站去看了相關討論串 Weibull(λ,k)的mode, median, mean分別是: mode: λ((k-1)/k)^(1/k) mean: λG(1+1/k), G is gamma function median: λ(ln(2))^(1/k) 假設λ=1,我們可以得到下圖 http://i.imgur.com/6eov2N6.png
三條灰色虛線分別是 3.258921 3.312487 3.439541 而skewness在大於3.602345時,小於0 code: http://pastebin.com/yDbnRmMs PS: skewness都很小,在這種case下,看不太出來distribution是否真的左偏或右偏... 因此,median, mean, mode的大小順序是"典型",但大多數情況是可以參考的

08/03 07:35, , 25F
推樓上~
08/03 07:35, 25F
※ 編輯: celestialgod (123.205.27.107), 08/03/2015 09:58:55

08/03 15:52, , 26F
謝謝大家.....真的很感謝
08/03 15:52, 26F

08/03 15:54, , 27F
我第二張圖本來是選D,是不清楚為什麼能知道平均值,沒
08/03 15:54, 27F

08/03 15:54, , 28F
有給個數有多少,想請問這是為什麼?
08/03 15:54, 28F

08/03 17:25, , 29F
上面劉老師有說明喔
08/03 17:25, 29F
文章代碼(AID): #1LlTWPbK (Statistics)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
文章代碼(AID): #1LlTWPbK (Statistics)