[問題] 箱型圖中outlier上下限如何定義的?

看板Statistics作者 (Chiu)時間6年前 (2017/10/26 10:51), 編輯推噓0(009)
留言9則, 2人參與, 6年前最新討論串1/1
目前知道在箱型圖中,outlier是利用Q3+1.5*IQR, Q3+3*IQR, Q1-1.5*IQR, Q1-3*IQR這 些內限外限決定出來的,那想了解這四個值為什麼要這樣定義(ex:為何不是Q3+2*IQR等等 之類的…)?是有什麼理論依據或是經驗法則?煩請各位大哥大姐解惑~謝謝。 如果是跟統計軟體有關請重發文章,使用程式做為分類。 統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類 請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。 為避免版面混亂,請勿手動置底問題,擅用E做檔案編輯 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.173.108 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1508986308.A.D13.html

10/26 19:03, 6年前 , 1F

10/26 19:03, 6年前 , 2F
When John Tukey was inventing the box-and-
10/26 19:03, 2F

10/26 19:04, 6年前 , 3F
whisker plot in 1977 to display these values,
10/26 19:04, 3F

10/26 19:04, 6年前 , 4F
he picked 1.5×IQR as the demarkation line for
10/26 19:04, 4F

10/26 19:04, 6年前 , 5F
outliers. This has worked well, so we've
10/26 19:04, 5F

10/26 19:04, 6年前 , 6F
continued using that value ever since.
10/26 19:04, 6F

10/26 19:05, 6年前 , 7F
不過從標準常態想,就是2.7個標準差
10/26 19:05, 7F

10/26 19:05, 6年前 , 8F
掉出去的機率只有 0.7%左右
10/26 19:05, 8F

10/27 11:53, 6年前 , 9F
感謝C大提供此資訊。
10/27 11:53, 9F
文章代碼(AID): #1PyKt4qJ (Statistics)