[問題] 相關和回歸該如何界定 outlier?

看板Statistics作者 (綠色蘇打心)時間16年前 (2008/06/29 22:29), 編輯推噓5(5011)
留言16則, 6人參與, 最新討論串1/1
以前在實驗室的時候 看學長的作法 是直接把不想要的點給砍掉 可是這樣感覺好像在做資料 有沒有比叫適當的做法可以用呢? --------------------------------- 若是 one variable 課本上是用 Q1 - 1.5 IQR Q3 + 1.5 IQR 當作 fence(柵欄,邊界) 超過 fence 的 data 一率視為 outliers 然後刪光光 可是我不懂 two variables 時 該如何處理 --------------------------------- 回歸感覺還直觀一點 就把 Y variable 當作 one variable 來處理就好了 但是相關要怎麼辦? 先踢除哪一個變數的 outlier 都會影響到另一個變數的 fence 實在不知道要怎麼處理.... ---------------------------------- 求各位有經驗的大大指點迷津 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.124.210.238 ※ 編輯: gsuper 來自: 122.124.210.238 (06/29 22:30) ※ 編輯: gsuper 來自: 122.124.210.238 (06/29 22:34)

06/29 23:04, , 1F
不要養成刪data的壞習慣!
06/29 23:04, 1F

06/30 01:10, , 2F
刪除outliner是取樣時的一個技術阿 應該是在檢定之前做的事
06/30 01:10, 2F

06/30 01:12, , 3F
只要不是先檢定 然後再修改data去改變檢定結果
06/30 01:12, 3F

06/30 01:12, , 4F
應該是可以的吧?
06/30 01:12, 4F

06/30 03:09, , 5F
不知道資料離群的可能原因就刪掉,感覺說服力不太夠耶
06/30 03:09, 5F

06/30 07:07, , 6F
什麼時候刪data變成一種技術啊...難道你們實驗的操作守則有
06/30 07:07, 6F

06/30 07:08, , 7F
這條? 要刪可以, 請在paper裡交代刪的原則, 跟為什麼刪
06/30 07:08, 7F

06/30 07:09, , 8F
如果你說得清楚, reviewer也接受, 那就ok
06/30 07:09, 8F

06/30 07:10, , 9F
如過你刪的理由不敢放進paper裡, 那麼請不要亂刪data
06/30 07:10, 9F

06/30 08:05, , 10F
這是很奇怪的法則 @@
06/30 08:05, 10F

06/30 09:33, , 11F
是Outlier還是Outliner?????? 記得是Outlier吧
06/30 09:33, 11F
※ 編輯: gsuper 來自: 122.124.210.238 (06/30 14:50)

06/30 15:01, , 12F
所以outlier是不能刪除的嗎? 我查了課本 的確沒有說能刪除
06/30 15:01, 12F

06/30 15:01, , 13F
只說要進一步的研究.... I was wrong
06/30 15:01, 13F

06/30 16:47, , 14F
不是不能刪 比如身高資料發現有個身高寫500cm 能不刪嗎?
06/30 16:47, 14F

06/30 17:12, , 15F
問題還是在於刪除資料的原因要真的有道理而不是為了顯著...
06/30 17:12, 15F

06/30 17:29, , 16F
有時候Outlier更值得研究..
06/30 17:29, 16F
文章代碼(AID): #18PvnWT2 (Statistics)