[問題] 相關和回歸該如何界定 outlier?
以前在實驗室的時候
看學長的作法
是直接把不想要的點給砍掉
可是這樣感覺好像在做資料
有沒有比叫適當的做法可以用呢?
---------------------------------
若是 one variable
課本上是用
Q1 - 1.5 IQR
Q3 + 1.5 IQR
當作 fence(柵欄,邊界)
超過 fence 的 data 一率視為 outliers
然後刪光光
可是我不懂 two variables 時
該如何處理
---------------------------------
回歸感覺還直觀一點
就把 Y variable 當作 one variable 來處理就好了
但是相關要怎麼辦?
先踢除哪一個變數的 outlier 都會影響到另一個變數的 fence
實在不知道要怎麼處理....
----------------------------------
求各位有經驗的大大指點迷津
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.124.210.238
※ 編輯: gsuper 來自: 122.124.210.238 (06/29 22:30)
※ 編輯: gsuper 來自: 122.124.210.238 (06/29 22:34)
→
06/29 23:04, , 1F
06/29 23:04, 1F
→
06/30 01:10, , 2F
06/30 01:10, 2F
→
06/30 01:12, , 3F
06/30 01:12, 3F
→
06/30 01:12, , 4F
06/30 01:12, 4F
→
06/30 03:09, , 5F
06/30 03:09, 5F
→
06/30 07:07, , 6F
06/30 07:07, 6F
→
06/30 07:08, , 7F
06/30 07:08, 7F
→
06/30 07:09, , 8F
06/30 07:09, 8F
→
06/30 07:10, , 9F
06/30 07:10, 9F
推
06/30 08:05, , 10F
06/30 08:05, 10F
推
06/30 09:33, , 11F
06/30 09:33, 11F
※ 編輯: gsuper 來自: 122.124.210.238 (06/30 14:50)
→
06/30 15:01, , 12F
06/30 15:01, 12F
→
06/30 15:01, , 13F
06/30 15:01, 13F
推
06/30 16:47, , 14F
06/30 16:47, 14F
推
06/30 17:12, , 15F
06/30 17:12, 15F
推
06/30 17:29, , 16F
06/30 17:29, 16F