[問題] 鮑魚數據問題

看板Statistics作者時間8年前 (2017/06/13 00:01), 編輯推噓2(205)
留言7則, 2人參與, 最新討論串1/1
不好意思不知道發在此版適不適合 想請問一下,若在資料分析中,未做統計前就將變數刪除合理嗎? 例如UCI鮑魚數據集 裡面的性別有F,M,I(infant) 但是有些infant的年齡卻很大 不知道要如何去解釋它,想要把這變數拿掉 查了一些資料,發現過往的人也都沒有去發現這問題... 就直接開始丟統計軟體 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.162.139.21 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1497283279.A.2EC.html

06/13 00:58, , 1F
每個變數的定義都弄清楚了嗎?有時候只是蒐集資料時coding
06/13 00:58, 1F

06/13 00:58, , 2F
方式不同
06/13 00:58, 2F

06/13 08:53, , 3F
弄清楚了 有些嬰兒年紀比男性女性大...
06/13 08:53, 3F

06/13 21:24, , 4F
如果確定不是coding的時間單位不同,而且這些值刪掉不會影響
06/13 21:24, 4F

06/13 21:25, , 5F
其它變數的敍述統計量,刪掉未必不可,但是記得在report時,
06/13 21:25, 5F

06/13 21:26, , 6F
要清楚揭露處理資料的方式
06/13 21:26, 6F

06/13 23:05, , 7F
謝謝
06/13 23:05, 7F
文章代碼(AID): #1PFhhFBi (Statistics)