[程式] SAS missing value問題

看板Statistics作者 (囧)時間12年前 (2013/07/02 18:39), 編輯推噓3(302)
留言5則, 3人參與, 最新討論串1/1
[軟體程式類別]: SAS 9.3 [程式問題]: 資料處理 [軟體熟悉度]: 高(1年以上) [問題敘述]: 最近分析某資料庫,發現一個應該是numeric的欄位, 出現一個遺漏值以_表示。 正常來講,遺漏值應該是以.表示才對。 但是我將該筆資料匯出到另外一個dataset, 不管是proc freq或proc means都將該變數當成遺漏值。 可是如果在data step中用where指令搜尋.(遺漏值), 卻又不會把該筆資料納入。 這是bug嗎...?? [程式範例]: 第1000筆資料的X10變數為_ data N1000; set test; where X10=.; run; 這樣跑出來,N1000裡面沒有資料。 data N1000; set test; where id="N1000"; run; 這樣有資料,且X10為_ proc means data=N1000; var X10; run; proc freq data=N1000; tables X10; run; 這樣都是missing value。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.139.146.238

07/02 21:57, , 1F
所以該值是空白還是等於.??? 這兩個有差別喔
07/02 21:57, 1F

07/02 22:44, , 2F
your data type might read as character
07/02 22:44, 2F

07/03 02:46, , 3F
試試options missing=".";
07/03 02:46, 3F

07/03 02:48, , 4F
missing的記號是可以變動的
07/03 02:48, 4F

07/03 02:48, , 5F
^numeric
07/03 02:48, 5F
謝謝! 回tew: 打開資料庫(視窗介面) 該變數點選attribute或description都顯示為num。 事實上對該變數用proc univariate,會列出兩種遺漏值: 一個是.表示的(預設) 唯獨該筆資料很奇怪的,是_(一條底線) 一個變數怎麼有辦法同時有兩種表達遺漏值的格式? ※ 編輯: anovachen 來自: 140.122.42.152 (07/03 12:49)
文章代碼(AID): #1HqgtGG0 (Statistics)