Re: [程式] SAS利用巨集水平合併多個檔

看板Statistics作者 (無庸)時間9年前 (2015/01/15 07:55), 編輯推噓0(0012)
留言12則, 2人參與, 最新討論串3/4 (看更多)
我一般的做法是這樣的 首先把所有file的名字列出來 (應該有很多方法,我都是直接進入dos界面使用dir命令 然後copy出所有的files的名字) 然後利用excel,把它們和有次序的macro variable聯係起來 例如這樣 %let file1=TX2007Jan1; %let file2=TX2007Jan3; ... %let file1000=TX2015Jan14; 這樣就可用使用Loop來順序讀取所有file 如下, %macro mergefile; PROC DATASETS library=work; DELETE total temp;RUN; %do i=1 %to 1000; PROC IMPORT OUT= temp DATAFILE= "D:\test\&&file&i.." DBMS=DBF REPLACE; GETDELETED=NO; RUN; data temp; set temp; filename=&&file&i..; keep filename post_code RASTERVALU; run; PROC DATASETS; APPEND base =total new = temp force;RUN; %end; %mend; %mergefile; 這樣你就有了一個file包括所有資料,裏面的variable filename包括了年月日 你需要什麽就用相應的function來獲取就可以,或者你要transpose data也可以 用proc datasets 的append的時候要小心,相同variable的format要一致 否則會有問題,要小心檢查。 ※ 引述《ctn912 (雨兒)》之銘言: : -------------------------------------------------------------------- : [軟體程式類別]: : SAS9.3 : [程式問題]: : 資料處理 : [軟體熟悉度]: : 中(3個月到1年) : [問題敘述]: : 目前我有五年份的檔案(DBF檔),數量大約一千多個,每個檔案以日期命名, : 因為不是每一天都有檔案所以數字並不連續。 : 每一個檔案內都只有一個變數RASTERVALU : 例如一月份檔名:TX2007JAN1、TX2007JAN3、TX2007JAN11、TX2007JAN15... : 我想用macro將所有的檔案讀入,修改變數名稱(改為日期)再合併。 : 由於檔名的數字不連續,所以結果會將原本沒有的檔案也建立在資料庫, : 使用merge在合併時就發生沒有讀取到變數而發生錯誤不能合併。 : 在版上看過有人寫 PROC DATASET 的巨集來做, : 雖然之後試了force option有強制併在一起但是除了共同欄位外其餘都成了缺失值。 : 所有程式語法如下。 : 因為我第一次試寫macro語法,估勾很久還是不知道如何解決,還請版友指教。 : 謝謝大家^^ : [程式範例]: : %macro import (n); : %Do i=1 %to &n; : PROC IMPORT OUT= WORK.temp2007JAN&i : DATAFILE= "D:\test\ck0701&i" : DBMS=DBF REPLACE; : GETDELETED=NO; : RUN; : data TX2007JAN&i; : set temp2007JAN&i; : keep post_code RASTERVALU; : if RASTERVALU>0 then TX2007JAN&i=RASTERVALU; : run; : data A.TX2007JAN&i; : set TX2007JAN&i; : TX2007JAN&i=RASTERVALU; : drop RASTERVALU; : run; : %end; : %mend; : %import (28); : ------------------------------------------------------- : %macro merge ; : PROC DATASETS library=A; RUN; : %do i=1 %to 28; : proc sort data=TX2007JAN&i; by post_code; : PROC DATASETS; APPEND out =tm data=TX2007JAN&i force; : RUN; : %end; : %mend merge ; : %merge by post_code; : ----------------------------------------------------------------------------- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.85.174.10 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1421279701.A.E79.html

01/15 09:03, , 1F
filename=&&file&i..;應該爲filename="&&file&i..";
01/15 09:03, 1F

01/16 15:48, , 2F
上網查了之後才對macro variable有點概念,我試跑這段語法
01/16 15:48, 2F

01/16 15:50, , 3F
大概可以瞭解了,感激不盡
01/16 15:50, 3F

01/17 10:16, , 4F
我要補充一點,在%do i=1 %to 1000;的後面,需要加上
01/17 10:16, 4F

01/17 10:17, , 5F
PROC DATASETS library=work; DELETE temp;RUN;
01/17 10:17, 5F

01/17 10:18, , 6F
否則可能會有問題。這是因爲每個file在import之後
01/17 10:18, 6F

01/17 10:19, , 7F
都會overwrite temp這個file,問題是如果某個file,例如
01/17 10:19, 7F

01/17 10:20, , 8F
file100在import的時候失敗,這時候temp就還仍然是第
01/17 10:20, 8F

01/17 10:21, , 9F
99個file,然後再被append到total裏面去,相當於file99
01/17 10:21, 9F

01/17 10:22, , 10F
被append了兩次,而你可能沒有發現這個問題,使得後面
01/17 10:22, 10F

01/17 10:23, , 11F
的分析可能出錯。由於問題很嚴重,所以我要補充這一點。
01/17 10:23, 11F

01/19 21:03, , 12F
感謝協助與指導,我已經順利跑出來了^^
01/19 21:03, 12F
文章代碼(AID): #1Kjm7Lvv (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1Kjm7Lvv (Statistics)