Re: [程式] SAS利用巨集水平合併多個檔

看板Statistics作者 (咖啡王子)時間11年前 (2015/01/15 13:41), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串4/4 (看更多)
你的數據是日內資料 所以一定有特性 這個特性就是 一定是大盤有交易的時間 因此 你去tej下載大盤這樣本期間的日報酬率 可以讓日期轉換成你的日期格式 然後設個巨集就可以讀取 tx&date 之類的檔案 B大的作法 確實可以幫你抓到檔案 但是 卻無法驗證你的數據是不是真的包含所有的交易日數據 我在做日內交易研究時 都一定使用大盤日報酬率的時間來抓 也這樣抓到很多錯誤 才能夠趕快請證交所補資料給我 提供你做個參考 ※ 引述《BugEater (無庸)》之銘言: : 我一般的做法是這樣的 : 首先把所有file的名字列出來 : (應該有很多方法,我都是直接進入dos界面使用dir命令 : 然後copy出所有的files的名字) : 然後利用excel,把它們和有次序的macro variable聯係起來 : 例如這樣 : %let file1=TX2007Jan1; : %let file2=TX2007Jan3; : ... : %let file1000=TX2015Jan14; : 這樣就可用使用Loop來順序讀取所有file : 如下, : %macro mergefile; : PROC DATASETS library=work; DELETE total temp;RUN; : %do i=1 %to 1000; : PROC IMPORT OUT= temp : DATAFILE= "D:\test\&&file&i.." : DBMS=DBF REPLACE; : GETDELETED=NO; : RUN; : data temp; : set temp; : filename=&&file&i..; : keep filename post_code RASTERVALU; : run; : PROC DATASETS; APPEND base =total new = temp force;RUN; : %end; : %mend; : %mergefile; : 這樣你就有了一個file包括所有資料,裏面的variable filename包括了年月日 : 你需要什麽就用相應的function來獲取就可以,或者你要transpose data也可以 : 用proc datasets 的append的時候要小心,相同variable的format要一致 : 否則會有問題,要小心檢查。 : ※ 引述《ctn912 (雨兒)》之銘言: : : -------------------------------------------------------------------- : : [軟體程式類別]: : : SAS9.3 : : [程式問題]: : : 資料處理 : : [軟體熟悉度]: : : 中(3個月到1年) : : [問題敘述]: : : 目前我有五年份的檔案(DBF檔),數量大約一千多個,每個檔案以日期命名, : : 因為不是每一天都有檔案所以數字並不連續。 : : 每一個檔案內都只有一個變數RASTERVALU : : 例如一月份檔名:TX2007JAN1、TX2007JAN3、TX2007JAN11、TX2007JAN15... : : 我想用macro將所有的檔案讀入,修改變數名稱(改為日期)再合併。 : : 由於檔名的數字不連續,所以結果會將原本沒有的檔案也建立在資料庫, : : 使用merge在合併時就發生沒有讀取到變數而發生錯誤不能合併。 : : 在版上看過有人寫 PROC DATASET 的巨集來做, : : 雖然之後試了force option有強制併在一起但是除了共同欄位外其餘都成了缺失值。 : : 所有程式語法如下。 : : 因為我第一次試寫macro語法,估勾很久還是不知道如何解決,還請版友指教。 : : 謝謝大家^^ : : [程式範例]: : : %macro import (n); : : %Do i=1 %to &n; : : PROC IMPORT OUT= WORK.temp2007JAN&i : : DATAFILE= "D:\test\ck0701&i" : : DBMS=DBF REPLACE; : : GETDELETED=NO; : : RUN; : : data TX2007JAN&i; : : set temp2007JAN&i; : : keep post_code RASTERVALU; : : if RASTERVALU>0 then TX2007JAN&i=RASTERVALU; : : run; : : data A.TX2007JAN&i; : : set TX2007JAN&i; : : TX2007JAN&i=RASTERVALU; : : drop RASTERVALU; : : run; : : %end; : : %mend; : : %import (28); : : ------------------------------------------------------- : : %macro merge ; : : PROC DATASETS library=A; RUN; : : %do i=1 %to 28; : : proc sort data=TX2007JAN&i; by post_code; : : PROC DATASETS; APPEND out =tm data=TX2007JAN&i force; : : RUN; : : %end; : : %mend merge ; : : %merge by post_code; : : ----------------------------------------------------------------------------- -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.228.188.108 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1421300469.A.096.html

01/16 15:43, , 1F
我的資料是每天氣象實驗的採樣資料,因為小妹對巨集不熟
01/16 15:43, 1F

01/16 15:45, , 2F
所以在讀取的時候可以辨別檔名是日期格式嗎?感謝以上說明
01/16 15:45, 2F

01/16 16:36, , 3F
那就要確定是每天數據都有了
01/16 16:36, 3F
文章代碼(AID): #1KjrBr2M (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1KjrBr2M (Statistics)