討論串[問題] SAS跑大量資料所需的時間
共 9 篇文章
內容預覽:
抱歉 前篇快睡著了沒說清楚. 我前面兩篇有說到一個技巧. 搜尋數字會比搜尋文字快. 如果acc_no真的是數字 那這技巧又沒用. 但一般而言 帳號資料會是文字格式. 所以我的建議是先做個數字編碼的對照表. 例如:. acc_no key. "A122342231" 1. "B211324121" 2
(還有422個字)
內容預覽:
43. 小弟我也是在處理超大量資料. 之前都是抓出一些樣本來試作. 程序結果ok 耗費時間也短~. 可是...就在我要一次全部原始資料下去run時. 我才驚覺事情大條了@@. 這也是現在十分困擾我的地方. 原始資料: 6年交易紀錄76,113,236筆 (不用懷疑!). 光是用一個PROC SQL篩
(還有579個字)
內容預覽:
試著監控你放work這個lib的實體目錄 看看檔案的增長狀況. 之前的經驗是程式寫錯 造成資料無限制膨脹然後爆掉. 或是 work的lib設到C碟去了 C碟哪夠這樣操. IO本來就很慢的. 我做個兩百M的extraction都夠我抽根菸了. 在幾萬筆的小資料量下. 沒有經過sort的SQL指令的確會
(還有350個字)