Re: [問題] SAS跑大量資料所需的時間

看板Statistics作者 (應天風)時間17年前 (2009/03/17 16:00), 編輯推噓1(105)
留言6則, 2人參與, 最新討論串4/9 (看更多)
我今天有請人測了一下 data5G 筆數80萬筆 sas code 大概長這樣吧 ---------- proc sort data=abc by var_a run; 1.在C:下 real time:5:30 cpu time:0:30 2.裝在ramdisk下 (ramdisk有9G) 不管怎麼試都會出現 out of resource? 然後只能中止程式 想請問這裡是什麼問題? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.86.144

03/17 16:10, , 1F
我猜因該是SAS在讀取時快取檔案非常大 ramdisk的限制
03/17 16:10, 1F

03/17 16:11, , 2F
在控制台那邊監控看看 不知道是不是 我有接觸過健保資料
03/17 16:11, 2F

03/17 16:11, , 3F
上百萬筆連讀進去都等快20分鐘了 早期更不用說
03/17 16:11, 3F

03/17 16:13, , 4F
你的語法那邊 by 後面是不是沒加分號;
03/17 16:13, 4F

03/17 19:52, , 5F
還有一個方法可以參考,盡量不要排序,排序很花時間,盡量
03/17 19:52, 5F

03/17 19:53, , 6F
用proc sql的方式來處理資料,可以不用排序,速度上快很多
03/17 19:53, 6F
文章代碼(AID): #19lrYql3 (Statistics)
討論串 (同標題文章)
文章代碼(AID): #19lrYql3 (Statistics)