Re: [開箱] 打造高階工作站(4)-Xeon E5-2650 x2

看板PC_Shopping作者時間12年前 (2013/08/12 01:48), 編輯推噓17(17023)
留言40則, 18人參與, 最新討論串2/2 (看更多)
我也是做理論計算的Group 主要都是跑DFT 如果有接觸的人 應該都知道他的計算量非常龐大 底下開了個話題 那我也一起加入討論好了XD 順便供後人參考 最近老闆也是買了5台這樣的機器 我是負責將這些電腦叢集串起來 我的規格跟h大幾乎相同 機器規格: CPU Intel Xeon Processor E5-2650 * 2 MB SuperMicro X9DRi-LN4F+ * 1 RAM SuperMicro 16GB DDR3-1600 2Rx4 ECC REG * 8 HD WD 500G 64MB RE4 5003ABYX * 1 HD WD 2TBMB RE4 2003FYYS * 1 CHASSIS SuperMicro 825TQ-563LPB *1 OS用 SuSE Linux Enterprise Server 11 SP2 使用OpenMPI-1.6.5 MPI Library 使用Intel Fortran Composer XE 2013 for Linux (2013.5.192) 有使用Composer XE 2013內的 Intel Math Kernel Library 主要是BLAS LAPACK FFT 我有關掉HT 因為對於計算來說HT沒任何幫助 反而還會變慢 預留記憶體插槽之後要擴充用 之前job太大 使用的記憶體超過御風者fat node的上限(256GB) 就死掉了 用2個node才解決此問題... NFS的主要規格: Adaptec 6805 8-port PCIe SAS 2.0 RAID Kit Seagate ST3300657SS SAS 15000RPM, 300GB (HD & Kit) * 8 做RAID0 為何不用SSD? 因為當file system多人讀寫 SSD的緩衝一定不夠撐 SCSI硬碟支援多人讀寫 因此多人多工的環境加上SSD壽命問題 完全不用考慮SSD 主要的軟體是VASP5.2和Gaussian09 這些軟體都是用Fortran寫的 Makefile 編譯參數 OFLAG 御風者用-O2 -ip 效能最好 Xeon用 -O3 -ip -axAVX 效能最好 AMD機器 用他們的編譯器 效能沒比較好 連GotoBLAS效能也比MKL差 結果AMD機器用intel的編譯器和MKL效能最好... 我們也是御風者的用戶 御風者的是使用AMD的CPU 浮點運算效能頗弱(以DFT計算來說) 御風者是強在使用InfiniBand的網路架構 所以還是要看程式怎麼寫 程式寫得不好 平行效率就非常差 這裡的平行主要是MPI架構 不討論SMP架構 所以Code還是很重要 因此影響到體系 以VASP來說 單純算結構Opt的話 御風者單機24core效率最佳 或是一台12core 走InfiniBand跨2個node 效率也不錯 如果使用超過12core 只會變慢 不會變快 用越多core 會越慢 如果VASP是做找過渡狀態 使用NEB方法 平行效率非常好 core越多 計算越快 御風者96core(2個node)是極限了 效率這裡最好 Xoen的話5個node(共80core)效率最好 我們也只有五台這樣的機器 所以沒辦法測下去 所以還是看你的體系決定用什麼電腦 以結構Opt來說 同一個job(學長從以前測到現在 所以就以他的標準) Xeon E5-2650 *2 共16core 只需要8分鐘 御風者 24core 需要32分鐘 以上是單機跑 跨node 我以NEB計算為基準的job Xeon E5-2650 *2 用5個node 80core 只要7小時 御風者 用2個node 共96core 將近7小時(不到7小時) 可能原因是1Gbps和InfiniBand的速度比起來根本是天壤之別... 所以這個比較 沒啥意義... 新的CPU強是強在新的AVX指令集 Xeon的Cache也比較大 跟廠商借了ivy的i7的頂級款 用AVX2 還是一樣被sandy的Xeon E5 打假的.... 所以時脈似乎不是重點 也難怪Xeon的CPU特別貴(廢話XD) 所以還是看你要算什麼體系而定... Gaussian09的話 是使用OpenMP架構 所以單機跑效能比較好 Linda那個跨node的library效能超差的 所以就不裝了 不過i7就夠用了 如果用新的CPU 程式沒有重新編譯過 效能是一定跑不出來的 還有我不是資訊相關科系的人 如果我專業術語有錯誤 煩請糾正... 附上機房機器的兩張圖:http://ppt.cc/R9YV http://ppt.cc/pAYW 獻醜了... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.136.177.243

08/12 01:51, , 1F
快推 雖然我真的看不懂
08/12 01:51, 1F

08/12 02:12, , 2F
專業!!
08/12 02:12, 2F

08/12 02:18, , 3F
同理論計算淚推
08/12 02:18, 3F

08/12 07:03, , 4F
想到這個... 因為自己工作上遭遇挫折, 所以只能...
08/12 07:03, 4F

08/12 07:04, , 5F
眼睜睜看別人已經在玩多機器了,多機一定要碰上 MPI.
08/12 07:04, 5F

08/12 07:17, , 6F
至於 openmp 只能單機使用... (默)
08/12 07:17, 6F

08/12 07:50, , 7F
以前弄伺服器曾經很想買個機櫃回家用,現在回頭想想
08/12 07:50, 7F

08/12 07:50, , 8F
我這種想法真是太智障了
08/12 07:50, 8F

08/12 10:06, , 9F
推~
08/12 10:06, 9F

08/12 10:23, , 10F
化學 或生化嗎? 御風者不是在新竹的國家高速網路與
08/12 10:23, 10F

08/12 10:24, , 11F
計算中心 所以原po是交大的囉XD?
08/12 10:24, 11F

08/12 10:26, , 12F
BTW 你們有試過更換I/O嗎,同樣的預算下跑SSD raid0
08/12 10:26, 12F

08/12 10:27, , 13F
或丟ramdisk 時間/JOB的提升效果很明顯喔!
08/12 10:27, 13F

08/12 10:28, , 14F
另外請問 御風者7小時 是算什麼樣的JOB呢@@?
08/12 10:28, 14F

08/12 10:31, , 15F
SSD不適合多人多工 buffer不夠大
08/12 10:31, 15F

08/12 10:31, , 16F
同時間 有人讀 有人寫 I/O一下就塞爆了
08/12 10:31, 16F

08/12 10:33, , 17F
七小時就用NEB Method 找TS的JOB
08/12 10:33, 17F

08/12 10:34, , 18F
Soga 了解:D
08/12 10:34, 18F

08/12 10:34, , 19F
御風者在新竹科學園區沒錯 但遠端過去就可以送JOB了
08/12 10:34, 19F

08/12 10:34, , 20F
我們實驗室人少 一個人大約可以分到一台工作站一 一
08/12 10:34, 20F

08/12 10:35, , 21F
不過工作站大概就原po那台的一半而已orz...虛弱
08/12 10:35, 21F

08/12 10:35, , 22F
只能說實驗室有那麼多預算真好.. 我們lab買不起..
08/12 10:35, 22F

08/12 10:36, , 23F
By the way, 在這種應用下DFS會不會比NFS適合呢?
08/12 10:36, 23F

08/12 10:36, , 24F
可是軟體安裝這些我都是自己來 很累...
08/12 10:36, 24F

08/12 10:36, , 25F
請廠商弄還需要多個50萬吧
08/12 10:36, 25F

08/12 10:38, , 26F
DFS有考慮要架了 目前正在看相關的文章 :-)
08/12 10:38, 26F

08/12 10:39, , 27F
不過DFT比起CSD, CCSD來說, 計算量算是很小了.. XD
08/12 10:39, 27F

08/12 10:41, , 28F
應該不會哦 一個晶胞 500多個原子 一次就要一個禮拜
08/12 10:41, 28F

08/12 10:41, , 29F
丟fat node的long queue還算不完= =
08/12 10:41, 29F

08/12 10:42, , 30F
因為御風者有設wall time 所以時間到就把你砍掉
08/12 10:42, 30F

08/12 13:14, , 31F
完全看不懂 先推 QQ
08/12 13:14, 31F

08/12 15:28, , 32F
有神快拜 ....
08/12 15:28, 32F

08/12 18:06, , 33F
快推
08/12 18:06, 33F

08/12 21:51, , 34F
咦 我想問的是~現在SCSI不都已經轉為SAS了?
08/12 21:51, 34F

08/12 22:16, , 35F
是 所以用的是SAS 只是我拿SCSI來舉例
08/12 22:16, 35F

08/12 22:45, , 36F
樓主有講SAS 先呀,只是說真的還是習慣稱之為SCSI
08/12 22:45, 36F

08/12 22:46, , 37F
而且 SAS 的第二個 S ,也還是 SCSI 沒有錯.... ^_^
08/12 22:46, 37F

08/12 23:26, , 38F
Serial Attached SCSI!
08/12 23:26, 38F

08/13 14:07, , 39F
Cool!
08/13 14:07, 39F
※ 編輯: s6414073 來自: 220.136.188.122 (08/21 00:10)

09/10 17:22, , 40F
感覺超屌的 我推
09/10 17:22, 40F
文章代碼(AID): #1I1yvbmo (PC_Shopping)
文章代碼(AID): #1I1yvbmo (PC_Shopping)