[情報] NVIDIA發佈CUDA 3.2正式版
在9月份推出CUDA Toolkit 3.2 RC發佈候選版進行測試後,NVIDIA今天發佈了最終正式版
本的CUDA 3.2工具包。新版本在性能上有了明顯的提升,同時擴展了函數庫,改進了集群
管理特性,當然還包括對新硬件的支持。
CUDA Toolkit 3.2新特性包括:
擴充和改進CUDA函數庫:
1. CUBLAS在Fermi架構下的矩陣乘法和置換性能提升50%到300%
2. CUFFT在Fermi架構下基數3、5、7的轉換性能相比MKL加速2到10倍。
3. 新增CUSPARSE GPU加速稀疏矩陣函數庫,性能比MKL快5到30倍。
4. 新增CURAND GPU加速隨機數生成函數庫,比MKL快10到20倍。
5. 加入H.264編解碼庫。
CUDA驅動和CUDA C改進:
- 支持6GB顯存Quadro或Tesla卡。
- 在Windows平台工作站上支持Tesla開啟Tesla Compute Cluster (TCC) 集群模式。
開發工具改進:
- CUDA-gdb和Parallel Nsight支持多GPU Debug。
- cuda-memcheck支持擴展至所有Fermi架構GPU。
- NVCC支持64bit Linux下的Intel C Compiler (ICC) v11.1
- 支持在4GB以上內存系統上進行GPU Debug。
其他:
- 支持在CUDA C核心使用malloc()/free()進行內存管理。
- NVIDIA System Management Interface (nvidia-smi)支持匯報GPU使用率以及多個GPU
性能計數器。
新增多個CUDA GPU運算SDK程序樣例。
CUDA Toolkit 3.2正式版下載:
http://developer.nvidia.com/object/cuda_3_2_downloads.html
http://news.mydrivers.com/1/179/179801.htm
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.121.197.68
→
11/18 10:08, , 1F
11/18 10:08, 1F
推
11/18 10:15, , 2F
11/18 10:15, 2F
→
11/18 13:24, , 3F
11/18 13:24, 3F
推
11/24 22:44, , 4F
11/24 22:44, 4F
推
11/26 17:23, , 5F
11/26 17:23, 5F
→
12/15 21:23, , 6F
12/15 21:23, 6F
→
12/15 21:24, , 7F
12/15 21:24, 7F