作者查詢 / WeBurn
作者 WeBurn 在 PTT [ C_and_CPP ] 看板的留言(推文), 共37則
限定看板:C_and_CPP
首頁
上一頁
1
下一頁
尾頁
1F→:狠一點可以用_alloca(VC) 不過這就是提外話了04/20 16:06
3F→:已優正樓上04/20 16:41
9F→:pTotal 是一條空間 用來裝double ,現在配這塊空間04/21 16:38
18F→:CUDA不能算是一種語言 因為他要與其他語言綁定04/20 14:39
19F→:概念上,CUDA是XX語言的延申04/20 14:40
20F→:XX可以為C/C++,fortran,JAVA...etc04/20 14:40
1F→: _MSC_VER 是 辨別編譯器 , 作業系統是_WIN3204/11 20:23
2F→:編譯器: __GNC__ __linux__04/11 20:26
3F→:http://blog.csdn.net/guoshanhe/article/details/188862704/11 20:26
4F→:還有 __GNUC__ 也可能在windows下 好比minGW04/11 20:27
7F→:一開始就是開到4級,還是沒有景告03/25 14:14
8F→:我是用VC8 (VS2005)03/25 14:15
24F→:你需要的是Fortran或MATLAB,用C/C++自找苦吃爾03/23 14:36
6F→:不要看了 去晶圓廠顧機台吧 不然你來當代碼工03/20 19:14
7F→:這樣不就變成你能坐 然後別人要站?03/20 19:15
8F→:編程這行有個極大的好處,就是工作保證能坐03/20 19:16
9F→:或是說你要跪要蹲要彎腰去寫代碼也沒人管你03/20 19:16
10F→:但很多工作是一定非站不可,好比顧機台03/20 19:17
9F→:已補上03/19 04:12
10F→:若要再狠一點,用匯編的LOOP指令03/19 04:25
11F→:編譯器出來,都是用CMP + JZ, 用LOOP可以少個指令03/19 04:26
12F→:該說每圈少個指令03/19 04:26
20F→:輸入輸出的內存指針在能控制的情況下 當然要用對齊指令03/19 11:30
21F→:若處理沒對齊的指針 還用了對齊的指令 一定當機03/19 11:30
22F→:cmp + JZ會有分支 這樣會浪廢一些亂序運行引擎03/19 11:33
23F→:LOOP就一直幹下去 沒分支 對CPU來說(core以後的)03/19 11:33
24F→:算有差那一些03/19 11:34
33F→:樓上 不要亂下斷言 VC是要在汎用下盡可能優化03/22 03:14
34F→:但SSE2是 pentium3 所沒有的指令03/22 03:15
35F→:測過就知道我所言是否為真 編譯器是程式 不是人03/22 03:16
36F→:還是有極多眉角可以手工優化的03/22 03:16
37F→:tropical72: 沒對齊用_mm_loadu_si128 指令03/22 03:33
38F→:對齊用_mm_load_si128 效能更好03/22 03:33
49F→:MOVSD只有一次複製4byte......03/23 04:04
50F→:我這是一次復製16byte.....03/23 04:05
9F→:jackace: 不要亂用AVX的ymm寄存器啊,在老一點(2010以前)03/19 04:29
10F→:該說第二代i3 i5 i7以上的才能用啊 不然會當機03/19 04:30
首頁
上一頁
1
下一頁
尾頁