作者查詢 / freef1y3

總覽項目: 發文 | 留言 | 暱稱
作者 freef1y3 在 PTT [ C_and_CPP ] 看板的留言(推文), 共77則
限定看板:C_and_CPP
首頁
上一頁
1
2
3
下一頁
尾頁
[問題] cpp 考題請教
[ C_and_CPP ]17 留言, 推噓總分: +4
作者: m8403051 - 發表於 2020/04/20 09:37(5年前)
15Ffreef1y3: a*=和a--之間並没有sequence point隔開,所以計算順序没04/22 12:45
16Ffreef1y3: 有規定04/22 12:45
17Ffreef1y3: 發現下面有人回了XDD04/23 00:14
[討論] 未來C++地位會像高級組語碼?
[ C_and_CPP ]52 留言, 推噓總分: +11
作者: Sidney0503 - 發表於 2018/07/04 09:31(7年前)
36Ffreef1y3: 先手動優化轉出來的C++, 再手動優化C++轉出來的ASM07/05 23:09
37Ffreef1y3: 手動優化也要分pass的概念07/05 23:10
Re: [問題] 2D array的address
[ C_and_CPP ]24 留言, 推噓總分: +4
作者: descent - 發表於 2018/04/24 17:06(7年前)
22Ffreef1y3: B應該是int [2][3]沒錯, 不過有一些吊詭的點04/26 15:44
23Ffreef1y3: 1. 你不能寫 int C[2][3]; C = B;04/26 15:44
24Ffreef1y3: 2. void f(int B[2][3]) {...} 那在f裡B會變成int(*)[3]04/26 15:45
[問題] CUDA現在可以用A[i][j]來存取了嗎
[ C_and_CPP ]16 留言, 推噓總分: +3
作者: snow3804 - 發表於 2018/01/07 12:15(8年前)
11Ffreef1y3: 用 int (*ptr)[N] 來接 int a[M][N] 就不用 malloc 兩層01/11 23:37
12Ffreef1y3: 不過 CUDA 上 N 只能是常數的樣子01/11 23:46
[問題] cuda 顯示器驅動程式停止回應
[ C_and_CPP ]6 留言, 推噓總分: +1
作者: kanonehilber - 發表於 2017/10/11 12:21(8年前)
3Ffreef1y3: 把timeout設大一點看看 https://goo.gl/xzmS9H10/11 15:31
4Ffreef1y3: 其實我覺得connection timeout應該是不同的東西10/11 20:09
5Ffreef1y3: 從那區也有port來看 應該不是display driver的timeout10/11 20:11
6Ffreef1y3: 不過我沒用過新版 你可能要自己找一下它移到哪裡了10/11 20:14
[閒聊] 關於C++的雷
[ C_and_CPP ]29 留言, 推噓總分: +22
作者: PkmX - 發表於 2017/09/25 22:14(8年前)
1Ffreef1y3: 推推09/25 23:19
Re: [閒聊] C++ Stateful Metaprogramming
[ C_and_CPP ]37 留言, 推噓總分: +7
作者: damody - 發表於 2017/09/23 16:21(8年前)
32Ffreef1y3: 才不告訴你雷~09/25 12:22
Re: [問題] 程式比賽要能看懂題 英文要多好?
[ C_and_CPP ]18 留言, 推噓總分: +5
作者: ga544523 - 發表於 2017/05/15 00:25(8年前)
18Ffreef1y3: 那題目不會是故意在模仿原始人講話吧05/18 16:44
[問題] Dev-C++是否能夠寫CUDA
[ C_and_CPP ]21 留言, 推噓總分: +7
作者: dddddd67 - 發表於 2016/12/09 12:18(9年前)
12Ffreef1y3: 要把編譯器改成nvcc吧 (如果可以改的話)12/09 13:44
[問題] CUDA調整block大小 使用GPGPU-Sim
[ C_and_CPP ]14 留言, 推噓總分: 0
作者: v00623 - 發表於 2016/09/19 20:22(9年前)
3Ffreef1y3: 如果要確認是 benchmark 還是 gpgpu-sim 的問題09/20 10:44
4Ffreef1y3: 我會建議用真正的 GPU 跑一次看看09/20 10:44
5Ffreef1y3: block 和 thread 數量這有時候是跟 benchmark 有關的09/20 10:45
6Ffreef1y3: 甚至有的 CUDA 程式必須 block 大小是 2 的次方才能跑09/20 10:46
7Ffreef1y3: 多個小 block 比少數大 block 好09/20 14:16
8Ffreef1y3: 我會猜是因為 __syncthreads() 造成的 overhead09/20 14:17
9Ffreef1y3: 若是 occupancy 的關係,應該多個小 block 會比較差09/20 14:18
10Ffreef1y3: 但是看這 IPC 的差異,執行時間似乎不該差這麼多09/20 14:19
11Ffreef1y3: 除非執行的 Instruction 總數也會隨著 block size 改變09/20 14:20
12Ffreef1y3: 若你的學校有授權 visual studio,且你有實體顯示卡09/20 14:23
13Ffreef1y3: 可用 nvidia visual profiler 測測看09/20 14:23
14Ffreef1y3: 我沒用過 gpgpu-sim,所以這方面的問題就無法回答了09/20 14:25
首頁
上一頁
1
2
3
下一頁
尾頁