作者查詢 / Lepton
作者 Lepton 在 PTT [ C_and_CPP ] 看板的留言(推文), 共29則
限定看板:C_and_CPP
看板排序:
首頁
上一頁
1
下一頁
尾頁
1F推: 原PO該不會是修114的OS吧!這格式好熟悉12/18 17:37
2F→: 幫你解答這是windows的問題只要cuda kernel執行超過2秒12/18 17:39
3F→: windows發現顯示卡沒有回應會重新reset顯示卡12/18 17:40
4F→: 可以去nsight那邊把參數修掉,但是後遺症是你程式執行時12/18 17:44
5F→: 整個畫面全部會凍結直到他跑完,感覺就像當機一樣12/18 17:45
6F→: 所以跑程式的那1分鐘什麼事情都不能做,還是在工作站跑吧12/18 17:45
8F→: 首先主機板要有內顯,BIOS設定內顯輸出螢幕12/19 00:22
9F→: 然後顯示卡就是一張加速卡,只負責計算的工作12/19 00:22
10F→: 顯示卡不設定影像輸出,windows就不會看顯示卡還活著嗎12/19 00:24
11F→: 因為GPU本來就不是這樣用的,所以跑起來當然慢啊12/19 01:10
12F→: 把shared memory拿掉,用CPU跑就知道差別了12/19 01:11
8F→: 嗯...我再想看看好了!謝謝!11/28 12:43
9F→:<<<a,b>>>的呼叫法都是非同步的,不等做完就往下走05/24 12:36
10F→:GPU有自己的queue就是stream的意思,不寫都是預設的05/24 12:37
11F→:每個queue都會保證依序執行,所以kerenlBC是順序的做05/24 12:37
12F→:memcpy會保證queue執行完後才作複製的動作且CPU也會stall05/24 12:38
13F→:學CUDA建議直接看官方的說明書,CUDA的東西變化很快05/24 12:40
1F推:可以請教一下T **val = va_arg(argv, T**);這句嗎?01/16 21:05
2F→:為什麼是放T**呢?至於沒用new是因為這不是純C++不支援01/16 21:07
3F→:配置記憶體的API->cudaMalloc(void ** devPtr,size_t s)01/16 21:09
4F→:cudaHostAlloc也是一樣只是要多放一個flag01/16 21:10
5F→:C++11的看起來比較好懂,我會再試試看,謝謝!01/16 21:11
9F推:是,但是我一直沒弄懂直接用而已...01/20 09:26
1F推:我發現這跟寫GPU的概念蠻像的block、unroll我都懂08/15 00:48
2F→:會要做CPU高效率是因為CPU閒著也是閒著我想讓他做點事情08/15 00:49
3F→:只是我感覺到CPU做事情太慢了想讓他再做更多事情08/15 00:50
4F推:看你的示範SSE似乎還滿簡單易懂的只是重編寫一次就好了08/15 00:53
7F推:openCL我還沒學不過聽說CUDA的卡因為架構的差異跑CL不快08/15 00:57
8F→:openCL之後我會去學。也感謝你的回覆讓我學習08/15 00:58
首頁
上一頁
1
下一頁
尾頁