作者查詢 / Lepton

總覽項目：發文 | 留言 | 暱稱

作者 Lepton 在 PTT [ C_and_CPP ] 看板的留言(推文), 共29則

限定看板：C_and_CPP

看板排序：

全部NCCU_CHESS32C_and_CPP29NCCU99_LAND19NCU_Talk8bicycle6Gossiping3MATLAB3FORMULA12TY_Research2VideoCard1<< 收起看板(10)

首頁

尾頁

[問題] CUDA Windows Timeout (TDR)

[ C_and_CPP ]12 留言, 推噓總分: +1

作者: cory8249 - 發表於 2014/12/18 04:02(11年前)

1^F推Lepton: 原PO該不會是修114的OS吧！這格式好熟悉12/18 17:37

2^F→Lepton: 幫你解答這是windows的問題只要cuda kernel執行超過2秒12/18 17:39

3^F→Lepton: windows發現顯示卡沒有回應會重新reset顯示卡12/18 17:40

4^F→Lepton: 可以去nsight那邊把參數修掉，但是後遺症是你程式執行時12/18 17:44

5^F→Lepton: 整個畫面全部會凍結直到他跑完，感覺就像當機一樣12/18 17:45

6^F→Lepton: 所以跑程式的那1分鐘什麼事情都不能做，還是在工作站跑吧12/18 17:45

8^F→Lepton: 首先主機板要有內顯，BIOS設定內顯輸出螢幕12/19 00:22

9^F→Lepton: 然後顯示卡就是一張加速卡，只負責計算的工作12/19 00:22

10^F→Lepton: 顯示卡不設定影像輸出，windows就不會看顯示卡還活著嗎12/19 00:24

11^F→Lepton: 因為GPU本來就不是這樣用的，所以跑起來當然慢啊12/19 01:10

12^F→Lepton: 把shared memory拿掉，用CPU跑就知道差別了12/19 01:11

[問題] iterator的作用是什麼？

[ C_and_CPP ]15 留言, 推噓總分: +4

作者: Lepton - 發表於 2014/11/27 23:46(11年前)

8^F→Lepton: 嗯...我再想看看好了！謝謝！11/28 12:43

[問題] CUDA CPU和GPU執行同步問題

[ C_and_CPP ]18 留言, 推噓總分: +2

作者: LOXAERIC - 發表於 2014/05/23 18:45(12年前)

9^F→Lepton:<<<a,b>>>的呼叫法都是非同步的，不等做完就往下走05/24 12:36

10^F→Lepton:GPU有自己的queue就是stream的意思，不寫都是預設的05/24 12:37

11^F→Lepton:每個queue都會保證依序執行，所以kerenlBC是順序的做05/24 12:37

12^F→Lepton:memcpy會保證queue執行完後才作複製的動作且CPU也會stall05/24 12:38

13^F→Lepton:學CUDA建議直接看官方的說明書，CUDA的東西變化很快05/24 12:40

Re: [問題] 不定參數的函式可以放指標嗎?

[ C_and_CPP ]9 留言, 推噓總分: +2

作者: Feis - 發表於 2014/01/16 20:03(12年前)

1^F推Lepton:可以請教一下T **val = va_arg(argv, T**);這句嗎?01/16 21:05

2^F→Lepton:為什麼是放T**呢?至於沒用new是因為這不是純C++不支援01/16 21:07

3^F→Lepton:配置記憶體的API->cudaMalloc(void ** devPtr,size_t s)01/16 21:09

4^F→Lepton:cudaHostAlloc也是一樣只是要多放一個flag01/16 21:10

5^F→Lepton:C++11的看起來比較好懂，我會再試試看，謝謝！01/16 21:11

9^F推Lepton:是,但是我一直沒弄懂直接用而已...01/20 09:26

Re: [問題] 如何讓計算速度發揮到極限

[ C_and_CPP ]10 留言, 推噓總分: +5

作者: littleshan - 發表於 2013/08/15 00:42(13年前)

1^F推Lepton:我發現這跟寫GPU的概念蠻像的block、unroll我都懂08/15 00:48

2^F→Lepton:會要做CPU高效率是因為CPU閒著也是閒著我想讓他做點事情08/15 00:49

3^F→Lepton:只是我感覺到CPU做事情太慢了想讓他再做更多事情08/15 00:50

4^F推Lepton:看你的示範SSE似乎還滿簡單易懂的只是重編寫一次就好了08/15 00:53

7^F推Lepton:openCL我還沒學不過聽說CUDA的卡因為架構的差異跑CL不快08/15 00:57

8^F→Lepton:openCL之後我會去學。也感謝你的回覆讓我學習08/15 00:58

首頁

尾頁