作者 hardman1110 在 PTT 全部看板的留言(推文), 共355則

[問題] vscode c++ debug doesn’t work

[ C_and_CPP ]18 留言, 推噓總分: +4

作者: hardman1110 - 發表於 2022/12/20 16:37(3年前)

2^F→hardman1110: 是指launch.json下要多加 “miDebuggerPath”: path12/20 22:28

3^F→hardman1110: to gab?12/20 22:28

4^F→hardman1110: to gdb12/20 22:28

10^F→hardman1110: Test.cpp 編出的 test 可跑也可 cmd line 下 gdb .12/20 23:25

11^F→hardman1110: /test跑完另外我確實是用vscode remote連到Linux12/20 23:25

12^F→hardman1110: 上的docker12/20 23:25

14^F→hardman1110: 我是在a電腦開vscode連到b電腦且直接連進b電腦上的12/21 00:38

15^F→hardman1110: docker(vscode 的plugin)12/21 00:38

16^F→hardman1110: SSH ip 是b電腦的12/21 00:43

[問題] 用makefile編譯包含CUDA的動態連結(.so)

[ C_and_CPP ]10 留言, 推噓總分: +2

作者: hardman1110 - 發表於 2018/02/01 21:46(8年前)

2^F→hardman1110: 請問大大是要加在哪部份？02/01 22:27

3^F→hardman1110: nvcc 不支援-fPIC02/01 22:28

4^F→hardman1110: 如果是加在 .pdda_cuda.o前則是出現一樣錯誤02/01 22:36

7^F→hardman1110: L大~ 所以我得用nvcc 把.cu編成.so再用g++將其跟.cpp02/01 23:17

8^F→hardman1110: 編成最後的pdda.so?02/01 23:17

10^F→hardman1110: 謝謝L大在nvcc加入-Xcompiler '-fPIC' -dc即可~~~02/02 10:56

[問題] C/C++ 輸出動態連結給python呼叫

[ C_and_CPP ]13 留言, 推噓總分: +6

作者: hardman1110 - 發表於 2018/01/18 14:43(8年前)

2^F→hardman1110: u save my day~用extern "C"{}把內容包起來就好了~~01/18 15:16

[問題] 如何呼叫c++函式並傳入、回傳numpy array

[ Python ]11 留言, 推噓總分: 0

作者: hardman1110 - 發表於 2018/01/16 15:41(8年前)

10^F→hardman1110: 感謝各位解惑我會嘗試看看cffi 希望直接吃numpy最好01/17 17:25

[問題] CUDA shared-memory

[ C_and_CPP ]30 留言, 推噓總分: +1

作者: hardman1110 - 發表於 2017/10/03 10:12(8年前)

2^F→hardman1110: 原因是什? 前面的同步不算嗎? 困惑中= =10/03 10:40

4^F→hardman1110: Do something 之後就不會更改值了10/03 11:27

5^F→hardman1110: 所以我才在一開始同步10/03 11:28

6^F→hardman1110: 就算繞回去應該再同步一次不是嗎？10/03 11:32

9^F→hardman1110: 所以我只要在使用前一刻同步就好囉？10/03 12:37

10^F→hardman1110: 還有在assign值前同步10/03 13:00

11^F→hardman1110: 已嘗試在assign前後都同步，但結果還是會錯(暈10/03 13:26

20^F→hardman1110: a1大已補上github好讀版連結10/03 14:24

21^F→hardman1110: 我這邊純粹想讓多個thread 同時assign值甭跑回圈10/03 14:25

24^F→hardman1110: 我想通了~抱歉確實把y當執行緒切每個thread y不同10/03 14:28

25^F→hardman1110: 純共用的話感覺用register 就好陣列大小不大10/03 14:30

29^F→hardman1110: 要在加速的話好像還可以用surface memory來讀寫?10/03 14:55

30^F→hardman1110: 感謝各位大大指點10/03 14:56

[問題] cuda 環境設定與使用問題

[ C_and_CPP ]3 留言, 推噓總分: 0

作者: hardman1110 - 發表於 2017/09/21 17:06(8年前)

3^F→hardman1110: 我確實用的是CUDA909/22 10:42

[問題] OpenCL Out of resources

[ C_and_CPP ]2 留言, 推噓總分: 0

作者: hardman1110 - 發表於 2017/09/14 15:28(9年前)

1^F→hardman1110: 抱歉自己耍蠢主要是memory超過 global mem size09/14 17:49

2^F→hardman1110: 但說也奇怪我create時沒有回傳錯誤09/14 17:49

[問題] opencl似乎沒有平行處裡

[ C_and_CPP ]14 留言, 推噓總分: +1

作者: hardman1110 - 發表於 2017/09/05 16:43(9年前)

2^F→hardman1110: 每列有相依所以只好這樣09/05 20:10

3^F→hardman1110: 預期是GPU再慢也會因爲1080列同09/05 20:10

4^F→hardman1110: 時算而大幅優化09/05 20:11

6^F→hardman1110: 已試過多執行緒等方式想用GPU突破09/06 07:08

Re: [問題] openCL kernal中如何知道index屬於誰?

[ C_and_CPP ]6 留言, 推噓總分: +3

作者: LPH66 - 發表於 2017/08/22 17:41(9年前)

1^F推hardman1110: 感謝所以opencl只是幫你切出平行化的"kernal"08/22 21:44

2^F→hardman1110: 裡面根本沒綁定array index 只是因為平行特性可以拿08/22 21:45

3^F→hardman1110: work item的編號當作array index >> 是這樣嗎?08/22 21:46

[問題] openCL kernal中如何知道index屬於誰?

[ C_and_CPP ]26 留言, 推噓總分: +2

作者: hardman1110 - 發表於 2017/08/22 16:32(9年前)

9^F→hardman1110: 我傳進去的陣列型態大小都不一樣，我該如何知道切了08/22 17:11

10^F→hardman1110: 多少kernal(work item) 然後每個work item包含每個08/22 17:12

11^F→hardman1110: 陣列的哪幾格?08/22 17:13

14^F→hardman1110: 查到clEnqueueNDRangeKernel可控制要切多少workitem08/22 17:26

16^F→hardman1110: 但每個workitem對應到陣列哪一段就不清楚原理了08/22 17:26

25^F→hardman1110: 這樣說起來我要index以哪個陣列為主就enqueue那個陣08/22 17:45

26^F→hardman1110: 列的size嚕?08/22 17:45

作者查詢 / hardman1110