作者查詢 / hardman1110

總覽項目: 發文 | 留言 | 暱稱
作者 hardman1110 在 PTT 全部看板的留言(推文), 共355則
限定看板:全部
[問題] vscode c++ debug doesn’t work
[ C_and_CPP ]17 留言, 推噓總分: +4
作者: hardman1110 - 發表於 2022/12/20 16:37(3年前)
2Fhardman1110: 是指launch.json下要多加 “miDebuggerPath”: path12/20 22:28
3Fhardman1110: to gab?12/20 22:28
4Fhardman1110: to gdb12/20 22:28
10Fhardman1110: Test.cpp 編出的 test 可跑 也可 cmd line 下 gdb .12/20 23:25
11Fhardman1110: /test跑完 另外我確實是用vscode remote連到Linux12/20 23:25
12Fhardman1110: 上的docker12/20 23:25
14Fhardman1110: 我是在a電腦開vscode連到b電腦 且直接連進b電腦上的12/21 00:38
15Fhardman1110: docker(vscode 的plugin)12/21 00:38
16Fhardman1110: SSH ip 是b電腦的12/21 00:43
[問題] 用makefile編譯包含CUDA的動態連結(.so)
[ C_and_CPP ]10 留言, 推噓總分: +2
作者: hardman1110 - 發表於 2018/02/01 21:46(8年前)
2Fhardman1110: 請問大大是要加在哪部份?02/01 22:27
3Fhardman1110: nvcc 不支援-fPIC02/01 22:28
4Fhardman1110: 如果是加在 .pdda_cuda.o前則是出現一樣錯誤02/01 22:36
7Fhardman1110: L大~ 所以我得用nvcc 把.cu編成.so再用g++將其跟.cpp02/01 23:17
8Fhardman1110: 編成最後的pdda.so?02/01 23:17
10Fhardman1110: 謝謝L大 在nvcc加入-Xcompiler '-fPIC' -dc即可~~~02/02 10:56
[問題] C/C++ 輸出動態連結給python呼叫
[ C_and_CPP ]13 留言, 推噓總分: +6
作者: hardman1110 - 發表於 2018/01/18 14:43(8年前)
2Fhardman1110: u save my day~用extern "C"{}把內容包起來就好了~~01/18 15:16
[問題] 如何呼叫c++函式並傳入、回傳numpy array
[ Python ]11 留言, 推噓總分: 0
作者: hardman1110 - 發表於 2018/01/16 15:41(8年前)
10Fhardman1110: 感謝各位解惑 我會嘗試看看cffi 希望直接吃numpy最好01/17 17:25
[問題] CUDA shared-memory
[ C_and_CPP ]30 留言, 推噓總分: +1
作者: hardman1110 - 發表於 2017/10/03 10:12(8年前)
2Fhardman1110: 原因是什? 前面的同步不算嗎? 困惑中= =10/03 10:40
4Fhardman1110: Do something 之後就不會更改值了10/03 11:27
5Fhardman1110: 所以我才在一開始同步10/03 11:28
6Fhardman1110: 就算繞回去應該再同步一次不是嗎?10/03 11:32
9Fhardman1110: 所以我只要在使用前一刻同步就好囉?10/03 12:37
10Fhardman1110: 還有在assign值前同步10/03 13:00
11Fhardman1110: 已嘗試在assign前後都同步,但結果還是會錯(暈10/03 13:26
20Fhardman1110: a1大 已補上github好讀版連結10/03 14:24
21Fhardman1110: 我這邊純粹想讓多個thread 同時assign值 甭跑回圈10/03 14:25
24Fhardman1110: 我想通了~抱歉 確實把y當執行緒切 每個thread y不同10/03 14:28
25Fhardman1110: 純共用的話 感覺用register 就好 陣列大小不大10/03 14:30
29Fhardman1110: 要在加速的話 好像還可以用surface memory來讀寫?10/03 14:55
30Fhardman1110: 感謝各位大大指點10/03 14:56
[問題] cuda 環境設定與使用問題
[ C_and_CPP ]3 留言, 推噓總分: 0
作者: hardman1110 - 發表於 2017/09/21 17:06(8年前)
3Fhardman1110: 我確實用的是CUDA909/22 10:42
[問題] OpenCL Out of resources
[ C_and_CPP ]2 留言, 推噓總分: 0
作者: hardman1110 - 發表於 2017/09/14 15:28(8年前)
1Fhardman1110: 抱歉自己耍蠢 主要是memory超過 global mem size09/14 17:49
2Fhardman1110: 但說也奇怪 我create時沒有回傳錯誤09/14 17:49
[問題] opencl似乎沒有平行處裡
[ C_and_CPP ]14 留言, 推噓總分: +1
作者: hardman1110 - 發表於 2017/09/05 16:43(8年前)
2Fhardman1110: 每列有相依 所以只好這樣09/05 20:10
3Fhardman1110: 預期是GPU再慢 也會因爲1080列同09/05 20:10
4Fhardman1110: 時算而大幅優化09/05 20:11
6Fhardman1110: 已試過多執行緒等方式 想用GPU突破09/06 07:08
Re: [問題] openCL kernal中如何知道index屬於誰?
[ C_and_CPP ]6 留言, 推噓總分: +3
作者: LPH66 - 發表於 2017/08/22 17:41(8年前)
1Fhardman1110: 感謝 所以opencl只是幫你切出平行化的"kernal"08/22 21:44
2Fhardman1110: 裡面根本沒綁定array index 只是因為平行特性可以拿08/22 21:45
3Fhardman1110: work item的編號當作array index >> 是這樣嗎?08/22 21:46
[問題] openCL kernal中如何知道index屬於誰?
[ C_and_CPP ]26 留言, 推噓總分: +2
作者: hardman1110 - 發表於 2017/08/22 16:32(8年前)
9Fhardman1110: 我傳進去的陣列型態大小都不一樣,我該如何知道切了08/22 17:11
10Fhardman1110: 多少kernal(work item) 然後每個work item包含每個08/22 17:12
11Fhardman1110: 陣列的哪幾格?08/22 17:13
14Fhardman1110: 查到clEnqueueNDRangeKernel可控制要切多少workitem08/22 17:26
16Fhardman1110: 但每個workitem對應到陣列哪一段就不清楚原理了08/22 17:26
25Fhardman1110: 這樣說起來我要index以哪個陣列為主就enqueue那個陣08/22 17:45
26Fhardman1110: 列的size嚕?08/22 17:45