作者查詢 / mikemike1021
作者 mikemike1021 在 PTT [ C_and_CPP ] 看板的留言(推文), 共60則
限定看板:C_and_CPP
看板排序:
首頁
上一頁
1
下一頁
尾頁
17F推: 錯誤的原因應該是 race condition,有敘述在論壇內05/25 04:58
18F→: 無廣告 https://forum.community.tw/t/topic/52505/25 04:58
19F→: 歡迎大家多多利用來交流05/25 04:59
12F→: 應該跟 Lipraxde 講的一樣,for 不能在全域中,prin01/06 07:00
13F→: tf 可以。你把他放進任意一個函數內試試看?void te01/06 07:00
14F→: st(){你的程式}01/06 07:00
17F→: 上述只指在 cppcheck online demo 下,沒跳錯01/06 08:45
1F推: &a 是 int** 吧?05/17 15:41
12F→: 直接算會太多嗎?an, bn 如果都整數用陣列存s多項式05/16 18:18
13F→: 分母部分直接乘或d&c來做大數乘法 假設結果為P ,05/16 18:18
14F→: 分子只需要在利用大數除法算出 sum ai * P/(1+aibis05/16 18:18
15F→: ) 這樣?05/16 18:18
1F→: 第一張圖的條件是要確認是否能相乘 AxB 要滿足11/13 13:59
2F→: #cols of A == #rows of B11/13 13:59
3F→: 中間條件是確保 C(i, j) = sum A(i, *) * B(*, j)11/13 14:04
4F→: 當發現不合條件時,就把前面算的結果存到對應的位置11/13 14:05
5F→: 在繼續算下一個11/13 14:05
6F→: 文章所提到步驟,利用此值,進入第二張圖第一個條件11/13 14:12
7F→: 這樣就會順便把最後計算結果存進去,如果不用這樣的11/13 14:12
8F→: 方式,就要在迴圈外把最後面算的值存進去11/13 14:13
9F→: 他這樣寫,可能會有陣列非法存取的問題在XD11/13 14:14
10F→: 如果對稀疏矩陣有興趣,可以參考我之前寫的兩篇11/13 14:15
11F→: https://forum.community.tw/t/topic/6211/13 14:16
12F→: https://forum.community.tw/t/topic/13711/13 14:16
13F→: 這些是我平常比較會碰到的稀疏矩陣儲存方式11/13 14:17
14F→: 有相關問題也歡迎在那裡同時發問11/13 14:17
1F推: 可能試試看 --extra-cflags="-MDd" --enable-debug?11/11 17:28
2F→: https://reurl.cc/ox4xRD 他的說明有 debug 範例11/11 17:29
3F→: 我猜主要是前面提到的兩個,不確定extra-ldflags11/11 17:30
6F推: https://trac.ffmpeg.org/ticket/6429 好像不能 Od11/12 22:11
7F→: 雖然是四年前,但錯誤看起來類似,敘述也有提到 cpu11/12 22:11
8F→: 這個檔,所以 ffmpeg 要有一定程度的最佳化才能動11/12 22:12
1F→: 因為 auto 會導致他是 unsigned,0-1不會是負數,導11/02 23:16
2F→: 致你的迴圈條件永遠成立,所以會是無窮迴圈11/02 23:16
3F→: 或者你迴圈條件也可以改成 j < j + 111/02 23:20
8F→: 這次就是msvc有抓到XD (幸好09/06 20:16
69F推: 不知道大家對於問問題或分享的地方能用 markdown 以08/16 04:25
70F→: 及程式碼上色有沒有興趣呢?08/16 04:25
73F→: 這麼說好像也是XD,雖然有多了可選解答跟或許像 sta08/26 22:53
74F→: ck overflow 的投票排序這樣08/26 22:53
4F→: 主要讓他能跑在 AMD 上面,讓程式跑在不同廠上,我08/19 17:40
5F→: 們還是有留 cuda 給 Nvidia。而且現在 AMD GPU 有加08/19 17:40
6F→: 入這個戰局,top 500 用的 GPU 不會只有 Nvidia 了08/19 17:40
9F→: 可以分成兩個來講,第一我們有用 gtest 來做測試,08/20 06:12
10F→: 第二是減少重複性,所以像 kernel 本身大多一樣的,08/20 06:13
11F→: 我們會把它寫進一個檔案,在要用時,使用 #include08/20 06:14
12F→: 把他加進檔案,並留參數在引入前調整來配合不同廠08/20 06:15
13F→: 我也回覆在論壇文章下,加範例解釋 #include 用法08/20 06:17
16F→: 不太確定一般狀況下好不好入手 HIP 支援的 AMD GPU08/22 23:45
17F→: 可參考列表:https://reurl.cc/gWV9Gp08/22 23:49
18F→: 之前 radeon VII 還買得到,現在應該不好找了08/22 23:51
19F→: HIP 不像 NVCC 一樣支援他旗下的所有卡,蠻可惜的點08/22 23:52
23F→: 嗯,我本身對於 OpenCL 不是很熟,不確定他是不是只08/25 18:22
24F→: 有通用的部分,且 Nvidia 跟 AMD 好像是用不同版本08/25 18:22
25F→: 的?另外目前也有 sycl,也是有支援很多平台(待確08/25 18:22
26F→: ),而 intel dpcpp 也是基於 sycl 下去弄,關於 in08/25 18:22
27F→: tel dpcpp 之後可能會再寫一篇(非近期),它比 hip08/25 18:22
28F→: 麻煩許多XD08/25 18:22
29F→: 另外也有 hip-sycl 只是要確認一下方向性,不確定是08/25 18:23
30F→: hip 在 sycl 上跑還是反過來08/25 18:23
首頁
上一頁
1
下一頁
尾頁