作者查詢 / mike0227
作者 mike0227 在 PTT [ C_and_CPP ] 看板的留言(推文), 共43則
限定看板:C_and_CPP
看板排序:
全部Headphone290LoL230Volleyball230Audiophile98NTU_MED_VOL47C_and_CPP43BoardGame28studyabroad24ToS21Coffee18PC_Shopping18Steam16Aviation13NY-Yankees12NTUCYCLUB11PhD11Hearthstone10Japan_Travel10NTUManVolley10EuropeTravel8GO7VideoCard7NtuDormM16puzzle6RealPlaying6car5NTUMath935NTUSCSA5CSIE_Volley4Germany4LsVolleyBall4MSEVolley4NTUboardgame4Shooter-game4BIME-VOLLEY3DSLR3EconVolley3Law-Volley3NTUT_MMRE863outdoorgear3Tech_Job3bicycle2EAseries2Electronics2EYESHIELD212GatoShoji2Ghost-Shell2Gossiping2GRE2Linux2NDMC-Volley2NTU2NTUFVOLLEYBL2NTUSA2PCSH91_3052PSY-VBT2Python2Soft_Job2vetvolley2Actuary1Android1ArakawaCow1BuyTogether1chocolate1CMWang1DC1Depstore1eSports1France1FSHS-95-3161FuMouDiscuss1GetMarry1graduate1Hsinchu1Key_Mou_Pad1LCD1MAC1medstudent1MobileComm1NCCU04_Korea1NCCU_Eng_VB1NCCU_MAB_VB1NTU-HTvolley1NTUAC961NTUBST961NtuDormM31NTUHISVOLLEY1NTUmedvolybl1NTUST-ENG1points1PPE-SPORT1Storage_Zone1ToS_Match1TTU-BM1001ukulele1Unicup1VISA1<< 收起看板(97)
8F推: 精度問題 用U^-1(L^-1*y)去解 不要算反矩陣12/24 21:32
9F→: 還有記得用double12/24 21:32
11F推: free(NULL);是合法的。pointer一定被動到或是沒malloc08/21 03:58
1F推: 你memcpy的大小是data_size不是data_size205/08 11:26
2F→: 然後應該要用size_t不是float05/08 11:27
3F→: printf in kernel只要不是超老的卡應該都有支援了05/08 11:27
4F→: 就直接printf("Hello world!\n") nvcc會幫你搞定05/08 11:28
27F推: 要給seed就是pseudo吧?05/01 00:24
2F推: 把該包的API calls包進去你要的square.gpu阿03/14 08:40
6F推: 標準方法都在Lapack裡面 但是是用Fortran寫的01/03 14:23
7F→: 你的環境要可以compile+link上去 看你的需求01/03 14:25
8F→: Clapack是用f2c轉過去的 你可以試試看01/03 14:28
39F推: 一個SM同一時間只會處理跑同一個warp內的指令11/07 15:55
40F→: 所以不會出現原po問題內"部分core"閒置的狀況11/07 15:56
41F→: stall就是整個SM一起等 不會只有部分core在跑11/07 15:58
43F推: 不一定要同一個block 只要資源夠 多個blocks可以同時在11/08 04:23
44F→: 同一個SM上 你會有更多機會蓋掉global access latency11/08 04:24
45F→: Occupancy calculator就是在算同時可有多少Blocks和11/08 04:25
46F→: threads在同一個SM上 但是要注意 不一定越高越好11/08 04:26
1F→: if內是 f(2);cout<<2;f(2);07/31 23:51
6F推: 找個filter的範例來寫吧 才會用到local memory07/17 03:45
7F→: 還有GPU上通常用float算都比int快07/17 03:46
3F推: race condition01/20 13:51