[問題] 使用Vtune觀測OpenCL程式

看板C_and_CPP作者 (kevin215開)時間11年前 (2012/12/07 13:22), 編輯推噓2(201)
留言3則, 3人參與, 最新討論串1/1
各位大大好~小弟使用的環境是Windows 使用的sdk為intel opencl sdk(這個是作業的需求) vtune為Intel VTune Amplifier XE 2011 目前編寫OpenCL程式後,因為效能不如純c版的好 目前推斷原因有二 其一為 我每次Enqueue的work item 數量都不大~頂多25*25 所以openCL程式加上本身的overhead,會比純C直接跑還慢 其二推斷是kernel某些intruction執行的很久,或是某個運算拖很久 因此目前想要透過intel vtune這個軟體去profile出kernel端的cycle 我目前都是參照intel自己的說明網頁http://tinyurl.com/a8evpfm 但是怎麼設定就只有看到host端的cycle,卻沒有如網頁上的可以看到kernel端的cycle 已經卡好久了,所以想要上來請教有這方面知識的專家 如果我有地方沒有描述在麻煩指教 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.169.161.105

12/07 13:24, , 1F
我目前使用的是試用版的,會是這個原因嗎???
12/07 13:24, 1F

01/10 16:53, , 2F
朝聖推
01/10 16:53, 2F

01/10 16:54, , 3F
朝聖推
01/10 16:54, 3F
文章代碼(AID): #1GmNqGO6 (C_and_CPP)