[問題] 使用Vtune觀測OpenCL程式
各位大大好~小弟使用的環境是Windows
使用的sdk為intel opencl sdk(這個是作業的需求)
vtune為Intel VTune Amplifier XE 2011
目前編寫OpenCL程式後,因為效能不如純c版的好
目前推斷原因有二
其一為 我每次Enqueue的work item 數量都不大~頂多25*25
所以openCL程式加上本身的overhead,會比純C直接跑還慢
其二推斷是kernel某些intruction執行的很久,或是某個運算拖很久
因此目前想要透過intel vtune這個軟體去profile出kernel端的cycle
我目前都是參照intel自己的說明網頁http://tinyurl.com/a8evpfm
但是怎麼設定就只有看到host端的cycle,卻沒有如網頁上的可以看到kernel端的cycle
已經卡好久了,所以想要上來請教有這方面知識的專家
如果我有地方沒有描述在麻煩指教
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 1.169.161.105
→
12/07 13:24, , 1F
12/07 13:24, 1F
推
01/10 16:53, , 2F
01/10 16:53, 2F
推
01/10 16:54, , 3F
01/10 16:54, 3F