[問題] 請教如何增加這段 code 之 cache hit ?

看板C_and_CPP作者EdisonX (卡卡獸)時間12年前 (2013/04/29 12:22)推噓5(5推 0噓 16→)

留言21則, 11人參與討論串1/2 (看更多)

for( i = 0 ; i < h ; ++i){ for(j = 0 ; j < w ; ++j) { dst[j][h - i] = src[i * w+ j]; } } 上面這段 code 是用在影像處理的某點截取，瓶頸效能出在這裡，但想半天想不到有什麼妙招可避開，不知各位版友先進是否能指點一二？另這種 code 開 thread 下去划算嗎？小弟先行感激，謝謝各位。 --- 補充 --- 補充一下，我在「猜」瓶頸可能是使用了 bcb 裡速度慢的 Componment，原始碼整理過後大致是這樣 TImage * img; for( i = 0 ; i < h ; ++i){ for(j = 0 ; j < w ; ++j) { img->Canvas->Pixel[j][h-i] = \ (TColor) src[ i * w + j]; } } w * h = 640 * 480 , 裡面 array 不需考慮 o.v 問題 (實際上有考慮過了), 這段跑完超過 1 sec , 非常慢，我做了以下的嚐試 (a) loop 對換 (b) src 改用 pointer 表示 , 做 increment 然後想說換成 img->Canvas->Picture->Bitmap->ScanLine ，但換算卡卡的 Orz 還是這部份最後自己手動搞，再呼叫底層 API 去做是最直接有效的方式？附上回覆，先謝謝各位耐心看完問題。 -- 已解 -- 問題如 andyjy12 所言， img->Canvas->Pixel[j][h-i] ，主要死在這 member func. 太耗時，最後解法如下 (1) 做一個標準 bmp header + raw_data (可以存成一張 bmp 的記憶體體) (2) 塞到 bcb-vcl-class :: TMemoryStream * stream (3) 再用 img->Picture->Bitmap->LoadFromStream( stream ); 效能差了 50 倍以上。最後感謝各位的參與討論與意見，謝謝。 -- ~ 這輩子與神手無緣我只好當神獸了 ~ 卡卡獸 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.116.213.184

推

stimim

04/29 20:35, , 1^F

04/29 20:35, 1^F

這點我忘了說我試過了，抱歉。

→

EdisonX

04/29 20:36, , 2^F

04/29 20:36, 2^F

→

azureblaze

04/29 20:59, , 3^F