[問題] 兩種不同執行檔產生方式,導致時間不同

看板CompilerDev作者 (陽光大肥宅)時間4年前 (2021/11/02 22:58), 4年前編輯推噓3(3019)
留言22則, 2人參與, 4年前最新討論串1/1
大家好, 我今天有一個程式,內部有計算時間的 code 轉成 ll 檔後,(input.ll) 使用 lli input.ll,得到 run time = t1, 現在我用以下兩種方法得到執行檔: $ clang input.ll -o output1 $ ./outout1 得到 run time = t2, $ llc input.ll $ as input.s -o input.o $ clang input.o -o output2 $ ./output2 得到 run time = t3。 t1, t2, t3的關係為:t1 = t3 < t2 直接由 clang 得到的執行檔執行速度最慢, 而經過一連串的 compile 得執行檔,執行速度和 lli 得到的一樣, 想請問為什麼有這樣的差異存在? 直接由 clang 出來的是 a.out。 哪一種作為測量 run time 最合適? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.75.78 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/CompilerDev/M.1635865119.A.747.html

11/02 23:42, 4年前 , 1F
先確定一下3種方式所經歷的優化pass有什麼不同 —print-
11/02 23:42, 1F

11/02 23:42, 4年前 , 2F
after-all 觀察一下 每個經歷過的pass
11/02 23:42, 2F
clang 似乎沒有這個 flag? 我期待的是,經過這些編譯,是不會有任何優化的。我的目的是要測我自己的優化 pass 的 run time 如何,希望中間不加任何pass. 感覺 lli最準?也就是第二種產生方式。 ※ 編輯: shane87123 (220.141.75.78 臺灣), 11/03/2021 00:26:22

11/03 00:55, 4年前 , 3F
那這樣的話你可以用 opt 去指定跑你要的優化,然後用 l
11/03 00:55, 3F

11/03 00:55, 4年前 , 4F
lc 做 codegen、codegen 的優化。opt、llc 兩個 tool
11/03 00:55, 4F

11/03 00:55, 4年前 , 5F
分別是用來跑 target-independent、target-dependent
11/03 00:55, 5F

11/03 00:55, 4年前 , 6F
的 pass pipeline 的
11/03 00:55, 6F

11/03 01:02, 4年前 , 7F
要跑自己的 pass 去比較差異會比較建議用上述的作法,
11/03 01:02, 7F

11/03 01:02, 4年前 , 8F
這樣還可以拿到 object file 來看有沒有如預期 codegen
11/03 01:02, 8F

11/03 01:02, 4年前 , 9F
。用 clang 的話要指定 pass、優化程度比較麻煩,而 ll
11/03 01:02, 9F

11/03 01:02, 4年前 , 10F
i 則是用 interpreter + JIT 的方式,要看到 codegen
11/03 01:02, 10F

11/03 01:02, 4年前 , 11F
的結果會比較難一些。
11/03 01:02, 11F
其實我主要是想做 target-independent 的優化順序這塊,單純想比較 target-independent 的優化哪個種順序比較好 llc 我剛剛看一下,似乎預設就是 O2,那感覺第二種方式就比較不好了 llc 所得到的 assembly code,要怎麼做才能得到 executable file? as 之後拿到 object code,ld 會出錯,用 clang 傳 -O0 會是好方法嗎? ※ 編輯: shane87123 (114.43.59.118 臺灣), 11/03/2021 09:25:23

11/03 10:50, 4年前 , 12F
clang 請下 -mllvm —print-after-all 另外要測試自己
11/03 10:50, 12F

11/03 10:50, 4年前 , 13F
的優化pass 感覺不應該把其他的關掉 這樣會造成自己所
11/03 10:50, 13F

11/03 10:50, 4年前 , 14F
做的優化pass 看起來很厲害 跟實際上的使用情況有所不同
11/03 10:50, 14F

11/03 10:53, 4年前 , 15F
需要考慮自己的優化pass是在做什麼 安排在哪些優化pass
11/03 10:53, 15F

11/03 10:53, 4年前 , 16F
後做自己的優化pass比較適當 過去經驗有時候是看benchma
11/03 10:53, 16F

11/03 10:53, 4年前 , 17F
rk的結果來決定XD
11/03 10:53, 17F
我現在的順序就是這樣,不過剛好相反, 如果把llc的O2關起來 performance 比opt O3差 但把llc O2 開起來 performance 比 opt O3好XDD 另外想問,benchmark要去哪裡找比較好? 我現在是自己找一些執行時間比較久的 c code來測 ※ 編輯: shane87123 (101.10.95.108 臺灣), 11/03/2021 13:54:31

11/03 19:52, 4年前 , 18F
痾... opt -O3 && llc -O2 的 performance 比 opt -O3
11/03 19:52, 18F

11/03 19:52, 4年前 , 19F
&& llc -O0 還好好像還蠻合理的吧?還是我理解錯你的意
11/03 19:52, 19F

11/03 19:52, 4年前 , 20F
思?
11/03 19:52, 20F
抱歉,沒有表達清楚 Opt 我的 pass sequence + llc O2 效能比 Opt O3 + llc O2 好 但opt 我的 pass sequence +llc O0 效能比 opt O3 + llc O0差 ※ 編輯: shane87123 (101.10.93.31 臺灣), 11/04/2021 09:24:31

11/05 12:27, 4年前 , 21F
如果是做調整 target-independent 的 pass 順序的調整
11/05 12:27, 21F

11/05 12:27, 4年前 , 22F
的話,把 llc 固定用 O2 吧XD
11/05 12:27, 22F
了解,我現在也是直接用 llc 預設的(O2) ※ 編輯: shane87123 (114.43.59.118 臺灣), 11/07/2021 14:08:07
文章代碼(AID): #1XWL8VT7 (CompilerDev)