Re: [討論] Python 3.10將加入Switch-Case語句

看板Soft_Job作者Muscovy (三分熟的鬧鐘)時間3年前 (2021/03/28 00:20)推噓7(8推 1噓 41→)

留言50則, 16人參與討論串4/6 (看更多)

※ 引述《Muscovy (三分熟的鬧鐘)》之銘言：一回神竟然引發這些有趣的討論. 來稍微介紹一下我的工作背景: 我是在上市公司做高效能運算的單位主管. 算什麼無聊東西就不要問了, 不過特別強調, 不是博弈或者加密貨幣. :D 我的一個 block 通常會吃掉 100%~500% CPU, 生命期介於 2~48 hours. 執行階段佔用記憶體大概是 20GB~30GB 之間, 偶爾會用到 memory map. 再長的話不敢做, 會分段跑, 因為 windows 會當. XD （MacOS 穩定一百倍, 但是公司不配發, 所以... ）因此, 我想我比絕大部分的人更在意「運算效能的問題」. 在我的例子裡面, 每個迴圈執行的時間不會低於三十分鐘. 所以這些 iteration 本身的 overhead 不是問題, 因為都是毫秒級. 但是如果你關心效能的話, 拆出一堆 for-loop 才是正確的寫法. 因為這種寫法「對於效能」最大的好處是平行化. 怎麼平行化? 幾個 for-loop 就拆幾隻程式跑啊, 簡單得很. 接下來講的就比較難一點. 加速最重要的其實是 cache utilization. 其次是 pipeline utilization. 這種 instruction level optimization, 很重要. 我給各位一個大概的概念... cache utilization 做得最好與最差, 執行效率大約 x50~x100 倍. pipeline utilization 的話, 幾層 pipeline 就是幾倍. 反觀你的 CPU 辛辛苦苦買到 12 核心, 全佔滿大約加速 4~5 倍. 把 12 核通通算到過熱它還會降頻跑, 又更慢了, 你看多廢. 然後 instruction level optimization 的部分. 教科書一開始就會說: 1.) data layout & access pattern 很重要. 2.) 迴圈裡面不要放 branch. 因為 principle 1.) 顧 cache, principle 2.) 顧 pipeline. 當然 python 本身很難做到這件事. 不過你可以去找 hardware accelerated library. 最知名的就是 tensorflow + GPGPU. tensorflow 這咚咚不只能做 AI, 它也是高效能的線代運算核心. 一樣, 為了顧效能, 你也會把自己搞成這種寫法. XD : -- : 推 neo5277: 好像是滿好玩的關心值不知道會不會比較有效果 : → Murasaki0110: 變成5次for好在哪裡 : → alihue: 第二種其實 eig 會被 scan 五次？效能不是比較差嗎不只會 scan, 實務上甚至有可能花 10 秒重建一個超大矩陣. 但是多這 10 秒, 反而可以讓你提前幾十分鐘結束運算. : 推 drajan: “pythonic” "pythonian," 來戰! 哈哈哈. : 推 noahleft: 第二種以維護角度比較容易, 第一種當條件混入各種可能後 : → noahleft: 會很難知道甚麼時候會跑到哪個條件 : → noahleft: 只要考慮到有情形是多個條件都能成立時,第一種寫法就是 : → noahleft: 看執行順序,而第二種寫法會變成餵進來的資料都是符合條 : → noahleft: 見的是的, 尤其是你看到一堆論文, 每篇都要實作才知道有沒有唬爛. 你會發現不太可能用 for-loop 內嵌一堆 if-else 去做這件事. 因為本質上你是在重建數學家的工作, 你的程式碼要越接近數學形式越好. 然後做久了會發現, 一行數學式對一個 for-loop 最直觀. XD : → hsnuyi: 又是一個不考慮CPU如何branch的人 : → WunoW: NO 你先if排除不符合的條件更直觀也有更好的效能 : → WunoW: 我知道你是想遵循單一職責原則，但這不是定律 : → WunoW: 一個迴圈做多個判斷沒有不行你判斷式提取為函式就好 : 推 alihue: 樓上說到一個重點...if的位置在某些情況可以大幅改善效能 : → WunoW: 你去看pandas的源碼吧一個for loop裡面包山包海的code一堆 : → alihue: 例如在迴圈的一開始就篩掉大部分 case 並 continue : 推 MoonCode: 先寫的簡單好懂比效能重要推推 : 推 jack0204: 樓上說的這叫early return，寫可讀性高的程式常用到我上面講的都不是學術界裡的象牙塔, 僅供寫論文之類的. 是道道地地發生在產業中的每日工作. 跟我的運算類似的產業叫做 ADAS, 他們也在寫類似的寫法. 光是一邊能無腦拆, 另一邊因為內嵌 if 不能無腦拆... 不能拆的那邊就準備被一堆 AWS 做翻. 或者俗氣一點, 畢竟是 soft JOB. 如果年紀輕輕就已經知道上面那些小訣竅, 面試進聯發科的機率很高哦. 夠俗氣吧, 但挺有用的. 所以你知道的, 為了效能, 你更應該寫一堆 for-loop. 這絕對不是異端學說. XD -- 新詩練習：新鮮。踩破初春裡的狗大便；不經意的滄桑，滿溢著嫩黃的喜悅。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.47.50 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1616862026.A.F6D.html

推

yislin

03/28 00:31, 3年前 , 1^F

03/28 00:31, 1^F

推

x9060000456

03/28 00:32, 3年前 , 2^F

03/28 00:32, 2^F

→

yislin

03/28 00:37, 3年前 , 3^F

03/28 00:37, 3^F