作者查詢 / a1234567289
作者 a1234567289 的總覽 (PTT發文,留言,暱稱)
發文數量: 27
收到的『推』: 338 (61.2%)
收到的『→』: 199 (36.1%)
收到的『噓』: 15 (2.7%)
留言數量: 5167
送出的『推』: 2717 (52.6%)
送出的『→』: 2262 (43.8%)
送出的『噓』: 188 (3.6%)
使用過的暱稱: 1
a1234567289 在 PTT 最新的發文, 共 27 篇
a1234567289 在 PTT 最新的留言, 共 5167 則
71F推: 樓上… 所謂的蒸餾不是拿權重.. 是101.12.151.128 01/30 11:18
72F→: 拿GPT的輸出入當資料訓練101.12.151.128 01/30 11:18
6F→: 只能說這些新聞都寫得很聳動XD01/26 13:28
14F推: 要對齊浮點精度才能比較Tflops01/15 11:43
18F→: 上面的Terra X1 1Tflops是半精度浮點的情況下01/15 11:45
67F推: 沒錯 Tflops是無法反應效能的 因為在遊戲裡面更重要01/15 12:30
68F→: 的是ROPs 等等的渲染管線的效率而非純理論算力01/15 12:30
345F推: 看各遊戲的性能壓榨的程度到哪裡 如果原始碼轉成IR01/14 17:50
346F→: 都是只依賴llvm IR 那沒意外移植性並不會太差 就是01/14 17:50
347F→: 不同的ISR lowering 而已01/14 17:50
348F→: 難移的是那些已經最佳化到x86的特定指令 來到ARM上01/14 17:51
349F→: 後如果性能不足還要再額外壓榨的情況下會變比較麻煩01/14 17:51
350F→: 所以轉移平台簡單的都是性能沒太要求的01/14 17:53
352F推: 缺指令其實沒那麼嚴重 那些特殊指令集通常PC也說科01/15 00:03
353F→: 學運算在用的 困難的是那些已經針對PC上最佳化好的01/15 00:03
354F→: 流程可能要為Switch重來01/15 00:03
355F→: PC特性可能是DRAM latency低, VRAM的latency高但是01/15 00:10
356F→: BW高. 遊戲觸發各讀寫的指令排序和時機點很可能都01/15 00:10
357F→: 利用這前提最佳化過. Switch光是只有4G RAM 還要和01/15 00:10
358F→: GPU共享 遊戲設計者就會花更多時間去最佳化時序01/15 00:10
359F推: 架構的差異要考慮整個系統的架構 而非CPU架構01/15 00:17
360F→: *應該說不是只有CPU架構01/15 00:17
22F推: 基於堆疊參數而成的大模型思路可能要改變了 現在大01/14 12:26
23F→: 模型比較像是把資料背下來01/14 12:26
a1234567289 在 PTT 的暱稱紀錄, 共 1 個
暱稱:蛋包飯
文章數量:25