作者查詢 / oopFoo
作者 oopFoo 在 PTT 全部看板的留言(推文), 共7422則
限定看板:全部
看板排序:
全部PC_Shopping4075home-sale1231Soft_Job1080Emulator242Stock231GameDesign230Steam105C_Chat32nb-shopping31Oversea_Job19Lifeismoney18nCoV201918MobileComm15Tech_Job15Military13cat11HatePolitics10TY_Research7WorkinChina7Printer3D6PlayStation5AI_Art4Gossiping4Old-Games3Test3DigiCurrency2TWSU2car1Digital_Art1Storage_Zone1<< 收起看板(30)
13F→: pc的效能不錯。RPI是10秒一個token,pc是秒內幾個token03/15 20:22
14F→: declarative的程式,LLM比較會處理。只要補餵正確的資料,03/15 20:23
15F→: android/gnu make都可以分析。最近看好多應用都蠻有趣的03/15 20:30
16F→: 當然沒有的功能,問LLM,它會幻想給你,但這是小問題03/15 20:33
32F→: Meta說LLaMA-13B可比GPT3的175B。03/16 15:35
33F→: 目前都是最簡單的CPU優化。剛開始Pixel6需要26秒/token03/16 15:38
34F→: 前幾天已經5token/秒。各家版本飛速進步中。03/16 15:39
35F→: LLMs的"幻想"是內建,目前沒辦法,只能後續查證。03/16 15:40
41F→: chatGPT是通用的chat,但自己的,如Alpaca你可以訓練特化03/18 10:16
42F→: 的instruction tuning。更適合自己的用途。03/18 10:17
43F→: https://github.com/antimatter15/alpaca.cpp03/18 21:56
44F→: windows可以玩,自己編譯7B版,13B版應該很快就來了。03/18 21:57
100F推: MTL最初規劃只有nb,ARL才是主力,當初ARL是GG的3N。後來03/18 19:48
101F→: 就一路變化,現在好像又回到原先的樣子。03/18 19:50
27F推: benchlife的Chris是有內線的,但他有時會誤解細節03/18 08:11
32F→: DT只有refresh,筆電才有14代03/18 09:59
7F→: 記憶需求x2,庫存變100天,機器增加,供不應求。03/18 09:56
8F→: 這ai助手功能使需求大爆發是很有可能的。現在PC的記憶體都03/18 09:58
9F→: 配太少了。03/18 09:58
9F推: build怎麼會用不到小核?越多核越好。03/17 14:28
65F推: 你要idle低,其實應該用intel的,7900的chiplet設計,io的03/11 17:41
66F→: 的idle功耗高。要集成一顆,idle功耗才低。你看tdp是不准03/11 17:42
36F推: "x64"是amd推的,x86架構沒AMD競爭是死水一灘。03/11 14:38
10F推: 之前就結論了。那是一批洗過的礦卡,是礦卡問題,不是驅動03/11 10:56
12F→: 問題。不要再傳錯誤訊息,自刪吧03/11 10:56
8F推: 你想的太複雜了。一個是4MB/SM的L2,一個是3MB/SM的L2。03/08 12:59
9F→: 某些運算,L2多的贏。03/08 13:00
10F→: 然後rtx40系列,L2加大很多。03/08 13:02
21F推: 是啊,NV可以砍,但砍下來,性能因為調度而差那麼多?不太03/08 14:06
22F→: 可能。現在跑gpu code,基本上等data的時間是最多的,線序03/08 14:07
23F→: 再多,幫助有限,卡還是卡資料頻寬。NV跟I家都是增加L2,03/08 14:09
24F→: 因為現代硬體跟程式碼的架構,加L2的效果較好。在GPU裡L303/08 14:13
25F→: 有點尷尬,還不如記憶體頻寬加大一點,主要是GPU吞吐資料03/08 14:15
26F→: 量實在太大,大L2+大頻寬的效果是目前最好的。03/08 14:17
27F推: https://tinyurl.com/5n6h4s4x03/08 14:22
28F→: 如何有效利用L2的locality一直是最佳化的問題。加大比較03/08 14:24
29F→: 簡單,改程式比較困難。03/08 14:25
43F推: 我可能猜錯,但性能差這麼多,如果L2不變,那就是L2的03/08 15:00
45F→: latency差很多。但latency差多的話,基本上所有程式都會有03/08 15:02
46F→: 改進。所以猜L2的size不一樣是最有可能的。我還是不相信03/08 15:03
47F→: 線序調度可以差這麼多。不是不可能,但我想不出怎樣的程式03/08 15:06
48F→: 會這樣。03/08 15:06
53F推: L2沒砍,遊戲影響比較小,compute影響比較大。主要是106的03/08 15:22
54F→: sm/gpc比104的sm/gpc多。理論上反而是106在調度上有優勢,03/08 15:23
55F→: 所以我實在想不出需要多跨gpc效能反而高?到底是什麼神奇03/08 15:25
56F→: 程式。不然就是L0的設計是不一樣。不管如何我還是盲猜03/08 15:26
57F→: 是Cache的幫助。03/08 15:27
10F推: 勿忘Clippy03/08 14:35