作者查詢 / afacebook

總覽項目: 發文 | 留言 | 暱稱
作者 afacebook 的總覽 (PTT發文,留言,暱稱)
發文數量: 662
收到的『推』: 6927 (31.7%)
收到的『→』: 13141 (60.2%)
收到的『噓』: 1771 (8.1%)
留言數量: 8385
送出的『推』: 2809 (33.5%)
送出的『→』: 3770 (45.0%)
送出的『噓』: 1806 (21.5%)
使用過的暱稱: 2
afacebook 在 PTT 最新的發文, 共 662 篇
Re: [討論] 北檢抗告成功的機會是多少
[ HatePolitics ]8 留言, 推噓總分: -1
作者: afacebook - 發表於 2025/09/09 23:35(3月前)
Re: [問卦] 這次高院會怎麼裁定?
[ Gossiping ]8 留言, 推噓總分: +5
作者: afacebook - 發表於 2025/09/09 23:08(3月前)
Re: [新聞] 緊咬輝達 陸揭美晶片安裝後門招數
[ Stock ]23 留言, 推噓總分: -3
作者: afacebook - 發表於 2025/08/24 06:17(4月前)
Re: [新聞] 台積電洩密案 包括副總嚴厲連坐五級懲處已刪文
[ Stock ]21 留言, 推噓總分: +8
作者: afacebook - 發表於 2025/08/07 14:36(4月前)
Re: [新聞] 彭博:台美關稅談判卡關 傳美要求「比
[ Stock ]62 留言, 推噓總分: +18
作者: afacebook - 發表於 2025/07/30 10:53(4月前)
afacebook 在 PTT 最新的留言, 共 8385 則
Re: [情報] DDR5 開始飆漲
[ PC_Shopping ]153 留言, 推噓總分: +56
作者: ctes940008 - 發表於 2025/12/19 17:25(5天前)
15Fafacebook: 南亞科擴廠也不是現在才擴就是36.225.91.28 12/19 18:11
16Fafacebook: 已經很久了36.225.91.28 12/19 18:11
[情報] [情報] 特斯拉無安全員Robotaxi測試中
[ Stock ]269 留言, 推噓總分: +104
作者: TomChu - 發表於 2025/12/15 09:43(1周前)
206Fafacebook: 自動駕駛就沒有再跟人類比的啊 跑贏人類只是baselin12/15 15:35
207Fafacebook: 老馬就當初不懂AI 自己放棄光達12/15 15:36
208Fafacebook: 現在都只是在安撫信眾而已12/15 15:36
209Fafacebook: 人類數量那麼多 只有要幾個飆仔就能把統計數值搞爛12/15 15:37
210Fafacebook: 他自己都在新架構放上接口了 他很想把光達放回去12/15 15:40
211Fafacebook: 只是這樣很尷尬 信眾的信仰會崩潰12/15 15:41
212Fafacebook: 他需要一個契機 讓信仰不至於崩潰的契機12/15 15:42
Re: [新聞] 甲骨文股價暴跌超10%!訂單積壓越來越多 「燒錢」砸AI
[ Stock ]43 留言, 推噓總分: +10
作者: oopFoo - 發表於 2025/12/14 05:40(1周前)
21Fafacebook: 不對喔 transformer基本就是qkv+ffn12/14 15:58
22Fafacebook: 如果你只改了FFN 那確實就如這篇說的12/14 15:59
23Fafacebook: 叫xxtransformer才對 transformer已經被魔改到12/14 15:59
24Fafacebook: 我隨便就能舉出2-30transformer架構12/14 16:00
25Fafacebook: 然後他還改變了training的方式 但那些fine-turing的12/14 16:01
26Fafacebook: 技巧 其實還滿常使用的12/14 16:01
27Fafacebook: 在transfer learning 本來就沒有一次性地更新模型的12/14 16:02
28Fafacebook: 不同的模型使用不同的更新速率 這是很常見的12/14 16:02
29Fafacebook: 你如果訓練GAN 更常使用不同頻率的更新技巧12/14 16:03
30Fafacebook: 再來就是他使用了一種新的op 那這要實驗去驗證12/14 16:04
31Fafacebook: 簡單的說 大模型試試看 目前說實在 沒有覺得很亮眼12/14 16:04
32Fafacebook: 他如果能在大模型打敗所有人 一翻兩瞪眼12/14 16:05
33Fafacebook: 管他叫什麼 大家都會覺得你是神12/14 16:06
34Fafacebook: 而且他FFN 用了5層....嗯 不好說 很反直覺12/14 16:07
35Fafacebook: 不過我還是要謝謝原本那篇文章 看股版還可以讀論文12/14 16:24
Fw: Google Introducing Nested Learning (作者 minazukimaya)
[ AI_Art ]5 留言, 推噓總分: +2
作者: avans - 發表於 2025/12/14 00:12(1周前)
263Fafacebook: 2年我看大家也是說transformer完蛋了 是mamba得天下12/13 10:51
264Fafacebook: 可是現在主流還是都用Transformer12/13 10:51
265Fafacebook: 看起來真的很厲害 不過在看看12/13 10:52
271Fafacebook: 我看起來他跟qkv結構沒甚麼關聯ㄟ 他是一種新的梯度12/13 11:00
272Fafacebook: 度更新方式12/13 11:01
273Fafacebook: 論文確實很厲害 不過跟記憶體好像沒啥關聯12/13 11:01
373Fafacebook: 當初大家覺得Mamba能取代transformer 是MoE+mamba或12/13 15:32
374Fafacebook: 其他的架構 當然不可能只有一層ssm的架構啊12/13 15:33
375Fafacebook: 這東西感覺是一種特別的fine turing12/13 15:34
376Fafacebook: 能不能成功 要再多做一點實驗12/13 15:34
377Fafacebook: 現在主要還是覺得大模型比較強12/13 15:36
378Fafacebook: 這是想要做些中模型 就能有很好的適應能力吧12/13 15:36
379Fafacebook: 很特別 請google再多做一點實驗12/13 15:37
380Fafacebook: CMS這種更新方式 其實跟一般 先凍結一些層 然後慢慢12/13 15:39
381Fafacebook: 打開 不是很像嗎?12/13 15:40
382Fafacebook: 然道主要是那optimizer有貢獻嗎12/13 15:41
383Fafacebook: 好像也沒這麼簡單 要再研究一下12/13 15:43
389Fafacebook: Mamba有沒有成氣候 還不知道吧....12/13 16:24
390Fafacebook: 每次新架構出來 基本都會吹一下 要經過檢驗12/13 16:26
391Fafacebook: 說實在 我個人是覺得沒有到當初看Transformer那種12/13 16:28
392Fafacebook: 神奇感 就是等看接下來發展12/13 16:29
Re: [情報] DDR5 開始飆漲
[ PC_Shopping ]433 留言, 推噓總分: +164
作者: ctes940008 - 發表於 2025/12/13 02:49(1周前)
406Fafacebook: 現在還有人買電腦嗎......36.225.67.76 12/13 22:09
407Fafacebook: 大概漲了4倍 以前5000的東西 現在要2萬36.225.67.76 12/13 22:10
408Fafacebook: 其實搜尋菜單就會發現根本沒人再組電腦36.225.67.76 12/13 22:11
afacebook 在 PTT 的暱稱紀錄, 共 2 個
暱稱:A臉書
文章數量:248
暱稱:gg
文章數量:403