[姆咪] 所以DeepSeek用了OpenAI的模型

看板Marginalman作者 (甚麼都不想做的凱瑞)時間1年前 (2025/01/30 13:14), 編輯推噓1(101)
留言2則, 2人參與, 1年前最新討論串1/1
用別人訓練好的模型再去做distillation這種事情超常見吧 學術界的那些人搞不好比較關心的是他R1是怎麼做的吧 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.199.101 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1738214084.A.6C6.html

01/30 13:17, 1年前 , 1F
中國贏2次
01/30 13:17, 1F

01/30 13:18, 1年前 , 2F
不是有論文
01/30 13:18, 2F
文章代碼(AID): #1dcmh4R6 (Marginalman)