討論串[問卦] 中國狗DeepSeek 模型好久沒升級了
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
元旦Deepseek發表的論文公布名為「流形約束超連接」(Manifold-Constrained Hyper-Connections)的新框架. 這項技術透過優化神經網路架構,在僅增加 6.7% 訓練時間的情況下大幅提升訓練穩定性,這在大型模型訓練中被視為非常低且可接受的代價。. 這技術可以把大模
(還有720個字)
內容預覽:
哈囉 你各位雜質. 是我小偉辣. 中國狗的深度求索(DeepSeek)人工智慧還在R1. 號稱五百萬美金訓練出來的模型. 打趴歐美各國人工智慧模型. 好久更新模型惹. 怎麼辦羅福莉會不會被抓去勞改. 八卦版中國狗趕快來噓我. 藍白狗趕快來噓. 西西. --. ※ 發信站: 批踢踢實業坊(ptt.cc
(還有580個字)
首頁
上一頁
1
下一頁
尾頁