[新聞]新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA

看板Tech_Job作者 (pl132)時間4月前 (2025/08/14 19:58), 編輯推噓7(8113)
留言22則, 12人參與, 4月前最新討論串1/1
新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA https://tinyurl.com/24gqjw6w 中國人工智慧(AI)公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,延後新一代 模型的發布,這也凸顯北京推動取代美國技術的困難。 知情人士透露,DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,改採用華為昇騰( Ascend)處理器,而非 NVIDIA 系統。 然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進 行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,這是模型發布從 5 月延後的主要原因,導致 DeepSeek 在競爭中落後。 所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或 產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導 體自給自足所面臨的挑戰。 外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提 供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。 業界人士認為,與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢, 以及軟體水準較差等劣勢。 據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2 模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek 與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。 知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時 間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新 模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。 加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在 經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不 代表未來不會發生。這只是時間問題」。 ========== 其實是華為沒有台積電,沒辦法搞出好晶片,難怪老黃有恃無恐 就算繳15%獲利也沒差,應該可以拖住中國AI發展到2030年 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.204.57 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1755172683.A.2A0.html

08/14 20:04, 4月前 , 1F
amd可以用台積都差nv那麼遠了
08/14 20:04, 1F

08/14 20:33, 4月前 , 2F
中國短時間能追成這樣 也是很誇張了
08/14 20:33, 2F

08/14 20:34, 4月前 , 3F
NV本來就有幾十年的GPU生態系
08/14 20:34, 3F

08/14 20:48, 4月前 , 4F
中國依賴台灣高階晶片
08/14 20:48, 4F

08/15 00:03, 4月前 , 5F
能接近NV的可能只有AVGO了
08/15 00:03, 5F

08/15 07:41, 4月前 , 6F
說幾十年會不會太誇張… cuda是哪一年
08/15 07:41, 6F

08/15 07:41, 4月前 , 7F
出來的?
08/15 07:41, 7F

08/15 08:39, 4月前 , 8F
十幾年啦 typo吧
08/15 08:39, 8F

08/15 09:28, 4月前 , 9F
遙遙領先~
08/15 09:28, 9F

08/15 09:53, 4月前 , 10F
2F 吹太明顯啦 誇大對手是常用手法但是要先G
08/15 09:53, 10F

08/15 09:53, 4月前 , 11F
oogle喔
08/15 09:53, 11F

08/15 12:45, 4月前 , 12F
市值第一的實力啊,哪可能這麼簡單
08/15 12:45, 12F

08/15 15:11, 4月前 , 13F
NV強有什麼用 美國有刷臉付款販賣機嗎 #
08/15 15:11, 13F

08/15 15:11, 4月前 , 14F
遙遙領先
08/15 15:11, 14F

08/15 15:35, 4月前 , 15F
https://tinyurl.com/24kkhoyh 不要再管國外
08/15 15:35, 15F

08/15 15:35, 4月前 , 16F
的事情台灣自己都快管不了了
08/15 15:35, 16F

08/15 15:37, 4月前 , 17F
你國家級的軟體資訊服務都要被癱瘓了
08/15 15:37, 17F

08/18 14:15, 4月前 , 18F
對岸要取代cuda短期有難度的,畢竟是NV
08/18 14:15, 18F

08/18 14:15, 4月前 , 19F
跟業界積累已久的底蘊,但給對岸五~十
08/18 14:15, 19F

08/18 14:15, 4月前 , 20F
年的時間可能還真的能搞出自己的生態系
08/18 14:15, 20F

08/18 14:15, 4月前 , 21F
。上面下令你不得不用,自然強迫所有人
08/18 14:15, 21F

08/18 14:15, 4月前 , 22F
上去開發,豬頭遲早也能改成諸葛亮....
08/18 14:15, 22F
文章代碼(AID): #1edSzBAW (Tech_Job)