[新聞] Hugging Face逆向工程DeepSeek-R1,將打造開放推理模型Open-R1

看板Gossiping作者 (阿修雷)時間1年前 (2025/02/01 08:43), 1年前編輯推噓40(44441)
留言89則, 62人參與, 1年前最新討論串1/1
1.媒體來源: iThome 2.記者署名: 文/李建興 | 2025-01-31發表 3.完整新聞標題: Hugging Face逆向工程DeepSeek-R1,將打造開放推理模型Open-R1 4.完整新聞內文: 中國人工智慧公司所開發的DeepSeek-R1模型發布以來,相對低廉的硬體與訓練成本就能 展現高水準推理能力,在市場引發極大震盪。Hugging Face現正根據DeepSeek所公布的研 究內容進行逆向工程,試圖推出名為Open-R1的開放版本,期望在透明、可驗證的環境下 讓研究社群能更深入了解該突破性技術。 由於DeepSeek-R1以遠低於市場預期的成本達到與先進模型相近的推理表現,業界與學界 都希望能了解技術全貌,但DeepSeek未公開完整的訓練資料集與程式碼,使得外界對其稱 為開源模型的真實性存有疑慮。Hugging Face工程師認為,如果只釋出模型權重與部分技 術報告,仍不足以滿足真正的開放標準,因而決定透過逆向工程與大規模協作,建置完整 可供研究者自行驗證與調整語言模型,成為推理模型的開放訓練工作管線與資料集。 深度學習社群之所以對此舉格外關注,主要是因為DeepSeek-R1在數學、程式開發與科學 領域的推理能力,甚至能與知名的OpenAI o1模型一較高下,而開發成本卻聲稱僅有美國 人工智慧公司花費的一小部分。一旦Hugging Face成功重現Open-R1,研究人員將可確切 掌握其中關鍵架構、訓練步驟,以及在有限硬體資源下達到高效訓練的方法。 目前Hugging Face團隊的做法,是先分析DeepSeek發布的技術報告與模型論文,並嘗試從 現有權重中推斷其訓練配方與資料分布。由於DeepSeek並未開放完整的資料集與程式碼, Hugging Face需要召集志願者,共同整理出可供公開使用的高品質推理資料,藉此復刻或 接近DeepSeek-R1所使用的多階段訓練策略。 當Open-R1順利出爐,將不只是一個DeepSeek-R1複製品,更可能在技術透明度與研究價值 上進一步超越原始模型。Open-R1可供任何人檢閱並改良強化學習流程、語言模型結構以 及推理邏輯。這對需要確保模型輸出精度與可控性的企業而言相當重要,也進一步突顯了 開源社群在推動人工智慧技術發展時所扮演的關鍵角色。 Open-R1模型的訓練將使用Hugging Face的Science Cluster運算資源,該叢集有96個節點 ,每個節點有8張顯示卡,共768顆Nvidia H100可用於密集訓練,Hugging Face預計在數 周內推出第一個可公開測試的原型版本。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://www.ithome.com.tw/news/167171 6.備註: 當有一群人在64天安門上做文章否定DS模型的表現時, 另一群人正在想辦法山寨DS 而拿200E預算的前部長則是拿著破解64天安門問題洋洋得意 話說回來,我當天早上就已經破解的東西有什麼好吹的? https://www.ptt.cc/bbs/HatePolitics/M.1738028624.A.374.html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.232.109.183 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1738370588.A.E53.html ※ 編輯: purplvampire (118.232.109.183 臺灣), 02/01/2025 08:43:52

02/01 08:44, 1年前 , 1F
台灣已經開始落後
02/01 08:44, 1F

02/01 08:44, 1年前 , 2F
怎麼不來逆向200億的點麵線系統?
02/01 08:44, 2F

02/01 08:44, 1年前 , 3F
200億點麵線可以逆向嗎?
02/01 08:44, 3F

02/01 08:45, 1年前 , 4F
美國會點麵線嗎 不會就閉嘴 台灣遙遙領
02/01 08:45, 4F

02/01 08:45, 1年前 , 5F
02/01 08:45, 5F

02/01 08:46, 1年前 , 6F
數発部的功能,只有點餐,出國考察
02/01 08:46, 6F

02/01 08:46, 1年前 , 7F
數位部:禁止全民使用大陸軟體,刁民只配
02/01 08:46, 7F

02/01 08:47, 1年前 , 8F
使用偉大的點餐軟體
02/01 08:47, 8F

02/01 08:47, 1年前 , 9F
前部長應該也沒得意吧?是黨媒自己在那得意
02/01 08:47, 9F

02/01 08:47, 1年前 , 10F
這才是讓AI技術進步的正確方式
02/01 08:47, 10F

02/01 08:48, 1年前 , 11F
用你的魔法對付你?
02/01 08:48, 11F

02/01 08:48, 1年前 , 12F
我山寨你的山寨
02/01 08:48, 12F

02/01 08:49, 1年前 , 13F
你們有分析架構;台灣有分析 64!
02/01 08:49, 13F

02/01 08:49, 1年前 , 14F
什麼能力做什麼事 怎樣 不爽嗎
02/01 08:49, 14F

02/01 08:51, 1年前 , 15F
魔法對轟
02/01 08:51, 15F

02/01 08:52, 1年前 , 16F
正確做法阿 都開源了先驗證 確定能用的
02/01 08:52, 16F

02/01 08:53, 1年前 , 17F
話就嘗試魔改
02/01 08:53, 17F

02/01 08:53, 1年前 , 18F
有當年擋疫苗的起手式味道
02/01 08:53, 18F

02/01 08:56, 1年前 , 19F
到時候OR1查不到64看小鳥要不要出征美國
02/01 08:56, 19F

02/01 08:56, 1年前 , 20F
一群弄臣
02/01 08:56, 20F

02/01 08:58, 1年前 , 21F
不是說抄襲還逆向抄襲的??
02/01 08:58, 21F

02/01 08:59, 1年前 , 22F
有必要淪落成這樣
02/01 08:59, 22F

02/01 09:00, 1年前 , 23F
研究完發現裡面就是抄來的 笑死
02/01 09:00, 23F

02/01 09:01, 1年前 , 24F
正常人都是趕快分析 看怎麼利用創新進步
02/01 09:01, 24F

02/01 09:01, 1年前 , 25F
只有台灣一堆反智的在那裡抓不到重點 搞
02/01 09:01, 25F

02/01 09:01, 1年前 , 26F
不清楚狀況 先喊騙局 先查64再說 這就是
02/01 09:01, 26F

02/01 09:01, 1年前 , 27F
政府補助的成果
02/01 09:01, 27F

02/01 09:04, 1年前 , 28F
這跟藍白統刪有87%像
02/01 09:04, 28F

02/01 09:08, 1年前 , 29F

02/01 09:09, 1年前 , 30F

02/01 09:10, 1年前 , 31F
好了啦中吹 泱泱大國整天只會意淫贏台
02/01 09:10, 31F

02/01 09:10, 1年前 , 32F
chatGPT應該也有偷招
02/01 09:10, 32F

02/01 09:10, 1年前 , 33F
灣超丟臉 不愧是籠的傳人
02/01 09:10, 33F

02/01 09:10, 1年前 , 34F
美國佬在翻垃圾桶找東西吃了
02/01 09:10, 34F

02/01 09:14, 1年前 , 35F
至少比讓DS說64有用
02/01 09:14, 35F

02/01 09:19, 1年前 , 36F
笑死 直接不演了 直接說我就reverse
02/01 09:19, 36F

02/01 09:24, 1年前 , 37F
人家追求技術突破,台灣追求意識型態符
02/01 09:24, 37F

02/01 09:24, 1年前 , 38F
閩南族群的腦 底部的電路邏輯就是不
02/01 09:24, 38F

02/01 09:24, 1年前 , 39F
合黨意,各取所需,沒問題的
02/01 09:24, 39F

02/01 09:24, 1年前 , 40F
停檢視自己有沒有被外族統治,然後
02/01 09:24, 40F

02/01 09:24, 1年前 , 41F
自己是不是當地最有勢力的
02/01 09:24, 41F

02/01 09:28, 1年前 , 42F
用64否定DS 真的很可笑
02/01 09:28, 42F

02/01 09:29, 1年前 , 43F
不透明就是中國拷貝技術
02/01 09:29, 43F

02/01 09:29, 1年前 , 44F
滿地開花 不同領域的專武AI要出現了
02/01 09:29, 44F

02/01 09:34, 1年前 , 45F
中共:只能我逆向,憑什麼西方可以逆向
02/01 09:34, 45F

02/01 09:34, 1年前 , 46F
?全世界華人都不同意
02/01 09:34, 46F

02/01 09:36, 1年前 , 47F
垃圾數發布
02/01 09:36, 47F

02/01 09:38, 1年前 , 48F
我們連發個新聞說在破解ds都懶 只要政治
02/01 09:38, 48F

02/01 09:38, 1年前 , 49F
中國又贏
02/01 09:38, 49F

02/01 09:39, 1年前 , 50F
qq
02/01 09:39, 50F

02/01 09:40, 1年前 , 51F
驗證羅福莉團隊真牛逼 中國蘿莉NO1
02/01 09:40, 51F

02/01 09:46, 1年前 , 52F
只要一直叫網軍出來洗抄襲、只是中國大外
02/01 09:46, 52F

02/01 09:46, 1年前 , 53F
宣就好了,你以為數發部真有能力自己生一
02/01 09:46, 53F

02/01 09:46, 1年前 , 54F
個突破性的模型嗎?
02/01 09:46, 54F

02/01 10:04, 1年前 , 55F
跪著舔爽拿200億 誰他媽要996搞研發
02/01 10:04, 55F

02/01 10:04, 1年前 , 56F
養幾百個米蟲 不及人家一間小公司
02/01 10:04, 56F

02/01 10:11, 1年前 , 57F
點麵不只爛還貴 這是我們200億部的偉大創
02/01 10:11, 57F

02/01 10:11, 1年前 , 58F
作 ai不值一提
02/01 10:11, 58F

02/01 10:13, 1年前 , 59F
笑死 國外都神仙打架 台灣只有點麵線
02/01 10:13, 59F

02/01 10:17, 1年前 , 60F
洗了整個假期夠了沒
02/01 10:17, 60F

02/01 10:20, 1年前 , 61F
本來是期望唐鳳能去幹這種事 結果==
02/01 10:20, 61F

02/01 10:22, 1年前 , 62F
國外大廠:值得研究 台灣:很危險 不能提
02/01 10:22, 62F

02/01 10:22, 1年前 , 63F
64 根本爛東西 我們有點麵線
02/01 10:22, 63F

02/01 10:27, 1年前 , 64F
當國外都在驗證重現人家宣稱的成本效
02/01 10:27, 64F

02/01 10:28, 1年前 , 65F
能,只有台灣在意識形態上大做文章
02/01 10:28, 65F

02/01 10:28, 1年前 , 66F
點麵線超強的
02/01 10:28, 66F

02/01 10:33, 1年前 , 67F
台灣天才部長都破解了 台灣No.1
02/01 10:33, 67F

02/01 10:34, 1年前 , 68F
02/01 10:34, 68F

02/01 10:37, 1年前 , 69F
大家現在都在抄中國Deepseek
02/01 10:37, 69F

02/01 10:38, 1年前 , 70F
塔綠班畜生崩潰了,沒有完整的開源
02/01 10:38, 70F

02/01 11:07, 1年前 , 71F
彼此相互蒸餾萃取 哈哈哈哈
02/01 11:07, 71F

02/01 11:22, 1年前 , 72F
井蛙灣灣還再當山頂洞人
02/01 11:22, 72F

02/01 11:24, 1年前 , 73F
鳥又翻
02/01 11:24, 73F

02/01 11:25, 1年前 , 74F
原來哈根達斯不是只有賣比冰淇淋
02/01 11:25, 74F

02/01 11:29, 1年前 , 75F
烏又贏 鳥又崩
02/01 11:29, 75F

02/01 11:30, 1年前 , 76F
台灣已攻破64天安門限制,這些大公司還在
02/01 11:30, 76F

02/01 11:30, 1年前 , 77F
研究無關緊要的東西,台又贏
02/01 11:30, 77F

02/01 11:31, 1年前 , 78F
有比我們天才it大臣繞過破解還厲害嗎ww
02/01 11:31, 78F

02/01 11:35, 1年前 , 79F
台灣價值你敢嘴
02/01 11:35, 79F

02/01 11:40, 1年前 , 80F
台灣真他媽的丟臉丟到家
02/01 11:40, 80F

02/01 12:50, 1年前 , 81F
別人都在往前進步的時候拜託別出來丟
02/01 12:50, 81F

02/01 12:50, 1年前 , 82F
02/01 12:50, 82F

02/01 12:55, 1年前 , 83F
部長搞不好看到你的文章才想到的啊
02/01 12:55, 83F

02/01 13:35, 1年前 , 84F
開源還要逆工?
02/01 13:35, 84F

02/01 13:43, 1年前 , 85F
逆向工程XDD 開始蒸餾你的蒸餾
02/01 13:43, 85F

02/01 15:43, 1年前 , 86F
從這件事的操作就知道唐鳳沒料了…
02/01 15:43, 86F

02/01 15:51, 1年前 , 87F
你可以當部長了
02/01 15:51, 87F

02/01 18:47, 1年前 , 88F
笑死 人家在破解模仿 台灣在繞過64
02/01 18:47, 88F

02/01 20:56, 1年前 , 89F
大臣沒有輸
02/01 20:56, 89F
文章代碼(AID): #1ddMuSvJ (Gossiping)