Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」亮相！打造最強繁中AI語言模型

看板Stock作者aPplAus (燦爛)時間3周前 (2024/04/10 20:39)推噓18(19推 1噓 11→)

留言31則, 20人參與討論串2/3 (看更多)

原文恕刪小弟剛好最近有跟到一些台灣LLM的發展，可以補充一下關於模型的部分。聯發科的研究單位聯發創新基地，做語言模型有一段時間了，之前有一版Breeze-7B模型，發佈了一篇技術論文放在arxiv： https://arxiv.org/pdf/2403.02712.pdf 論文提到這個模型是從mistral-7B 繼續訓練而成，花了7000小時的H100，灌了650GB的da ta。如果有一半是中文，325GB，也灌了超過1000億漢字（3bytes=1word)，其實很多了啦。然後Breexe是從Mixtral訓練而成，是更大一級的模型，論文好像還沒出，但很多公司都有不同大小的模型，做法應該不會差太多（？）。最近有開放API試用： https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1 跟ChatGPT的比較，最重要的點應該是，像Breeze-7B這種已經開源的模型，對能架伺服器的公司來說，是用越多越賺；跟token收費的ChatGPT 用越多越貴截然不同。Breexe不知道會不會開源就是了。達哥的部分，沒有親自用過，但有認識的人用過。基本上就是平台，然後有一些功能，像是讀pdf等等。就把AI推廣給更多人的東西，應該是不錯啦。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.35.85 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1712752740.A.F57.html

推

04/10 20:42, 3周前 , 1^F

04/10 20:42, 1^F

→

04/10 20:43, 3周前 , 2^F

04/10 20:43, 2^F

推

04/10 20:43, 3周前 , 3^F

04/10 20:43, 3^F

推

04/10 20:48, 3周前 , 4^F

04/10 20:48, 4^F

推

04/10 20:50, 3周前 , 5^F

04/10 20:50, 5^F

推

04/10 20:52, 3周前 , 6^F

04/10 20:52, 6^F

→

04/10 20:52, 3周前 , 7^F

04/10 20:52, 7^F

→

04/10 20:53, 3周前 , 8^F

04/10 20:53, 8^F

→

04/10 20:54, 3周前 , 9^F

04/10 20:54, 9^F

噓

04/10 21:00, 3周前 , 10^F

04/10 21:00, 10^F

推

04/10 21:05, 3周前 , 11^F

04/10 21:05, 11^F

→

04/10 21:06, 3周前 , 12^F

04/10 21:06, 12^F

推

04/10 21:08, 3周前 , 13^F

04/10 21:08, 13^F

推

04/10 21:15, 3周前 , 14^F

04/10 21:15, 14^F

推

04/10 21:21, 3周前 , 15^F

04/10 21:21, 15^F

→

04/10 21:21, 3周前 , 16^F

04/10 21:21, 16^F

推

04/10 21:29, 3周前 , 17^F

04/10 21:29, 17^F

→

04/10 21:29, 3周前 , 18^F

04/10 21:29, 18^F

→

04/10 21:30, 3周前 , 19^F

04/10 21:30, 19^F

推

04/10 21:35, 3周前 , 20^F

04/10 21:35, 20^F

→

04/10 21:35, 3周前 , 21^F

04/10 21:35, 21^F

推

04/10 21:56, 3周前 , 22^F

04/10 21:56, 22^F

推

04/10 22:00, 3周前 , 23^F

04/10 22:00, 23^F

→

04/10 22:00, 3周前 , 24^F

04/10 22:00, 24^F

推

04/10 22:04, 3周前 , 25^F

04/10 22:04, 25^F

推

04/10 22:05, 3周前 , 26^F

04/10 22:05, 26^F

推

04/10 22:41, 3周前 , 27^F

04/10 22:41, 27^F

推

04/10 23:06, 3周前 , 28^F

04/10 23:06, 28^F

推

04/11 00:29, 3周前 , 29^F

04/11 00:29, 29^F

推

04/11 01:19, 3周前 , 30^F

04/11 01:19, 30^F

→

04/11 07:22, 3周前 , 31^F

04/11 07:22, 31^F

‣ 返回看板[ Stock ] 學術

‣ 更多 aPplAus 的文章

文章代碼(AID): #1c5eXazN (Stock)

討論串 (同標題文章)

以下文章回應了本文：

新聞

2

10

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」 Re: 聯發科AI平台MediaTek DaVinci「達哥」已刪文

3周前, 04/11

完整討論串 (本文為第 2 之 3 篇)：

排序：最舊先 | 最新先 | 留言數

新聞

41

64

[新聞] 聯發科AI平台MediaTek DaVinci「達哥」聯發科AI平台MediaTek DaVinci「達哥」

3周前, 04/09

新聞

18

31

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」 Re: 聯發科AI平台MediaTek DaVinci「達哥」

3周前, 04/10

新聞

2

10

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」 Re: 聯發科AI平台MediaTek DaVinci「達哥」已刪文

3周前, 04/11

在新視窗開啟完整討論串 (共3篇)

‣ 返回看板[ Stock ] 學術

‣ 更多 aPplAus 的文章

文章代碼(AID): #1c5eXazN (Stock)