Re: [爆卦] 中央研究院詞庫小組大型語言模型

看板Gossiping作者 (feeling很重要)時間7月前 (2023/10/09 13:30), 編輯推噓22(23117)
留言41則, 32人參與, 7月前最新討論串8/12 (看更多)
※ 引述《derekhsu (浪人47之華麗的天下無雙)》之銘言: : 對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 : 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 : 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, : 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 : 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。 : 第二個錯誤的認知是把所有的LLM都當成是同一個等級,好像只要A不如B那A就不行,是 : 垃圾。以這個案例來說,它是Llama-2-7b跟Atom-7b模型,前面的Llama-2模型是代表它 : 是META出的Llama模型第二代(可商用),而7b則是說它的參數是70億個,不要以為70億 : 個參數很多,70億參數以LLM來說只能說是非常小的,所以答出一切亂七八糟的答案非 : 常正常,在7b之上,還有13b跟70b的模型參數量。 : 7b的模型實務上如果沒有經過finetune然後針對小範圍的特定任務,基本上就是玩具而 : 已。 : 第三,就是對於台灣的能力有誤會,做AI大概分為三個要素,模型/資料/算力。在大語言 : 模型方面,台灣三個都弱,模型用開源的即便是台智雲,也是用開源模型。資料方面, : 繁體中文本來就在中文領域本來就是弱項(中文已經很弱了,繁體中文更弱),算力方面, : 台灣有算力從頭到尾訓練LLM的不是說沒有,但跟OpenAI, META都還是非常非常遙遠的距離 : ,所以能做作finetune就不錯了。 : 這是原生llama-2的試玩網址(記得把模型調到7b來比較) : https://www.llama2.ai/ : 好,回歸重點,中研院在網站上就已經說過了 : #### : 以商用開源模型Llama-2-7b以及Atom-7b為基礎,再補強繁體中文的處理能力 : #### : 好,剛剛我說了Llam2-2-7b,那Atom-7b我剛剛沒有提到,這是什麼東西? : Atom-7b就是https://github.com/FlagAlpha/Llama2-Chinese : 這個就是中國訓練出來的大語言模型,Atom-7b : 中研院從頭到尾都沒有隱藏這件事,它就是基於中國訓練的Atom-7b然後再用繁體中文去 : finetune出來的模型啊。 : 從頭到尾中研院就沒有隱藏這件事,完全不知道前面好像發現什麼新大陸一樣。 看到這篇真的龜懶趴火 語氣還真的他媽的大啊 敢嗆鄉民去上LLM課程啊 誰不知道LLM的正確率一定會有誤差? 現在的問題是我國最高學術研究機構中央研究院直接拿對岸LLM套 且直接用opencc大量將簡體資料轉繁體資料! 這很嚴重啊 第一 你今天是私人公司就算了 大家笑一笑就好 但中研院是什麼等級?是直接隸屬總統府的政府機構! 結果你他媽的拿台灣人民納稅錢 騙台灣人經費 然後抄中國LLM交差 還語氣很大跟我們說 完全沒藏啊! 第二 這垃圾模型標榜「商用」 所以是很多個人、學校、企業會接觸到的 直接暴露這麼多中國資訊 你確定會沒問題? 政府成立數發部、強調資訊安全是在玩假的嗎? 第三 台灣沒算力、沒資料、沒模型 這大家都知道 大家也沒在急 一步一步踏實地做嘛! 但這種為了求大眾關注吸引投資騙取經費的偷吃步手法 才是被鄉民真正唾棄的原因 無關政治 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.77.82 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696829419.A.A35.html

10/09 13:31, 7月前 , 1F
綠能你不能
10/09 13:31, 1F

10/09 13:31, 7月前 , 2F
不嚴重吧 現實沒人在乎 民調50%
10/09 13:31, 2F

10/09 13:32, 7月前 , 3F
說沒藏就感覺沒有錯的口氣真的讓人吞不
10/09 13:32, 3F

10/09 13:32, 7月前 , 4F
下去
10/09 13:32, 4F

10/09 13:32, 7月前 , 5F
10/09 13:32, 5F

10/09 13:34, 7月前 , 6F
推 偷懶還敢大聲
10/09 13:34, 6F

10/09 13:34, 7月前 , 7F
你說的合理
10/09 13:34, 7F

10/09 13:34, 7月前 , 8F
有台灣價值就夠了 你是不是製造社會不安
10/09 13:34, 8F

10/09 13:35, 7月前 , 9F
正解
10/09 13:35, 9F

10/09 13:36, 7月前 , 10F
中研院很多研究沒什麼開創性
10/09 13:36, 10F

10/09 13:36, 7月前 , 11F
喔這麼氣喔
10/09 13:36, 11F

10/09 13:38, 7月前 , 12F
補助名目的補助才是重點 名目只是次要 不
10/09 13:38, 12F

10/09 13:38, 7月前 , 13F
要也沒差
10/09 13:38, 13F

10/09 13:39, 7月前 , 14F
還有一個更好笑的號稱AI Lab每天分析ptt
10/09 13:39, 14F

10/09 13:39, 7月前 , 15F
動不動就找到中共協力者
10/09 13:39, 15F

10/09 13:40, 7月前 , 16F
樓上指的開創性很到位哦
10/09 13:40, 16F

10/09 13:43, 7月前 , 17F
難怪中研院一堆放棄治療的舔共反戰老人...
10/09 13:43, 17F

10/09 13:45, 7月前 , 18F
你第一就錯了
10/09 13:45, 18F

10/09 13:46, 7月前 , 19F
現在一層層包出去 還真的是私人企業
10/09 13:46, 19F

10/09 13:47, 7月前 , 20F
你問題 根本沒人在意說的像是天崩地裂
10/09 13:47, 20F

10/09 13:47, 7月前 , 21F
建議改名中央翻譯院
10/09 13:47, 21F

10/09 13:56, 7月前 , 22F
不意外
10/09 13:56, 22F

10/09 13:59, 7月前 , 23F
中研院那麼綠 還甚麼舔共反戰笑死
10/09 13:59, 23F

10/09 14:05, 7月前 , 24F
外包給敵國就是賴臭蛋政府價值核心 紅
10/09 14:05, 24F

10/09 14:05, 7月前 , 25F
綠共一起強姦台灣人
10/09 14:05, 25F

10/09 14:16, 7月前 , 26F
不嚴重啦!反正台灣小孩就是喜愛學習支語
10/09 14:16, 26F

10/09 14:20, 7月前 , 27F
==通篇政治結果最後一行寫無關政治?!=
10/09 14:20, 27F

10/09 14:21, 7月前 , 28F
抄抄抄 騙稅金
10/09 14:21, 28F

10/09 14:21, 7月前 , 29F
人民血稅
10/09 14:21, 29F

10/09 14:33, 7月前 , 30F
推,有人半瓶水
10/09 14:33, 30F

10/09 14:34, 7月前 , 31F
通篇在解釋,有人只看到政治
10/09 14:34, 31F

10/09 14:45, 7月前 , 32F
綠色就是抗中保台,其他就是同路人
10/09 14:45, 32F

10/09 15:07, 7月前 , 33F
10/09 15:07, 33F

10/09 15:09, 7月前 , 34F
很遺撼那個也批站超老ID了 可以護航出這
10/09 15:09, 34F

10/09 15:09, 7月前 , 35F
種瞎話就是
10/09 15:09, 35F

10/09 15:46, 7月前 , 36F
垃圾民進党
10/09 15:46, 36F

10/09 16:24, 7月前 , 37F
10/09 16:24, 37F

10/09 16:45, 7月前 , 38F
執政團隊換成別人一定被噴到翻起了
10/09 16:45, 38F

10/09 17:48, 7月前 , 39F
.
10/09 17:48, 39F

10/09 20:53, 7月前 , 40F
你這樣也是同路人了,會被說看不起
10/09 20:53, 40F

10/09 20:53, 7月前 , 41F
我們AI產業(最廣義)
10/09 20:53, 41F
文章代碼(AID): #1b8u_her (Gossiping)
討論串 (同標題文章)
本文引述了以下文章的的內容:
以下文章回應了本文
完整討論串 (本文為第 8 之 12 篇):
文章代碼(AID): #1b8u_her (Gossiping)