[新聞]訓練台版 AI 語言模型,許永真:盼讓百工百業商用

看板Tech_Job作者 (pl132)時間1年前 (2024/05/01 17:48), 編輯推噓1(434)
留言11則, 9人參與, 1年前最新討論串1/1
訓練台版 AI 語言模型,許永真:盼讓百工百業商用 https://technews.tw/2024/04/30/tw-ai-llm-taide/ 國科會去年 4 月啟動 TAIDE 計畫,研發台版大型繁中 AI 語言模型,台大資工系教授許 永真表示,TAIDE 是透過中文資料,訓練以英文為母語的 Llama 模型,「像在教美國長 大的 ABC 講中文」,已有初步成果,盼盡快讓台灣百工百業商用。 「2024年AI與資訊安全論壇」今天登場,台大資工系教授許永真以「台灣的AI與大型語言 模型(LLM)」為題發表演說。 為因應國際大型語言模型常產生資訊偏誤,或不符台灣文化與價值觀的回應,國科會去年 4月啟動TAIDE計畫,在Llama(Meta語言模型)原型基礎上,由國內學界專家發展及訓練 調校。 許永真為台灣AI卓越中心副總召集人,參與TAIDE計畫,今日論壇表示AI有資安風險,許 多人都擔心「所思所想、機敏資料外流」,讓大家對AI又愛又怕,甚至有人透過AI模型學 習,攻擊世界任何網站。 她援引哈佛法學教授雷席格所說「我們正處於AI的『歐本海默時刻』,好壞永遠並存」。 許永真也說,雖然要擔心資料外流問題,但更該正視台灣失去數位話語權、自主發展大模 型的機會,故一年前就與專家團隊建議台灣應建造自己的AI對話引擎,國科會指導下,成 功打造TAIDE可信任AI對話引擎。 她分享,TAIDE是站在巨人肩膀上,選擇以英文為母語的Llama模型,再透過中文資料繼續 訓練;許永真比喻「就像在教美國長大的ABC講中文」,透過英文基礎教育、中文基礎教 育、中學教育、高等教育等加強學習。 算力有限下,TAIDE去年6月成功完成第一階段展示,她表示,目標是成為商用模型,讓台 灣百工百業使用,條件包括基礎模型必須可商用,也要有充足可商用授權中文資料。 許永真分享,Meta去年7月推動可商用Llama 2,今年4月19日釋出Llama 3新大型語言模型 ,團隊僅用四天就完成模型訓練;接下來的挑戰是透過可商用中文資料訓練,目前有許多 中文授權資料量,也歡迎各界交流資源。 她強調,TAIDE不是要和各大語言模型抗衡匹敵,但希望供台灣中小企業甚至不願意資料 外流的金融業安全可靠的語言模型使用,也期待民間力量讓專案商轉,共同壯大。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.2.112 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1714556891.A.4DE.html

05/01 17:57, 1年前 , 1F
語言模型到了閩南族群手中會被偷渡成閩南話 標準排
05/01 17:57, 1F

05/01 17:57, 1年前 , 2F
外民族性
05/01 17:57, 2F

05/01 21:02, 1年前 , 3F
浪費國家資源
05/01 21:02, 3F

05/01 21:30, 1年前 , 4F
台大資工教授 用別人模型 難怪是三流學院
05/01 21:30, 4F

05/01 22:36, 1年前 , 5F
AI的
05/01 22:36, 5F

05/01 23:37, 1年前 , 6F
有種浪費電的感覺
05/01 23:37, 6F

05/02 00:38, 1年前 , 7F
台灣人只關注三餐飽啦
05/02 00:38, 7F

05/02 00:39, 1年前 , 8F
太可惜了
05/02 00:39, 8F

05/02 19:38, 1年前 , 9F
不如再加上RAG的功能不就更棒
05/02 19:38, 9F

05/02 20:35, 1年前 , 10F
選個語系人口少的語言訓練AI真的智O
05/02 20:35, 10F

05/03 18:25, 1年前 , 11F
真的是浪費錢 金融業一定是用微軟的solution
05/03 18:25, 11F
文章代碼(AID): #1cCW_RJU (Tech_Job)