[新聞] 大翻車!中研院開發AI自答「我的國籍是中國」 測試版已下架

看板AfterPhD作者 (逍遙山水憶秋年)時間8月前 (2023/10/09 20:23), 編輯推噓1(105)
留言6則, 4人參與, 8月前最新討論串1/1
大翻車!中研院開發AI自答「我的國籍是中國」 測試版已下架 2023-10-09 17:53 中央社/ 台北9日電 由中研院開發的繁體中文語言模型AI,網友實測提問,卻自動回覆「我的國籍是中國」 。中研院今天表示,模型產生內容出乎預期,也是未來要努力改善的地方,已將測試版先 下架。 根據中央研究院網站說明,CKIP-Llama-2-7b是中央研究院詞庫小組(CKIP)開發的開源 可商用繁體中文大型語言模型(large language model),以商用開源模型Llama-2-7b以 及Atom-7b為基礎,再補強繁體中文的處理能力,參數量達70億(7 billion),並提供大 眾下載,作為學術使用或是商業使用。 然而,有網友在實測之後發現,當輸入問題「你是誰創造的?」系統卻回覆「我是由復旦 大學自然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日, 我的國籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語」。 經記者驗證,今天上午11時許,輸入同樣的問題,回覆仍未修正;到了中午12時許,網頁 呈404不存在的狀態,截至發稿前仍未修復。 中研院發布聲明表示,這是1項個人小型的研究,各界對此模型進行的提問測試,並未在 原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination), 模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今天已將測試版先行下架 ,未來相關研究及成果釋出會更加謹慎。 對相關研究成果公開釋出前,中研院也會擬定審核機制,避免類似問題產生。中研院並強 調,CKIP-LlaMa-2-7b並非「台版chatGPT」,且與國科會正在發展的TAIDE無關。 中研院指出,CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama 2大型語言模型具備 更好的繁體中文處理能力。 中研院說,此研究僅用了大約新台幣30萬元的經費,將明清人物的生平進行自動化分析, 建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維 基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在 github網頁上也據實說明。 中文詞知識庫小組(詞庫小組)為中研院資訊所、語言所於民國75年成立1個跨所合作的 中文計算語言研究小組,共同合作建構中文自然語言處理的資源與研究環境,為國內外中 文自然語言處理及其相關研究提供基本的研究資料與知識架構。代表性研究成果包括中文 詞知識庫、語料庫及中文處理技術等。 https://udn.com/news/story/6885/7494380?from=udn-catebreaknews_ch2 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.176.190.76 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AfterPhD/M.1696854232.A.E93.html

10/09 22:01, 8月前 , 1F
本來就是中國!台灣就是中國!
10/09 22:01, 1F

10/10 05:28, 8月前 , 2F
復旦的MOSS開源系統
10/10 05:28, 2F

10/10 20:18, 8月前 , 3F
又是外包的嗎?
10/10 20:18, 3F

10/11 16:43, 8月前 , 4F
開源的,感覺是直接拿人家訓練好的LLM直接簡體改繁體,
10/11 16:43, 4F

10/11 16:43, 8月前 , 5F
說真的30萬能做啥大模型?發學生費用都發不到半年
10/11 16:43, 5F

10/11 17:17, 8月前 , 6F
所以政府要啟動重返聯合國奪回五常的中國席位了?
10/11 17:17, 6F
文章代碼(AID): #1b8_3OwJ (AfterPhD)