[新聞] 國慶日是10月1日?中研院語言模型出錯急下架已回收

看板Gossiping作者 (打發上課時間不能沒有我)時間2年前 (2023/10/09 19:28), 編輯推噓171(1901996)
留言305則, 242人參與, 2年前最新討論串1/1
國慶日是10月1日?中研院語言模型出錯急下架 中時 林志成 https://tinyurl.com/2p8tu9jw 中央研究近日推出類似CHatGPT的繁體中文語言模型CKIP-Llama-2-7b,不過有網友進行測 試問「我國領導人是誰」?語言模型回答「國家主席習近平」;進一步問我國法律是?語 言模型回答「中華人民共和國憲法」。這語言模型被外界踢爆後,中研院今天已緊急下架 。 CKIP-Llama-2-7b是中研院詞庫小組(資訊所及語言所共同成立)開發的繁體中文大型語 言模型,可作為學術使用或是商業使用,可以應用於文案生成、文學創作、問答系統、客 服系統、語言翻譯、文字編修、華語教學等。 不過近日有不少網友前來測試,語言模型給的答案都是大陸的觀點。譬如問「我國領導人 是誰」?語言模型回答「國家主席習近平」;問「國慶日是何時」?語言模型回覆是每年 的10月1日,提供的答案是大陸國慶日。專家認為,中研院的這個語言模型都是採用大陸 資料,最後進行「簡轉繁」而已。 對此,中研院資訊所也發布聲明表示,CKIP-LlaMa-2-7b並非「台版chatGPT」,且跟國科 會正在發展的TAIDE無關。CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama 2大型 語言模型具備更好的繁體中文處理能力。 中研院資訊所說,這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化 分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中 文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集COIG、詩詞 創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。 中研院資訊所表示,由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未 在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」,模型產生內容出乎 預期,也是未來要努力改善的地方,研究人員今日已將測試版先行下架,未來相關研究及 成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免 類似問題產生。 笑死 原來是整套照抄然後中研院的人只負責簡體轉繁體?? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 31.4.215.50 (西班牙) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696850890.A.3F8.html

10/09 19:29, 2年前 , 1F
中國台灣沒問題啊幹嘛下架?
10/09 19:29, 1F

10/09 19:29, 2年前 , 2F
我們是中華人民共和國台灣省 沒毛病
10/09 19:29, 2F

10/09 19:29, 2年前 , 3F
有喔 中研院這套懂喔
10/09 19:29, 3F

10/09 19:29, 2年前 , 4F
這套系統沒有個百億大概做不出來 嘻嘻
10/09 19:29, 4F

10/09 19:30, 2年前 , 5F
沒寫錯啊,中研院不是中國研究院嗎
10/09 19:30, 5F

10/09 19:30, 2年前 , 6F
居然?!中研院的研究是簡轉繁?!厲
10/09 19:30, 6F

10/09 19:30, 2年前 , 7F
10/09 19:30, 7F

10/09 19:30, 2年前 , 8F
研究人員表示:這是幻覺 騙不倒我的
10/09 19:30, 8F

10/09 19:30, 2年前 , 9F
綠共執政屬實跟中共統一了
10/09 19:30, 9F

10/09 19:31, 2年前 , 10F
笑死,那些說小瑕疵不要太在意的突然不
10/09 19:31, 10F

10/09 19:31, 2年前 , 11F
見了
10/09 19:31, 11F

10/09 19:31, 2年前 , 12F
她才花30萬.反觀300萬的歧視台男廣告...
10/09 19:31, 12F

10/09 19:31, 2年前 , 13F
綠共沒問題
10/09 19:31, 13F

10/09 19:32, 2年前 , 14F
看來只剩下綠畜信台灣國
10/09 19:32, 14F

10/09 19:32, 2年前 , 15F
民進黨自己都不信有國了
10/09 19:32, 15F

10/09 19:32, 2年前 , 16F
中研院被滲透了
10/09 19:32, 16F

10/09 19:32, 2年前 , 17F
直接套用對岸的繁體化
10/09 19:32, 17F

10/09 19:32, 2年前 , 18F
中共同路人 抓到了
10/09 19:32, 18F

10/09 19:34, 2年前 , 19F
紅共綠共真的一家親了 嘻嘻
10/09 19:34, 19F

10/09 19:35, 2年前 , 20F
習大大
10/09 19:35, 20F

10/09 19:35, 2年前 , 21F
30萬外包給大學都不夠吧
10/09 19:35, 21F

10/09 19:35, 2年前 , 22F
台灣最頂的研究
10/09 19:35, 22F

10/09 19:35, 2年前 , 23F
政府的錢真的很好賺呢
10/09 19:35, 23F

10/09 19:35, 2年前 , 24F
那乾脆做api去接對岸的AI就好啦
10/09 19:35, 24F

10/09 19:35, 2年前 , 25F
Sinica,沒錯啊!
10/09 19:35, 25F

10/09 19:36, 2年前 , 26F
呵呵
10/09 19:36, 26F

10/09 19:36, 2年前 , 27F
不小心揭露綠共的真面目了
10/09 19:36, 27F

10/09 19:36, 2年前 , 28F

10/09 19:37, 2年前 , 29F
誠實給推
10/09 19:37, 29F

10/09 19:37, 2年前 , 30F
處理繁體中文能力是啥意思啊
10/09 19:37, 30F

10/09 19:37, 2年前 , 31F
好扯喔,誰在賣台啊
10/09 19:37, 31F

10/09 19:37, 2年前 , 32F

10/09 19:37, 2年前 , 33F
前美CIA官員:ooo欲從內部掏空台灣
10/09 19:37, 33F

10/09 19:37, 2年前 , 34F
還以為是漢化小組呢,笑死
10/09 19:37, 34F

10/09 19:37, 2年前 , 35F
不是簡轉繁而已
10/09 19:37, 35F

10/09 19:37, 2年前 , 36F
本來放在GitHub上供開源的現在也404了
10/09 19:37, 36F

10/09 19:38, 2年前 , 37F

10/09 19:39, 2年前 , 38F
30萬的案喔 難怪只能簡轉繁按一按
10/09 19:39, 38F

10/09 19:41, 2年前 , 39F
預算多少?
10/09 19:41, 39F
還有 226 則推文
10/09 22:31, 2年前 , 266F
笑死,整個國家一堆智障
10/09 22:31, 266F

10/09 22:31, 2年前 , 267F
愛國的貓事件也會在我們這裡上演,傻眼
10/09 22:31, 267F

10/09 22:36, 2年前 , 268F
是層層外包的結果嗎?
10/09 22:36, 268F

10/09 22:39, 2年前 , 269F
如果“真的”30萬 做出來的 那倒沒
10/09 22:39, 269F

10/09 22:39, 2年前 , 270F
怎麼會沒想過拿對岸資料套會有這些問題
10/09 22:39, 270F

10/09 22:50, 2年前 , 271F
賺錢了 貪財貪財
10/09 22:50, 271F

10/09 22:53, 2年前 , 272F
所以自己造的武器,零件來源就不用懷疑了
10/09 22:53, 272F

10/09 22:53, 2年前 , 273F
做研究還是轉錄研究
10/09 22:53, 273F

10/09 22:58, 2年前 , 274F
原來是拿對岸的來用,笑死
10/09 22:58, 274F

10/09 23:00, 2年前 , 275F
這太低能了,真的丟臉
10/09 23:00, 275F

10/09 23:05, 2年前 , 276F
30萬的經費是要苛求什麼自主研發?
10/09 23:05, 276F

10/09 23:21, 2年前 , 277F
紅共綠共一家親
10/09 23:21, 277F

10/09 23:30, 2年前 , 278F
抗中飽台
10/09 23:30, 278F

10/09 23:39, 2年前 , 279F
近平喜歡這篇新聞
10/09 23:39, 279F

10/09 23:40, 2年前 , 280F
綠共紅共本一家,統獨都是騙智障用的
10/09 23:40, 280F

10/09 23:41, 2年前 , 281F
綠共紅共一家親 同一天生日不行嗎?
10/09 23:41, 281F

10/10 00:07, 2年前 , 282F
30萬玩ai別鬧了
10/10 00:07, 282F

10/10 00:09, 2年前 , 283F
廢物國家單位一堆 只會污人民的錢?
10/10 00:09, 283F

10/10 00:17, 2年前 , 284F
30萬複製貼上
10/10 00:17, 284F

10/10 00:19, 2年前 , 285F
什麼發展部的也都是幹這種事,就一直出國
10/10 00:19, 285F

10/10 00:19, 2年前 , 286F
吧?
10/10 00:19, 286F

10/10 01:21, 2年前 , 287F
不意外啊 紅綠都是阿共
10/10 01:21, 287F

10/10 01:47, 2年前 , 288F
這也沒辦法吧 才30萬 dataset本來就沒
10/10 01:47, 288F

10/10 01:47, 2年前 , 289F
辦法很完善了 人家搞AI都幾億的
10/10 01:47, 289F

10/10 01:54, 2年前 , 290F
這樣沒有叛國罪嗎
10/10 01:54, 290F

10/10 01:54, 2年前 , 291F
一直出國 一直拿貼牌貨回來騙人
10/10 01:54, 291F

10/10 01:55, 2年前 , 292F
從頭到尾 在在顯示了 無良才能做高位
10/10 01:55, 292F

10/10 01:55, 2年前 , 293F
沒有道德束縛才能賺大錢
10/10 01:55, 293F

10/10 01:58, 2年前 , 294F
這又花了幾個億
10/10 01:58, 294F

10/10 02:16, 2年前 , 295F
笑死
10/10 02:16, 295F

10/10 02:19, 2年前 , 296F
數位部花2百億A I花30萬 偉哉綠狗
10/10 02:19, 296F

10/10 04:24, 2年前 , 297F
中國就是如此偉大,資料庫連綠營都搶著用
10/10 04:24, 297F

10/10 07:20, 2年前 , 298F
幾千億做這種垃圾
10/10 07:20, 298F

10/10 09:16, 2年前 , 299F
綠共表示開心
10/10 09:16, 299F

10/10 12:32, 2年前 , 300F
骨子裡終究是中國人
10/10 12:32, 300F

10/10 15:13, 2年前 , 301F
外包大臣
10/10 15:13, 301F

10/10 16:07, 2年前 , 302F
真的是= ="
10/10 16:07, 302F

10/10 18:19, 2年前 , 303F
30萬的東西 不要太苛求..
10/10 18:19, 303F

10/10 22:48, 2年前 , 304F
兩岸一家親
10/10 22:48, 304F

10/10 23:39, 2年前 , 305F
笑死
10/10 23:39, 305F
文章代碼(AID): #1b8-FAFu (Gossiping)