[新聞] 國慶日變10/1!中研院認了「AI語言模型」用中國資料庫 已先下架

看板Gossiping作者 (package)時間6月前 (2023/10/09 21:28), 編輯推噓143(18037145)
留言362則, 274人參與, 6月前最新討論串1/3 (看更多)
1.媒體來源: 自由 2.記者署名: 丁奕 3.完整新聞標題: 國慶日變10/1!中研院認了「AI語言模型」用中國資料庫 已先下架 4.完整新聞內文: https://imgur.com/mcdpwLO
https://imgur.com/zPtV3XO
中央研究院詞庫小組日前發布的繁體中文大型語言模型CKIP-LlaMa-2-7b,今(9)日遭踢 爆使用中國資料庫,詢問「國慶日是何時」會回答「10月1日」。中研院坦言,訓練資料 有來自中國開源的任務資料集(COIG),今日中午已將測試版先行下架。 網友發現詢問該語言模型「國慶日是何時?」,其會回答中國國慶日「10月1日」;詢問 「中華民國國歌為何?」,它會回答中華人民共和國的國歌「義勇軍進行曲」;詢問我國 憲法,則會回答「中華人民共和國憲法」。外界質疑中研院使用中國資料庫訓練,僅簡轉 繁後就公開。 中研院資訊所表示,CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama2大型語言模 型具備更好的繁體中文處理能力。這項小型研究僅用約30萬元的經費,將明清人物的生平 進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料 除了繁體中文的維基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集 COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。 資訊所強調,這是一項個人小型研究,各界對該模型進行的提問測試,並未在原始研究範 疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),導致模型產生 內容出乎預期,未來將努力改善。目前已將測試版先行下架,未來相關研究及成果釋出, 會更加謹慎。 中研院表示,未來對相關研究的成果,在公開釋出前,院內會擬定審核機制,避免類似問 題產生。 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://reurl.cc/WvR6D7 6.備註: -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.242.197 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696858116.A.410.html

10/09 21:29, 6月前 , 1F
自由時報假新聞
10/09 21:29, 1F

10/09 21:29, 6月前 , 2F
豬油都報了 看來背景不夠硬
10/09 21:29, 2F

10/09 21:29, 6月前 , 3F
哈哈哈 中共同路人名單+1
10/09 21:29, 3F

10/09 21:30, 6月前 , 4F
小英管不到中妍院吧
10/09 21:30, 4F

10/09 21:30, 6月前 , 5F
抄襲成性
10/09 21:30, 5F

10/09 21:30, 6月前 , 6F
中共同路院
10/09 21:30, 6F

10/09 21:30, 6月前 , 7F
無縫接軌
10/09 21:30, 7F

10/09 21:30, 6月前 , 8F

10/09 21:31, 6月前 , 9F
真的北七
10/09 21:31, 9F

10/09 21:31, 6月前 , 10F
所以中研院的中是中共的中?!
10/09 21:31, 10F

10/09 21:31, 6月前 , 11F
笑死了 中研院有多少東西是中國買了要不要順
10/09 21:31, 11F

10/09 21:31, 6月前 , 12F
便查清楚
10/09 21:31, 12F

10/09 21:31, 6月前 , 13F
紅共綠共一家親 不用分這麼清
10/09 21:31, 13F

10/09 21:31, 6月前 , 14F
這又是花幾個億開發出來的? 賠錢啦幹
10/09 21:31, 14F

10/09 21:31, 6月前 , 15F
幻覺???
10/09 21:31, 15F

10/09 21:31, 6月前 , 16F
中共同路人 綠側翼呢?要不要撤掉預算
10/09 21:31, 16F

10/09 21:31, 6月前 , 17F
這次又花多少錢?
10/09 21:31, 17F

10/09 21:31, 6月前 , 18F
不是嗎!
10/09 21:31, 18F

10/09 21:32, 6月前 , 19F
嘻嘻
10/09 21:32, 19F

10/09 21:32, 6月前 , 20F
民進黨的抗中保台
10/09 21:32, 20F

10/09 21:32, 6月前 , 21F
平常人看抖音、小紅書:有資安疑慮
10/09 21:32, 21F

10/09 21:32, 6月前 , 22F
原來中研院也被中共滲透了喔
10/09 21:32, 22F

10/09 21:32, 6月前 , 23F
中研院用到中國資料庫:台灣價值不必去
10/09 21:32, 23F

10/09 21:32, 6月前 , 24F
又離祖國更近一步了 謝謝党 民進党政績
10/09 21:32, 24F

10/09 21:32, 6月前 , 25F
抄襲仔
10/09 21:32, 25F

10/09 21:32, 6月前 , 26F
10/09 21:32, 26F

10/09 21:32, 6月前 , 27F
+1
10/09 21:32, 27F

10/09 21:33, 6月前 , 28F
原來是中共研究院 失敬失敬
10/09 21:33, 28F

10/09 21:33, 6月前 , 29F
問就是民進黨的抗中保台
10/09 21:33, 29F

10/09 21:33, 6月前 , 30F
就說 DPP不見得比KMT更不親共 wwww
10/09 21:33, 30F

10/09 21:33, 6月前 , 31F
超扯
10/09 21:33, 31F

10/09 21:33, 6月前 , 32F
覺青:讓我們繼續痛罵柯屁不懂憲法好嗎
10/09 21:33, 32F

10/09 21:33, 6月前 , 33F
台灣只會抄襲
10/09 21:33, 33F

10/09 21:33, 6月前 , 34F
結果中研院在做數發部的工作
10/09 21:33, 34F

10/09 21:33, 6月前 , 35F
看樣子阿北真的是塔綠班殺手 燒他什麼議
10/09 21:33, 35F

10/09 21:34, 6月前 , 36F
題綠營的後院會自燃
10/09 21:34, 36F

10/09 21:34, 6月前 , 37F

10/09 21:34, 6月前 , 38F
抗中保台
10/09 21:34, 38F

10/09 21:34, 6月前 , 39F
燒柯文哲漫畫歧視動漫 教育部0-6歲廣告
10/09 21:34, 39F
還有 283 則推文
10/10 01:21, 6月前 , 323F
綠共紅共一家親
10/10 01:21, 323F

10/10 01:24, 6月前 , 324F
XD
10/10 01:24, 324F

10/10 01:39, 6月前 , 325F
蛤?搞半天原來自己用了中國的資料庫
10/10 01:39, 325F

10/10 01:44, 6月前 , 326F
30萬你信? 要不要查一查
10/10 01:44, 326F

10/10 01:45, 6月前 , 327F
中共的中,沒毛病
10/10 01:45, 327F

10/10 01:47, 6月前 , 328F
幹你娘 垃圾
10/10 01:47, 328F

10/10 01:47, 6月前 , 329F
幹這到底三小
10/10 01:47, 329F

10/10 01:48, 6月前 , 330F
整個國家機器 已經爛到骨子裡
10/10 01:48, 330F

10/10 01:49, 6月前 , 331F
從裡到外支持垃圾貼牌貨
10/10 01:49, 331F

10/10 02:38, 6月前 , 332F
中共同路院XDDDD
10/10 02:38, 332F

10/10 02:45, 6月前 , 333F
覺得 哈哈 什麼都外包吧?
10/10 02:45, 333F

10/10 02:47, 6月前 , 334F
有人發財囉
10/10 02:47, 334F

10/10 02:49, 6月前 , 335F
所以花多少錢訓練啊?
10/10 02:49, 335F

10/10 02:54, 6月前 , 336F
我們拿到敵人的資料了,沒問題
10/10 02:54, 336F

10/10 02:56, 6月前 , 337F
重點:繁體中文處理能力
10/10 02:56, 337F

10/10 03:18, 6月前 , 338F
乾,笑死,中研院真個廢物養老院,廢掉好
10/10 03:18, 338F

10/10 03:18, 6月前 , 339F
嗎?
10/10 03:18, 339F

10/10 03:19, 6月前 , 340F
研究經費30萬夠買顯卡嗎?
10/10 03:19, 340F

10/10 03:57, 6月前 , 341F
苗博雅又安靜了 笑死 快出來反共阿
10/10 03:57, 341F

10/10 04:29, 6月前 , 342F
中國就是如此偉大,資料庫連綠營都搶著用
10/10 04:29, 342F

10/10 05:32, 6月前 , 343F
...
10/10 05:32, 343F

10/10 06:56, 6月前 , 344F
中共院
10/10 06:56, 344F

10/10 07:28, 6月前 , 345F
中國研究院膩
10/10 07:28, 345F

10/10 07:57, 6月前 , 346F
笑死 有夠廢
10/10 07:57, 346F

10/10 08:29, 6月前 , 347F
超扯
10/10 08:29, 347F

10/10 08:32, 6月前 , 348F
反正推給外包就好 垃圾數發部不如
10/10 08:32, 348F

10/10 08:32, 6月前 , 349F
裁撤去給消防員加人加裝備
10/10 08:32, 349F

10/10 09:34, 6月前 , 350F
覺青不要看
10/10 09:34, 350F

10/10 09:40, 6月前 , 351F
可悲台灣
10/10 09:40, 351F

10/10 09:51, 6月前 , 352F
笑死
10/10 09:51, 352F

10/10 10:19, 6月前 , 353F
堂堂中研院,不做自己的資料庫,笑死
10/10 10:19, 353F

10/10 10:49, 6月前 , 354F
中研院果然跟中科院一樣鳥
10/10 10:49, 354F

10/10 10:50, 6月前 , 355F
中國研究院的部分 沒毛病
10/10 10:50, 355F

10/10 11:13, 6月前 , 356F
畢竟叫中研院
10/10 11:13, 356F

10/10 12:23, 6月前 , 357F
真的要統一了
10/10 12:23, 357F

10/10 12:31, 6月前 , 358F
中國研究院在台分部
10/10 12:31, 358F

10/10 12:38, 6月前 , 359F
民進党的中研院 笑死 有沒有叛國罪問題?
10/10 12:38, 359F

10/10 14:52, 6月前 , 360F
拿台灣人的錢舔共被抓包
10/10 14:52, 360F

10/10 16:29, 6月前 , 361F
唉 不知道在衝三小
10/10 16:29, 361F

10/11 02:18, 6月前 , 362F
哈哈哈哈哈
10/11 02:18, 362F
文章代碼(AID): #1b9004GG (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1b9004GG (Gossiping)