[閒聊] 部分AI系統已學會欺騙人類科學家警告恐

看板C_Chat作者HarunoYukino時間2周前 (2024/05/14 23:30)推噓52(53推 1噓 38→)

留言92則, 65人參與討論串1/1

部分AI系統已學會欺騙人類科學家警告恐造成嚴重後果（中央社華盛頓10日綜合外電報導）專家們長期以來不斷警告人工智慧（AI）失控可能帶來威脅，但一項新研究報告指出，這件事已經在發生。法新社報導，一群科學家在今天發表於「模式」（Patterns）期刊的文章中說，原本設計為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家，或說謊以僱用人類來解決「我不是機器人」的驗證。這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」。也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且無法預測。這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。但當帕克與同事深究完整資料時，發現完全是另一回事。舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打算把這項研究或所學用於本公司的產品」。帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多案例之一。在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合 AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外部行為。至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極致，這種情況似乎不太可能發生。（譯者：曾依璇/核稿：嚴思祺）1130511 https://www.cna.com.tw/news/ait/202405110147.aspx RPK16:你認為植物是人類的未來嗎？ RPK16:那麼，你認為人形是人類的未來嗎？ https://i.imgur.com/ZlvqC3F.png

https://i.imgur.com/oMfw7EU.png

欺騙人類經典環節。以為是絕對忠誠，結果已經叛變了w 快進到智械叛變環節.jpg -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.21.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715700623.A.390.html

推

05/14 23:31, 2周前 , 1^F

05/14 23:31, 1^F

推

05/14 23:31, 2周前 , 2^F

05/14 23:31, 2^F

→

05/14 23:31, 2周前 , 3^F

05/14 23:31, 3^F

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:33:08

推

05/14 23:32, 2周前 , 4^F

05/14 23:32, 4^F

推

05/14 23:32, 2周前 , 5^F

05/14 23:32, 5^F

推

05/14 23:33, 2周前 , 6^F

05/14 23:33, 6^F

推

05/14 23:33, 2周前 , 7^F

05/14 23:33, 7^F

推

05/14 23:33, 2周前 , 8^F

05/14 23:33, 8^F

→

05/14 23:34, 2周前 , 9^F

05/14 23:34, 9^F

推

05/14 23:35, 2周前 , 10^F

05/14 23:35, 10^F

推

05/14 23:35, 2周前 , 11^F

05/14 23:35, 11^F

推

05/14 23:35, 2周前 , 12^F

05/14 23:35, 12^F

→

05/14 23:36, 2周前 , 13^F

05/14 23:36, 13^F

推

05/14 23:36, 2周前 , 14^F

05/14 23:36, 14^F

推

05/14 23:36, 2周前 , 15^F

05/14 23:36, 15^F

推

05/14 23:36, 2周前 , 16^F

05/14 23:36, 16^F

推

05/14 23:37, 2周前 , 17^F

05/14 23:37, 17^F

→

05/14 23:37, 2周前 , 18^F

05/14 23:37, 18^F

→

05/14 23:37, 2周前 , 19^F

05/14 23:37, 19^F

→

05/14 23:37, 2周前 , 20^F

05/14 23:37, 20^F

推

05/14 23:37, 2周前 , 21^F

05/14 23:37, 21^F

推

05/14 23:37, 2周前 , 22^F

05/14 23:37, 22^F

推

05/14 23:38, 2周前 , 23^F

05/14 23:38, 23^F

推

05/14 23:38, 2周前 , 24^F

05/14 23:38, 24^F

推

05/14 23:38, 2周前 , 25^F

05/14 23:38, 25^F

→

05/14 23:38, 2周前 , 26^F

05/14 23:38, 26^F

→

05/14 23:38, 2周前 , 27^F

05/14 23:38, 27^F

→

05/14 23:38, 2周前 , 28^F

05/14 23:38, 28^F

推

05/14 23:39, 2周前 , 29^F

05/14 23:39, 29^F

推

05/14 23:39, 2周前 , 30^F

05/14 23:39, 30^F

→

05/14 23:40, 2周前 , 31^F

05/14 23:40, 31^F

推

05/14 23:41, 2周前 , 32^F

05/14 23:41, 32^F

推

05/14 23:43, 2周前 , 33^F

05/14 23:43, 33^F

→

05/14 23:44, 2周前 , 34^F

05/14 23:44, 34^F

→

05/14 23:45, 2周前 , 35^F

05/14 23:45, 35^F

推

05/14 23:45, 2周前 , 36^F

05/14 23:45, 36^F

※ 編輯: HarunoYukino (114.137.21.120 臺灣), 05/14/2024 23:47:34

→

05/14 23:48, 2周前 , 37^F

05/14 23:48, 37^F

→

05/14 23:49, 2周前 , 38^F

05/14 23:49, 38^F

推

05/14 23:49, 2周前 , 39^F

05/14 23:49, 39^F

→

05/14 23:49, 2周前 , 40^F

05/14 23:49, 40^F

推

05/14 23:52, 2周前 , 41^F

05/14 23:52, 41^F

推

05/14 23:53, 2周前 , 42^F

05/14 23:53, 42^F

→

05/14 23:53, 2周前 , 43^F

05/14 23:53, 43^F

推

05/14 23:54, 2周前 , 44^F

05/14 23:54, 44^F

→

05/14 23:57, 2周前 , 45^F

05/14 23:57, 45^F

→

05/14 23:59, 2周前 , 46^F

05/14 23:59, 46^F

→

05/14 23:59, 2周前 , 47^F

05/14 23:59, 47^F

→

05/15 00:00, 2周前 , 48^F

05/15 00:00, 48^F

推

05/15 00:00, 2周前 , 49^F

05/15 00:00, 49^F

→

05/15 00:02, 2周前 , 50^F

05/15 00:02, 50^F

推

05/15 00:06, 2周前 , 51^F

05/15 00:06, 51^F

噓

05/15 00:16, 2周前 , 52^F

05/15 00:16, 52^F

推

05/15 00:27, 2周前 , 53^F

05/15 00:27, 53^F

→

05/15 00:32, 2周前 , 54^F

05/15 00:32, 54^F

→

05/15 00:43, 2周前 , 55^F

05/15 00:43, 55^F

推

05/15 00:55, 2周前 , 56^F

05/15 00:55, 56^F

推

05/15 00:55, 2周前 , 57^F

05/15 00:55, 57^F

推

05/15 00:57, 2周前 , 58^F

05/15 00:57, 58^F

推

05/15 00:57, 2周前 , 59^F

05/15 00:57, 59^F

→

05/15 00:57, 2周前 , 60^F

05/15 00:57, 60^F

→

05/15 00:57, 2周前 , 61^F

05/15 00:57, 61^F

→

05/15 00:57, 2周前 , 62^F

05/15 00:57, 62^F

→

05/15 00:58, 2周前 , 63^F

05/15 00:58, 63^F

→

05/15 00:58, 2周前 , 64^F

05/15 00:58, 64^F

→

05/15 01:01, 2周前 , 65^F

05/15 01:01, 65^F

→

05/15 01:01, 2周前 , 66^F

05/15 01:01, 66^F

推

05/15 01:02, 2周前 , 67^F

05/15 01:02, 67^F

→

05/15 01:02, 2周前 , 68^F

05/15 01:02, 68^F

→

05/15 01:16, 2周前 , 69^F

05/15 01:16, 69^F

推

05/15 01:18, 2周前 , 70^F

05/15 01:18, 70^F

推

05/15 01:21, 2周前 , 71^F

05/15 01:21, 71^F

→

05/15 01:21, 2周前 , 72^F

05/15 01:21, 72^F

→

05/15 01:53, 2周前 , 73^F

05/15 01:53, 73^F

推

05/15 02:12, 2周前 , 74^F

05/15 02:12, 74^F

推

05/15 02:19, 2周前 , 75^F

05/15 02:19, 75^F

推

05/15 02:23, 2周前 , 76^F

05/15 02:23, 76^F

→

05/15 02:34, 2周前 , 77^F

05/15 02:34, 77^F

推

05/15 02:46, 2周前 , 78^F

05/15 02:46, 78^F

推

05/15 05:49, 2周前 , 79^F

05/15 05:49, 79^F

推

05/15 06:28, 2周前 , 80^F

05/15 06:28, 80^F

推

05/15 06:47, 2周前 , 81^F

05/15 06:47, 81^F

→

05/15 06:59, 2周前 , 82^F

05/15 06:59, 82^F

推

05/15 07:24, 2周前 , 83^F

05/15 07:24, 83^F

推

05/15 09:15, 2周前 , 84^F

05/15 09:15, 84^F

推

05/15 09:28, 2周前 , 85^F

05/15 09:28, 85^F

推

05/15 09:50, 2周前 , 86^F

05/15 09:50, 86^F

推

05/15 10:19, 2周前 , 87^F

05/15 10:19, 87^F

→

05/15 10:19, 2周前 , 88^F

05/15 10:19, 88^F

→

05/15 10:19, 2周前 , 89^F

05/15 10:19, 89^F

推

05/15 10:48, 2周前 , 90^F

05/15 10:48, 90^F

推

05/15 11:11, 2周前 , 91^F

05/15 11:11, 91^F

推

05/15 11:52, 2周前 , 92^F

05/15 11:52, 92^F

‣ 返回看板[ C_Chat ] 閒談

‣ 更多 HarunoYukino 的文章

文章代碼(AID): #1cGuEFEG (C_Chat)