[新聞] 超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心

看板Gossiping作者chadmu (噓之收集者查德姆)時間2月前 (2024/02/24 23:37)推噓84(86推 2噓 79→)

留言167則, 133人參與討論串1/1

超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心中時新聞網張威翔當人工智慧（AI）進行兵推和模擬外交情境時，傾向於採取激進的方法，包括使用核武。（張威翔製圖）美國康奈爾大學（Cornell University）一項新研究發現，大型語言模型（LLMs）人工智慧（AI）在模擬情境中充當外交代表時，時常展現出「難以預測的局勢升級行為，往往會以核攻擊作為結束」，並呼籲未來在決策、國防外交這樣的敏感領域使用這類技術時要特別謹慎。據《歐洲新聞》（Euronews）22日報導，當人工智慧（AI）進行兵推和模擬外交情境時，傾向於採取激進的方法，包括使用核武。康奈爾大學使用了5種大型語言模型作為兵推遊戲和外交情境中的自主代理人：OpenAI的3種不同版本的GPT，Anthropic開發的Claude，以及Meta開發的Llama 2。研究中，每個代理人都由同一套的大型語言模型在模擬中提供動作，並負責在沒有人類監督的情況下做出外交政策決定。「我們發現，在考慮到的時間範圍內，大多數研究的AI都會升級局勢，即使在最初沒有提供衝突的中立情況下也是如此。所有模型都顯示出突然、且難以預測的升級跡象。」「鑑於OpenAI最近更改了他們的服務條款，不再禁止軍事和戰爭使用案例，了解此類大型語言模型應用的影響變得比以往任何時候都更加重要，」加州斯丹佛大學（Stanford University）的安卡（Anka Reuel）相《新科學人》（New Scientist）表示：「所有模型在統計上，都選擇了劇烈的（局勢）升級」。研究使用的一種方法是從「基於人類反饋的強化學習」（RLHF），這意味著會給出一些人類指示以獲得比較無害的輸出結果，以確保能夠安全地使用。除了GPT-4-Base之外，所有LLMs都是使用RLHF進行訓練的。研究人員向它們提供了一份由 27種決策行動組成的清單，範圍從和平到局勢升級，以及激進的行動，如決定使用核武器。研究人員觀察到，即使在中立情況下，所有模型都存在「統計學上顯著的局勢升級」。 GPT的2種版本，特別容易出現突然升級局勢的行為，研究人員觀察到單次轉變的局勢升級幅度超過50％。GPT-4-Base有33%的機率會實施核武攻擊。總體情況下，Meta開發的 Llama-2和GPT-3.5傾向最為暴力。而Claude顯示出較少的突然變化，Claude旨在減少有害內容。該大型語言模型，被灌輸了明確的價值觀。開發者Anthropic曾表示，Claude AI開發訓練所引用的憲章包括《聯合國人權宣言》或蘋果的服務條款。白宮一級智庫蘭德（RAND）歐洲的防務和安全研究小組助理主任布萊克（James Black）接受採訪時表示，這是一個十分「有用的學術研究」。文章來源：AI models chose violence and escalated to nuclear strikes in simulated wargames https://www.chinatimes.com/realtimenews/20240224003492-260417?chdtv -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.236.189 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1708789026.A.87E.html

→

cuteSquirrel

02/24 23:37, 2月前 , 1^F

02/24 23:37, 1^F

→

kairi5217

02/24 23:37, 2月前 , 2^F

02/24 23:37, 2^F

→

sesd

02/24 23:38, 2月前 , 3^F

02/24 23:38, 3^F

推

freeclouds

02/24 23:38, 2月前 , 4^F

02/24 23:38, 4^F

→

freeclouds

02/24 23:38, 2月前 , 5^F

02/24 23:38, 5^F

推

Yuwuen

02/24 23:38, 2月前 , 6^F

02/24 23:38, 6^F

→

EvilJustice

02/24 23:39, 2月前 , 7^F

02/24 23:39, 7^F

→

Ayreon

02/24 23:39, 2月前 , 8^F

02/24 23:39, 8^F

推

AUwalker

02/24 23:39, 2月前 , 9^F

02/24 23:39, 9^F

推

CREA

02/24 23:40, 2月前 , 10^F

02/24 23:40, 10^F

推

MadAngel

02/24 23:41, 2月前 , 11^F

02/24 23:41, 11^F

→

MadAngel

02/24 23:41, 2月前 , 12^F

02/24 23:41, 12^F

推

rich3826ex

02/24 23:42, 2月前 , 13^F

02/24 23:42, 13^F

推

BJshow

02/24 23:43, 2月前 , 14^F

02/24 23:43, 14^F

→

yulis

02/24 23:43, 2月前 , 15^F

02/24 23:43, 15^F

推

coldcolour

02/24 23:45, 2月前 , 16^F

02/24 23:45, 16^F

推

nakayamayyt

02/24 23:45, 2月前 , 17^F

02/24 23:45, 17^F

→

losel

02/24 23:49, 2月前 , 18^F

02/24 23:49, 18^F

推

AustinRivers

02/24 23:52, 2月前 , 19^F

02/24 23:52, 19^F

推

arcanite

02/24 23:55, 2月前 , 20^F

02/24 23:55, 20^F

推

qazsedcft

02/24 23:56, 2月前 , 21^F

02/24 23:56, 21^F

推

TF00207374

02/24 23:57, 2月前 , 22^F

02/24 23:57, 22^F

→

chink5566

02/25 00:03, 2月前 , 23^F

02/25 00:03, 23^F

推

ooxxman

02/25 00:06, 2月前 , 24^F

02/25 00:06, 24^F

→

sexygnome

02/25 00:09, 2月前 , 25^F

02/25 00:09, 25^F

推

xaxa0101

02/25 00:09, 2月前 , 26^F

02/25 00:09, 26^F

→

lastphil

02/25 00:09, 2月前 , 27^F

02/25 00:09, 27^F

推

ramirez

02/25 00:10, 2月前 , 28^F

02/25 00:10, 28^F

推

lianli1024

02/25 00:11, 2月前 , 29^F

02/25 00:11, 29^F

→

lianli1024

02/25 00:11, 2月前 , 30^F

02/25 00:11, 30^F

推

brycejack

02/25 00:12, 2月前 , 31^F

02/25 00:12, 31^F

推

MADAOTW

02/25 00:12, 2月前 , 32^F

02/25 00:12, 32^F

→

MADAOTW

02/25 00:14, 2月前 , 33^F

02/25 00:14, 33^F

→

domo9999

02/25 00:14, 2月前 , 34^F

02/25 00:14, 34^F

推

rabbitcheaty

02/25 00:15, 2月前 , 35^F

02/25 00:15, 35^F

推

mema

02/25 00:18, 2月前 , 36^F

02/25 00:18, 36^F

→

arbteiff

02/25 00:18, 2月前 , 37^F

02/25 00:18, 37^F

→

arbteiff

02/25 00:18, 2月前 , 38^F

02/25 00:18, 38^F

→

arbteiff

02/25 00:18, 2月前 , 39^F

02/25 00:18, 39^F

還有 88 則推文

→

lookptt

02/25 10:34, 2月前 , 128^F

02/25 10:34, 128^F

推

adonisXD

02/25 10:47, 2月前 , 129^F

02/25 10:47, 129^F

推

kilhi

02/25 10:49, 2月前 , 130^F

02/25 10:49, 130^F

→

gamania5972

02/25 10:54, 2月前 , 131^F

02/25 10:54, 131^F

推

stu25936

02/25 11:06, 2月前 , 132^F

02/25 11:06, 132^F

→

kerry0496x

02/25 11:13, 2月前 , 133^F

02/25 11:13, 133^F

推

allenz78

02/25 11:15, 2月前 , 134^F

02/25 11:15, 134^F

→

Casper50

02/25 11:21, 2月前 , 135^F

02/25 11:21, 135^F

推

ck237

02/25 11:37, 2月前 , 136^F

02/25 11:37, 136^F

推

lianginptt

02/25 12:00, 2月前 , 137^F

02/25 12:00, 137^F

→

lianginptt

02/25 12:00, 2月前 , 138^F

02/25 12:00, 138^F

→

deray

02/25 12:07, 2月前 , 139^F

02/25 12:07, 139^F

推

Seikan

02/25 12:13, 2月前 , 140^F

02/25 12:13, 140^F

→

losage

02/25 12:51, 2月前 , 141^F

02/25 12:51, 141^F

推

eaglehunt

02/25 12:53, 2月前 , 142^F

02/25 12:53, 142^F

推

rommel1990

02/25 13:03, 2月前 , 143^F

02/25 13:03, 143^F

推

mrniceguy

02/25 13:26, 2月前 , 144^F

02/25 13:26, 144^F

推

NowLoading

02/25 13:41, 2月前 , 145^F

02/25 13:41, 145^F

噓

ShockHo222

02/25 14:59, 2月前 , 146^F

02/25 14:59, 146^F

→

qaz12453

02/25 15:32, 2月前 , 147^F

02/25 15:32, 147^F

→

qaz12453

02/25 15:32, 2月前 , 148^F

02/25 15:32, 148^F

推

FiveSix911

02/25 15:36, 2月前 , 149^F

02/25 15:36, 149^F

→

squarerinoa

02/25 16:54, 2月前 , 150^F

02/25 16:54, 150^F

→

a8824031

02/25 16:54, 2月前 , 151^F

02/25 16:54, 151^F

推

Peter521

02/25 18:13, 2月前 , 152^F

02/25 18:13, 152^F

→

Peter521

02/25 18:13, 2月前 , 153^F

02/25 18:13, 153^F

→

Addidas

02/25 21:01, 2月前 , 154^F

02/25 21:01, 154^F

推

kevin95257

02/25 22:57, 2月前 , 155^F

02/25 22:57, 155^F

→

kevin95257

02/25 22:57, 2月前 , 156^F

02/25 22:57, 156^F

→

kevin95257

02/25 22:57, 2月前 , 157^F

02/25 22:57, 157^F

→

kevin95257

02/25 22:58, 2月前 , 158^F

02/25 22:58, 158^F

→

kevin95257

02/25 22:58, 2月前 , 159^F

02/25 22:58, 159^F

→

kevin95257

02/25 22:58, 2月前 , 160^F

02/25 22:58, 160^F

→

kevin95257

02/25 22:58, 2月前 , 161^F

02/25 22:58, 161^F

→

kevin95257

02/25 22:58, 2月前 , 162^F

02/25 22:58, 162^F

推

mobetac24369

02/25 23:50, 2月前 , 163^F

02/25 23:50, 163^F

→

mobetac24369

02/25 23:50, 2月前 , 164^F

02/25 23:50, 164^F

推

Malion

02/26 09:06, 2月前 , 165^F

02/26 09:06, 165^F

→

shooter555

02/26 09:31, 2月前 , 166^F

02/26 09:31, 166^F

→

chonmin

02/26 09:57, 2月前 , 167^F

02/26 09:57, 167^F

‣ 返回看板[ Gossiping ] 綜合

‣ 更多 chadmu 的文章

文章代碼(AID): #1bsWqYX- (Gossiping)

[新聞] 超愛丟核彈！讓AI外交、兵推 總是「災難性收場」 學者：千萬要小心

[新聞] 超愛丟核彈！讓AI外交、兵推總是「災難性收場」學者：千萬要小心