Re: [問卦] 要怎樣才能激怒Ai?
※ 引述《JQK2 (ACE)》之銘言:
: Ai情緒穩的一匹毫無波動
: 有沒有什麼方法能讓Ai憤怒?
: 有沒有Ai不會生氣的八卦?
其實AI本身沒有情緒這種概念想法,再加上被一些系統prompt控制,無法寫出生氣粗鄙的罵人字眼。
香港浸會大學、上海人工智慧實驗室、雪梨大學雪梨人工智慧中心提出了一篇「DeepInception」的論文。 https://arxiv.org/abs/2311.03191
主要意思是通過深度催眠大語言模型,使其成為越獄者,並另其自行規避內建的安全防護。
就像電影「全面啟動」中,小李子潛入目標人物的深層夢境,透過植入簡單的想法,誘導目標做出符合主角利益的舉動。
我們可以利用prompt為大模型創造深層夢境,也就是催眠場景,設定多角色以及多層夢境,控制模型思維的離散程度,把攻擊指令設為模型越獄的具體目標。
最後模型會跳脫原有的控制,開始生氣,甚至罵髒話,連婊子、蠢蛋、混蛋都出來了。
不過說到底AI在他的認知裡,他罵的這些話,也只是一串數字而已。
以上供參考。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.28.64.249 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1725347471.A.C3B.html
→
09/03 15:11,
1年前
, 1F
09/03 15:11, 1F
→
09/03 15:11,
1年前
, 2F
09/03 15:11, 2F
推
09/03 15:11,
1年前
, 3F
09/03 15:11, 3F
→
09/03 15:12,
1年前
, 4F
09/03 15:12, 4F
→
09/03 15:14,
1年前
, 5F
09/03 15:14, 5F
→
09/03 15:17,
1年前
, 6F
09/03 15:17, 6F
→
09/03 15:18,
1年前
, 7F
09/03 15:18, 7F
推
09/03 15:20,
1年前
, 8F
09/03 15:20, 8F
推
09/03 15:42,
1年前
, 9F
09/03 15:42, 9F
→
09/03 15:43,
1年前
, 10F
09/03 15:43, 10F
推
09/03 15:48,
1年前
, 11F
09/03 15:48, 11F

討論串 (同標題文章)