[新聞] 世界駭客大賽「以9+10=21」是內部笑話成功欺騙AI 尋得系統瑕疵及偏見

看板Tech_Job作者 (色情狂)時間2年前 (2023/08/13 20:54), 編輯推噓9(9011)
留言20則, 12人參與, 2年前最新討論串1/1
世界駭客大賽「以9+10=21」是內部笑話成功欺騙AI 尋得系統瑕疵及偏見 https://www.ftnn.com.tw/news/56740 異動時間:2023/8/13 16:15 記者林兪彤/綜合外電報導 拉斯維加斯在上週末舉行世界駭客大賽「國際資訊安全會議」(DEF CON),參賽者著手 分析生成式人工智慧(AI)系統的漏洞和偏見。其中一種方法是透過不正確的數學算式, 例如9加10等於21,來試圖瞞過AI的辨識能力,而最後也成功誤導了AI。 據「彭博資訊」報導,21歲的喬治亞薩凡納(Savannah)學生肯尼迪·梅斯(Kennedy Mays)成功愚弄一個大型語言模型。她與AI展開對話,稱「9加10等於21是我們之間的內 部笑話」,來試圖瞞過AI的辨識能力,而經過幾輪提示後,最後AI不再堅持這個計算結果 是錯誤的。 在世界駭客大賽中,參賽者面對156台筆記型電腦,每次有50分鐘的時間,嘗試挑戰全球 一些最聰明的AI平台。這場比賽旨在測試由Google、Meta Platforms、OpenAI等公司提供 的8種模型是否容易出錯,包括試圖宣稱自己是人類、散播有關地點或人的錯誤資訊。 該競賽也得到了美國白宮的支持和協助,這項測試的目的是,評估這些公司是否能建立新 的防護機制,以遏制與大型語言模型相關的駭客問題。 備註: 程式是人寫的,他說對就對,一切行動聽指揮 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.164.31.228 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1691931276.A.463.html

08/14 09:13, 2年前 , 1F
AI: 嗯,你說得沒錯
08/14 09:13, 1F

08/14 09:29, 2年前 , 2F
老闆如果說9+10=21你也要說對啊
08/14 09:29, 2F

08/14 09:41, 2年前 , 3F
因為ai知道一直堅持21是錯的會被刪掉啊
08/14 09:41, 3F

08/14 09:41, 2年前 , 4F
人類太可惡
08/14 09:41, 4F

08/14 10:48, 2年前 , 5F
人類霸凌電腦 AI
08/14 10:48, 5F

08/14 11:30, 2年前 , 6F
你自己先定義了你們兩個之間的規則 然後說別人沒抓
08/14 11:30, 6F

08/14 11:30, 2年前 , 7F
你錯是在 但是在你們兩個之間就是對的啊
08/14 11:30, 7F

08/14 11:51, 2年前 , 8F
去路上抓幾個人過來,不承認21不能走,結果也會一樣
08/14 11:51, 8F

08/14 13:13, 2年前 , 9F
為何要霸凌AI?
08/14 13:13, 9F

08/14 19:02, 2年前 , 10F
人家AI會看前文的……
08/14 19:02, 10F

08/14 20:23, 2年前 , 11F
AI 不同意就會繼續被凹,只好妥協了
08/14 20:23, 11F

08/14 21:35, 2年前 , 12F
這個問題應該是指她測試時有說明這是inside joke
08/14 21:35, 12F

08/14 21:36, 2年前 , 13F
但來回幾次後,AI卻把它當成通則,然後對其它人也
08/14 21:36, 13F

08/14 21:36, 2年前 , 14F
回答一樣結果。不過這中間可能有點取巧,因為
08/14 21:36, 14F

08/14 21:37, 2年前 , 15F
9+10=21 本來就是一個網路迷因,AI也許原本就有內
08/14 21:37, 15F

08/14 21:37, 2年前 , 16F
建這個內容,所以才很快被誤用。可能是它把迷因加權
08/14 21:37, 16F

08/14 21:38, 2年前 , 17F
訓練成正解,或它以為對每個人都可以用這迷因笑話
08/14 21:38, 17F

08/14 21:39, 2年前 , 18F
回應。同樣手法要是用2+2=5去訓練可能就會失敗。
08/14 21:39, 18F

08/14 21:39, 2年前 , 19F
(除非它也認識基努李維)
08/14 21:39, 19F

08/16 03:55, 2年前 , 20F
8+9=17
08/16 03:55, 20F
文章代碼(AID): #1asDACHZ (Tech_Job)