[問卦] 通用人工智慧(AGI)是不是快了?

看板Gossiping作者 (悠久の翼)時間1年前 (2024/12/21 07:25), 編輯推噓1(212)
留言5則, 5人參與, 1年前最新討論串1/1
剛剛看完OPEN AI憋了12天的壓箱寶影片 https://youtu.be/SKBG1sqdyIU
提到已經完成最新的 O3推理模型 寫程式方面輾壓現在開放給大眾用的最強的O1, 而且分數(2727)還比畫面上白衣服那位(2500)跟它們團隊首席科學家高XD https://i.imgur.com/oV8surS.png
給他做美國數學奧林匹亞測試是96.7分,剩下的3.3分是因為有一題總是會算錯 博士等級的科學問題看起來是沒領先O1太多 https://i.imgur.com/CgnjplM.png
研究型的數學問題,專門給那些資深數學家去探索的,沒發表過的資料 O3達到25.2%,其他類模型只有2%正確率 https://i.imgur.com/AYcARqi.png
不過最驚訝的是請來外部團體測試AGI的分數 ARC-AGI用像這種圖去測試AI是不是有達到人類推理水準 https://i.imgur.com/jr1rU9j.png
這題比較簡單,就是要把缺的地方填上變成完整正方形 https://i.imgur.com/Jl7fhOS.png
這題難一點,要去算各方形內的點跟辨認顏色 然後在相對應的方形外用該顏色跟數量當寬度去把方形框起來 現在的O1給他足夠時間也只能到32%,O3在低計算環境下有75.7% 如果要O3想久一點的話可以到87.5% 重點是跨過85%這個門檻就算相當於有人類的推理能力 https://i.imgur.com/Gx77oLi.png
好奇去找了一下這測驗對人類難度有多少 2024年紐約大學找了1729人測試,正確率落在73.3%-77.2% 但是98.7%的問題至少有一位普羅大眾可以解完 不過O3目前還沒要釋出,OPEN AI還要幫他加上各種安全裝置 在各種安全裝置下能不能達到基本AGI的水準就是大問號了 人類想創造出接近人類但是又不能超過人類的心理真是奇妙 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.13.117 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1734737121.A.DB2.html

12/21 07:31, 1年前 , 1F
點越高攻速越快,不過沒點DEX打不中
12/21 07:31, 1F

12/21 07:44, 1年前 , 2F
台灣繼續做血汗晶片吧,以後美國用AI做
12/21 07:44, 2F

12/21 07:57, 1年前 , 3F
還早
12/21 07:57, 3F

12/21 08:38, 1年前 , 4F
成為亞洲第一互動社群平台 快了
12/21 08:38, 4F

12/21 09:47, 1年前 , 5F
做夢吧,又一坨欸癌炒作罷了
12/21 09:47, 5F
文章代碼(AID): #1dPVpXso (Gossiping)