[其他] GoogleAI達到國際數學奧林匹克銀牌水平

看板Math作者jackliao1990 (j)時間1年前 (2024/07/26 15:43)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串1/1

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/ 一年一度的國際奧林匹克數學競賽（IMO）是最負盛名的高中數學競賽，每年的IMO會設有 6道代數、幾何、數論以及組合學方面的題目。近來，IMO被認為是機器學習領域的重要挑戰，可用於衡量人工智慧（AI）系統的高級數學推理能力，這種能力對實現通用人工智慧（AGI）很重要。 Google的DeepMind公司在今年年初推出了AlphaGeometry，該模型擅長解決幾何證明題，已逼近人類金牌選手的水平，但無法應對幾何之外的代數、數論等問題。 7月25日， DeepMind宣布推出基於強化學習、可用於形式數學推理的AlphaProof，以及改進的幾何證明模型AlphaGeometry 2。這兩個系統共同解決了今年IMO6題目中的4 道，首次達到了人類銀牌選手的水準。相較於上一代AlphaGeometry，DeepMind基於Gemini重新訓練了AlphaGeometry 2用到的語言模型，並優化了符號引擎，提升了它解決複雜幾何問題的能力和效率。對於IMO 2024 的問題4，AlphaGeometry 2只用19秒便給了答案。 AlphaProof則結合了預先訓練的語言模型與強化學習演算法AlphaZero（通用棋類AI），並接受了一種名為Lean的形式化語言的訓練。其中，Lean是一種互動式定理證明語言，可用來檢驗數學證明的可靠性。因此用它訓練的模型可以避免自然語言訓練常出現的看似合理但不正確的答案。對於IMO 2024的題目，AlphaProof花了三天時間解決了兩道代數問題，和一道數論問題，包括比賽中最難的、僅有5位參賽選手解決的問題，但無法解決其餘兩道組合問題。最終，經過數學家評分，AlphaProof和AlphaGeometry 2共獲得了28分（滿分42），與金牌線29分相差僅有1分，首次達到了銀牌選手的水平。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.162.64 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1721979825.A.1CB.html

推

GaussQQ

07/26 18:59, 1年前 , 1^F

07/26 18:59, 1^F

‣ 返回看板[ Math ] 數學

‣ 更多 jackliao1990 的文章

文章代碼(AID): #1cerEn7B (Math)