[新聞] GPT-5.2 日本學測類考試奪冠AI 學力逼近

看板SENIORHIGH作者 (無)時間2天前 (2026/01/21 23:09), 編輯推噓1(1016)
留言17則, 2人參與, 2天前最新討論串1/1
GPT-5.2 日本學測類考試奪冠 AI 學力逼近頂尖考生 January 20, 2026 by TechNews 編輯台 在 1 月 17 日至 18 日舉行的日本大學入學共通測試 中,OpenAI 的最新人工智慧模型 GPT-5.2 表現出 色,成功在 9 個科目中獲得滿分,整體得分率達到 97%。這個成績不僅超越了 Google 的 Gemini 3 Flash(得分率約 91%),還顯示出 AI 在學術能力上 的顯著提升,可能超越人類考生的潛力。 此次測試的實驗由AI新創公司Life Prompt與日本 經濟新聞共同進行,涵蓋多個科目。測試過程中, 問題透過光學字元辨識(OCR)技術從PDF轉換為 Markdown格式,並結合了圖像輸入。根據報告, GPT-5.2在公共與倫理科目中獲得滿分,並在地理 科目中也表現優異,得分超過80%。然而,該模型 在某些科目中出現超時的問題,顯示出其在處理複 雜問題時的局限性。 與此同時,Google的Gemini 3 Flash在公共與倫 理科目中同樣獲得滿分,但整體得分率約為91%, 不及GPT-5.2。Claude Sonnet 4.5模型的表現也 不容小覷,雖然在公共與倫理科目中得分為97分, 但整體得分卻顯示出與其他模型的差異。 在實際的共通測試中,約有30萬5,104名考生參 加了新設的資訊科目,並且因不當行為而有7名考 生被取消資格。這次測試的平均分數將於1月21日 公布。 這個系列的結果不僅突顯了AI在教育領域的潛力, 也引發了對於未來大學入學考試形式的深思。AI的 進步可能會改變教育的歷史,並引發對於考試公平 性和有效性的討論。 https://technews.tw/2026/01/20/openai-gpt-5-2-japan-test/ ————- 看看人家,這才是正常的測試啊~ 「透過光學字元辨識(OCR)技術從PDF轉換為 Markdown格式,並結合了圖像輸入」 上篇台灣補習班業者的新聞推文就有網友提醒 PDF的圖文格式AI不好判讀 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.132.181.237 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/SENIORHIGH/M.1769008186.A.030.html

01/21 23:56, 2天前 , 1F
有一個新考科,情報。
01/21 23:56, 1F

01/22 05:50, 2天前 , 2F
他們的考科還真多
01/22 05:50, 2F

01/22 06:07, 2天前 , 3F

01/22 06:08, 2天前 , 4F
測試原文,一共七考科AI計算過程共需一小時上下
01/22 06:08, 4F

01/22 06:12, 2天前 , 5F
但是Claude Opus 4.5竟然只要6分8秒
01/22 06:12, 5F

01/22 06:15, 2天前 , 6F
算超級快,成績也不錯。
01/22 06:15, 6F

01/22 06:15, 2天前 , 7F
得意科目: 化学(93%)、生物(92%)、地学(89%)
01/22 06:15, 7F

01/22 06:15, 2天前 , 8F
苦手科目: 数学I・A(67%)、数学II・B・C(69%)
01/22 06:15, 8F

01/22 06:17, 2天前 , 9F
總體評價第一名的跟前面學測pdf檔測試相反
01/22 06:17, 9F

01/22 06:17, 2天前 , 10F
GPT-5.2(1位: 662点/700点 = 94.6%)
01/22 06:17, 10F

01/22 06:18, 2天前 , 11F
得意科目: 生物(100%)、数学I・A(100%)、
01/22 06:18, 11F

01/22 06:18, 2天前 , 12F
数学II・B・C(98%)、化学(97%)
01/22 06:18, 12F

01/22 06:18, 2天前 , 13F
苦手科目: 物理(86%)
01/22 06:18, 13F

01/22 06:20, 2天前 , 14F
而Gemini 3 Pro和Gemini 3 Flash分居二、三位
01/22 06:20, 14F

01/22 06:26, 2天前 , 15F
得分629、627点/700点,但Flash在算數A遇到
01/22 06:26, 15F

01/22 06:27, 2天前 , 16F
挑戰(グループ問題)得分只有72%
01/22 06:27, 16F

01/22 06:29, 2天前 , 17F
也就是說Flash在其他科表現更好
01/22 06:29, 17F
文章代碼(AID): #1fSEmw0m (SENIORHIGH)