Re: [問卦] Gemini屌打ChatGPT幾條街?
※ 引述《luvstarrysky ()》之銘言:
: 這一個月開始使用Gemini
: 真的感受從前從未感受過的強大威力
: 資訊的更新和給答案的具體程度 都比之前還好太多
: 反觀ChatGPT 限制東限制西
: 問他一些最新資訊給得都是些過時的訊息
: 問他有啥解法或是想法 都淨說些沒屁用的空話
: 重點是還一直想方設法跟你討錢
: 所以現在的Gemini屌打ChatGPT幾條街?
日本這兩天的熱門話題 看起來GPT還是很強啊
有一家AI新創公司跟日本經濟新聞前幾天做了一個測驗
拿日本今年1/17、1/18大學共通考試(相當於台灣的學測) 給各家頂級模型測
結果GPT5.2 Thinking拿九科滿分 15科合計得分率96.9%
Gemini 3.0 Pro兩科滿分 15科合計91.4%
Claude Opus 4.5三科滿分 15科合計90.9%
GPT拿滿分的科目如下:
數學 I A、數學 II BC
化學、化學基礎
物理基礎、地學基礎、生物基礎
資訊 I、公共・政治經濟
GPT往年成績得分率比較:
2024 年:66%
2025 年:91%
2026 年:97%
比較弱的科目是:
地理總合・地理探究:91%
國語:90%
Gemini拿滿分的科目: 數學I A、生物基礎
較弱的科目: 地理82%、國語85.5、物理81、物理基礎84
Claude拿滿分的科目: 公共政治經濟、化學基礎、生物基礎
較弱的科目: 地理72%、國語90%、物理81、化學87、物理基礎84
解題速度方面
Google 與 Anthropic都是最快約4分鐘作答完畢
OpenAI的GPT5.2 Thiking解題時間為其他兩家 2~3 倍
三個模型的共同特徵:
理科明顯強於文科
有附插圖的長文題目或是地理的地圖色塊標示
以及地圖與統計圖方面 作答容易出錯
能理解數學幾何圖形但對世界地圖複合圖表、非規則圖形還是有待加強
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 93.118.40.72 (日本)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1768992035.A.FF6.html
→
01/21 18:47,
2天前
, 1F
01/21 18:47, 1F
→
01/21 18:47,
2天前
, 2F
01/21 18:47, 2F
真的 回頭看前一兩年的對話紀錄很有感
※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 18:49:46
→
01/21 18:50,
2天前
, 3F
01/21 18:50, 3F
我剛才問各家AI都說會 還說比例增加中
如果你指的是以下這些類型的考題
沒有單一公式套用: 不能只靠背公式秒殺,必須現場閱讀長篇題幹,理解當下的情境(
Context)。
跨領域/生活化場景: 數學科可能會出現「計算電費方案」、「分析跑步數據」或「設計
程式邏輯」;理科可能會出現「閱讀科學辯論文章」而非單純計算。
資料解讀型: 需要同時閱讀文章、圖表、契約書或法律條文(特別是在國語和新的「公
共」科目中),從中提取邏輯上的正確答案,而非文學上的賞析。
※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 18:54:28
推
01/21 18:54,
2天前
, 4F
01/21 18:54, 4F
→
01/21 18:56,
2天前
, 5F
01/21 18:56, 5F
→
01/21 18:56,
2天前
, 6F
01/21 18:56, 6F
看報導描述好像只有測文中這三家 蠻可惜沒測到Grok
有時候問一些問題只有Grok回答正確 尤其是跟時事有關或需要查證的
※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 19:00:32
→
01/21 19:01,
2天前
, 7F
01/21 19:01, 7F
→
01/21 19:04,
2天前
, 8F
01/21 19:04, 8F
他們說不會考現場臨床問題
如果考醫病關係會著重在公共常識方面
因為是大學入學考 不是醫師國考
→
01/21 19:05,
2天前
, 9F
01/21 19:05, 9F
※ 編輯: LoveSports (185.135.78.199 日本), 01/21/2026 19:14:43
→
01/21 19:15,
2天前
, 10F
01/21 19:15, 10F
→
01/21 19:18,
2天前
, 11F
01/21 19:18, 11F
討論串 (同標題文章)
完整討論串 (本文為第 15 之 15 篇):