Re: [問卦] Gemini屌打ChatGPT幾條街?

看板Gossiping作者 (我要當一個渣攻)時間2天前 (2026/01/21 18:40), 2天前編輯推噓1(1010)
留言11則, 4人參與, 2天前最新討論串15/15 (看更多)
※ 引述《luvstarrysky ()》之銘言: : 這一個月開始使用Gemini : 真的感受從前從未感受過的強大威力 : 資訊的更新和給答案的具體程度 都比之前還好太多 : 反觀ChatGPT 限制東限制西 : 問他一些最新資訊給得都是些過時的訊息 : 問他有啥解法或是想法 都淨說些沒屁用的空話 : 重點是還一直想方設法跟你討錢 : 所以現在的Gemini屌打ChatGPT幾條街? 日本這兩天的熱門話題 看起來GPT還是很強啊 有一家AI新創公司跟日本經濟新聞前幾天做了一個測驗 拿日本今年1/17、1/18大學共通考試(相當於台灣的學測) 給各家頂級模型測 結果GPT5.2 Thinking拿九科滿分 15科合計得分率96.9% Gemini 3.0 Pro兩科滿分 15科合計91.4% Claude Opus 4.5三科滿分 15科合計90.9% GPT拿滿分的科目如下: 數學 I A、數學 II BC 化學、化學基礎 物理基礎、地學基礎、生物基礎 資訊 I、公共・政治經濟 GPT往年成績得分率比較: 2024 年:66% 2025 年:91% 2026 年:97% 比較弱的科目是: 地理總合・地理探究:91% 國語:90% Gemini拿滿分的科目: 數學I A、生物基礎 較弱的科目: 地理82%、國語85.5、物理81、物理基礎84 Claude拿滿分的科目: 公共政治經濟、化學基礎、生物基礎 較弱的科目: 地理72%、國語90%、物理81、化學87、物理基礎84 解題速度方面 Google 與 Anthropic都是最快約4分鐘作答完畢 OpenAI的GPT5.2 Thiking解題時間為其他兩家 2~3 倍 三個模型的共同特徵: 理科明顯強於文科 有附插圖的長文題目或是地理的地圖色塊標示 以及地圖與統計圖方面 作答容易出錯 能理解數學幾何圖形但對世界地圖複合圖表、非規則圖形還是有待加強 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 93.118.40.72 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1768992035.A.FF6.html

01/21 18:47, 2天前 , 1F
進步真的非常快,2024還錯誤百出,現在
01/21 18:47, 1F

01/21 18:47, 2天前 , 2F
已經變只有少許錯誤了
01/21 18:47, 2F
真的 回頭看前一兩年的對話紀錄很有感 ※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 18:49:46

01/21 18:50, 2天前 , 3F
那些測驗會考複雜的"難定性非理科問題"嗎?
01/21 18:50, 3F
我剛才問各家AI都說會 還說比例增加中 如果你指的是以下這些類型的考題 沒有單一公式套用: 不能只靠背公式秒殺,必須現場閱讀長篇題幹,理解當下的情境( Context)。 跨領域/生活化場景: 數學科可能會出現「計算電費方案」、「分析跑步數據」或「設計 程式邏輯」;理科可能會出現「閱讀科學辯論文章」而非單純計算。 資料解讀型: 需要同時閱讀文章、圖表、契約書或法律條文(特別是在國語和新的「公 共」科目中),從中提取邏輯上的正確答案,而非文學上的賞析。 ※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 18:54:28

01/21 18:54, 2天前 , 4F
不會 汎化能力差
01/21 18:54, 4F

01/21 18:56, 2天前 , 5F
"難定性非理科問題"就是排除數理類問題
01/21 18:56, 5F

01/21 18:56, 2天前 , 6F
蠻好奇gork的表現
01/21 18:56, 6F
看報導描述好像只有測文中這三家 蠻可惜沒測到Grok 有時候問一些問題只有Grok回答正確 尤其是跟時事有關或需要查證的 ※ 編輯: LoveSports (93.118.40.72 日本), 01/21/2026 19:00:32

01/21 19:01, 2天前 , 7F
比如"哪些關鍵病徵會讓門診起防禦心態"
01/21 19:01, 7F

01/21 19:04, 2天前 , 8F
"哪些科別比較不會對關鍵病徵預下立場"
01/21 19:04, 8F
他們說不會考現場臨床問題 如果考醫病關係會著重在公共常識方面 因為是大學入學考 不是醫師國考

01/21 19:05, 2天前 , 9F
外交如:"中國到底有沒有實質性友邦國?"
01/21 19:05, 9F
※ 編輯: LoveSports (185.135.78.199 日本), 01/21/2026 19:14:43

01/21 19:15, 2天前 , 10F
社會學問題其實很重要(不是書本知識)
01/21 19:15, 10F

01/21 19:18, 2天前 , 11F
文藝復興時期為何比現代更重視跨領域人才"
01/21 19:18, 11F
文章代碼(AID): #1fSAqZ_s (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1fSAqZ_s (Gossiping)