[閒聊] FB看到 Gemini 3 的能力對比==

看板Marginalman作者 (西連寺春菜之犬)時間2周前 (2025/11/20 17:21), 編輯推噓5(509)
留言14則, 9人參與, 2周前最新討論串1/3 (看更多)
http://i.imgur.com/9kPkHy9.jpg
不知道真的假的捏 有那麼強喔 雖然真的蠻強的 不過我覺得主要強在搜尋能力可以跟語言模型搭配很好 我覺得有可能是因為他是google的關係 -- https://i.imgur.com/uxjnOka.jpg
https://i.imgur.com/bUtNswO.jpg
https://i.imgur.com/jbfOKqp.jpg
https://i.imgur.com/mrI9OPz.jpg
https://i.imgur.com/PV2Nxix.jpg
小孤獨可愛 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.244.232 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1763630479.A.5CC.html

11/20 17:22, 2周前 , 1F
程式方面吧,我覺得查資料和gpt5.1差不多
11/20 17:22, 1F

11/20 17:23, 2周前 , 2F
這種自己體會比較準 你的測項跟dataset不一定一樣
11/20 17:23, 2F

11/20 17:23, 2周前 , 3F
成本能壓得下來再說吧 現在這幾個model都靠北貴
11/20 17:23, 3F

11/20 17:24, 2周前 , 4F
好屌
11/20 17:24, 4F

11/20 17:24, 2周前 , 5F
確實評比本來就比較偏頗
11/20 17:24, 5F

11/20 17:25, 2周前 , 6F
看了一下,這個的計算基準,人類訂在100% ,做一個task約
11/20 17:25, 6F

11/20 17:25, 2周前 , 7F
花$17
11/20 17:25, 7F

11/20 17:25, 2周前 , 8F
所以還……有一段路
11/20 17:25, 8F

11/20 17:25, 2周前 , 9F
但跟半年前的模型比那是很屌了
11/20 17:25, 9F

11/20 17:28, 2周前 , 10F
進化很快
11/20 17:28, 10F

11/20 17:29, 2周前 , 11F
進步很快了
11/20 17:29, 11F

11/20 17:30, 2周前 , 12F
數學比較屌 我看別人還在1% 他跳到23%
11/20 17:30, 12F

11/20 17:35, 2周前 , 13F
好屌
11/20 17:35, 13F

11/20 17:40, 2周前 , 14F
你這麼信這個評分系統幹什麼呀
11/20 17:40, 14F
文章代碼(AID): #1f7jsFNC (Marginalman)
文章代碼(AID): #1f7jsFNC (Marginalman)