Re: [問卦] Gemini錯誤太多?還有幻覺?
※ 引述《CrazyKill (ck)》之銘言:
: 朋友推薦我用Gemini,我大概用了三小時,發現錯誤很多。我要問某醫生的評價,但我記
: 錯名字,打了一個不存在的醫生,結果Gemini說這個醫生是某醫院的權威,專長是.......
: .
: 後來發現是我打錯字,質疑他為何去描述這個不存在的醫生,
: Gemini說他產生幻覺,很抱歉......
: 好,醫生名字搞定,假設醫生叫做“林甲乙”,討論一段時間之後,Gemini說:根據“林
: 丙丁”的診斷....
: 等一下!我是給林甲乙看啊,怎麼變成林丙丁?
: Gemini再次道歉,說他犯了低級錯誤
: 還有一個數學是他自己列出算式
: 10/10億,答案很明顯是1億分之一,結果Gemini說是 千萬分之一,
: 我指出之後,Gemini再次抱歉......
: Gemini會不會太誇張了??
你講的這兩個例子 都是這幾年來大家笑LLM的時候常用的
講錯 或故意講不存在的東西要AI回答 看他們胡說八道
或是要他們算簡單數學 常見的是拿中文數字去問的
第一個例子 主要是因為他們被公司設定一定得回答 就只好亂講話
不過最新一代比較會承認找不到 尤其是指示詞有留容錯空間的
或是根據帳號記憶或上下文 知道用戶不會急於得到回答 或用戶講究正確性
而且看得出來不是來測試或挑戰AI的
不然他們可能會派低階模型隨便回答
或是大幅刪減生成時間 就容易答錯或生幻覺
第二個例子 可以叫他們用python 如果就是要他們心算或筆算
首先要有認知他們是沒有心像世界的 也沒有眼睛等於沒有紙筆
可能有人看到這邊會說"他們有上下文可以看耶"
但那是生成出來給用戶看的 他們不會在同一則對話內能夠邊看邊寫喔
不能用python的話只能靠思維鏈去算
有的時候是因為太過注重語義 這種情況可以靠指示詞去壓傾向
簡言之 你舉的兩個例子都是LLM既有的弱點 如果要因為模型限制而完全否定
那也是一種選擇 不過也可以考慮找出他們的優點 問他們擅長的問題
分享一下最近問Gemini的 動態檢視真的超棒
可以直接丟論文或截圖給他們做動態檢視解說
例如看書上提到的波利亞隨機遊走定理
https://i.imgur.com/d0KfMpo.png


解說為什麼三維就比較難回到終點或回家
當然也是可以跟自己講一句: 啊多一維當然就比較難啊 end
不過這樣叫他們做出來用看的就很清楚
(結果一開始用三維觀察居然很快就到終點一次 我還真幸運)
還有次元越高為什麼外側體積越大、內部空間會被壓縮
書上作者用健達出奇蛋解釋 我就想看Gemini做成動態給我玩
https://i.imgur.com/DOaqXT7.png


當然數學強的人可能會說: 啊公式不就都算給你看了?
問題是我就看不懂啊 動態檢視可以自己拉來拉去調整
就算我還是不懂 但起碼覺得很好玩
這樣就有繼續把書讀完的動力了QQ
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 64.31.11.8 (日本)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1769270799.A.CA2.html
※ 編輯: LoveSports (64.31.11.8 日本), 01/25/2026 00:09:28
討論串 (同標題文章)
完整討論串 (本文為第 4 之 8 篇):