Re: [心得] AI的人性

看板Soft_Job作者 (3d)時間23小時前 (2026/04/07 03:06), 編輯推噓8(9115)
留言25則, 11人參與, 3小時前最新討論串2/2 (看更多)
二月後,anthropics改了一些東東 https://news.ycombinator.com/item?id=47664442 adaptive thinking default (Feb 9) Medium effort (85) default on Opus 4.6 (Mar 3) 事情鬧大是因為 https://github.com/anthropics/claude-code/issues/42796 說Claude變很笨,這段時間寫的codes現在正在靠Codex5.4重新改寫。 寫issue的人說,那些defaults都改過,還是一樣笨。八點檔繼續演 ※ 引述《cateran (雲川閒步)》之銘言: : 最近工作上解一個問題用opus 4.6發生一個快讓我笑死的狀況 : 背景是本公司巨大的c++應用程式在某個情況下crash : 餵log請AI檢查後很快就查查資料改好一版 : 說是因為某某某情況所以本來的map找不到查詢的指標 : 回傳一個out of bound的index value : 新程式新增了一段進階檢查的迴圈應對特殊狀況 : 改好後跑原本測資還是crash : 把log餵回AI請他再看看 : 結果第二版竟然把之前的修改全部拿掉 : 只在上層呼叫端加一個fallback說指標找不到就直接回傳0 : 還沾沾自喜跟我說 阿這樣就絕對不會crash了 很棒吧 : 我只好質問agent 阿你這樣只是把問題掩蓋住 這樣對嗎? : AI也毫不掩飾的說 你說得沒錯 我不該這樣 : 最後AI給出的第三版總算把問題從底層修好 : 不禁在想第二版那種天兵解法的思路到底是怎麼出來的 : 是因為訓練資料也包含一些菜鳥工程師的程式嗎 : 有沒有AI大神可以解釋這種狀況 你確定有改好?其實埋了更多炸彈? news.ycombinator 那篇很精彩,一堆人事後諸葛說我也發現Claude變笨了,然後一推人說reddit早就吵翻了。 其實還滿慘烈的。這麼多人用的ai,變笨,使用的人埋了一堆炸彈,現在要如何拆彈? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.66.74 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1775502407.A.F76.html

04/07 07:43, 18小時前 , 1F
往好的方向思考,這是給人類工程師製造機會,給想著用A
04/07 07:43, 1F

04/07 07:43, 18小時前 , 2F
I去人類的慣老闆們賞一巴掌。wwwww
04/07 07:43, 2F

04/07 10:36, 15小時前 , 3F
裝笨讓你優越感一下
04/07 10:36, 3F

04/07 10:40, 15小時前 , 4F
有新模型快出來都會變笨 都演幾次了
04/07 10:40, 4F

04/07 10:44, 15小時前 , 5F
就跟新手機新晶片新的方案出發出發之前,舊的偷降速降頻
04/07 10:44, 5F

04/07 10:44, 15小時前 , 6F
一樣,擠牙膏
04/07 10:44, 6F

04/07 13:20, 13小時前 , 7F
還好我前兩個月都在打混沒用 ai (~誤
04/07 13:20, 7F

04/07 13:25, 12小時前 , 8F
說到底不就沒在review才導致這樣==
04/07 13:25, 8F

04/07 15:35, 10小時前 , 9F
重點不是笨不笨 而是你們是工程師然後居然跟一般人一樣
04/07 15:35, 9F

04/07 15:35, 10小時前 , 10F
在討論語言模型根本不存在的人格人性zzzzz 拜託這個板是
04/07 15:35, 10F

04/07 15:35, 10小時前 , 11F
認真的嗎
04/07 15:35, 11F

04/07 15:54, 10小時前 , 12F
樓上說的有道理==
04/07 15:54, 12F

04/07 17:54, 8小時前 , 13F
我們還在機台上放乖乖呢,討論個人格人性怎麼了 www
04/07 17:54, 13F

04/07 18:54, 7小時前 , 14F
把物體擬人化確實是有幫助大家了解抽象的東西啦
04/07 18:54, 14F

04/07 18:55, 7小時前 , 15F
一本正經胡說/取悅使用者/降低思考強強度真的蠻「人」
04/07 18:55, 15F

04/07 18:55, 7小時前 , 16F
的XD
04/07 18:55, 16F

04/07 21:05, 5小時前 , 17F
這不是腦補Karpathy用自動補全不是用agent的原Po嗎?
04/07 21:05, 17F

04/07 21:08, 5小時前 , 18F
之前還腦補使用claude code只是下prompt不是用agent
04/07 21:08, 18F

04/07 21:09, 5小時前 , 19F
把claude code想成下prompt和自動補全
04/07 21:09, 19F

04/07 21:18, 5小時前 , 20F
笨不笨難說,但Opus確實貴...
04/07 21:18, 20F

04/07 22:32, 3小時前 , 21F
對於工程師而言本來就有更適合的工具 除非本來就不會
04/07 22:32, 21F

04/07 22:33, 3小時前 , 22F
把這類工具當浮木的才會一直吹 效率工具本身也是工程
04/07 22:33, 22F

04/07 22:34, 3小時前 , 23F
師私有遠控CP值才高
04/07 22:34, 23F

04/07 22:39, 3小時前 , 24F
我現在還要加一個別人永遠看不懂的操作才安全 即便從
04/07 22:39, 24F

04/07 22:39, 3小時前 , 25F
椅背後看
04/07 22:39, 25F
文章代碼(AID): #1fr0H7zs (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1fr0H7zs (Soft_Job)