討論串[請益] 軟體失業是遲早的事吧
共 18 篇文章

推噓3(7推 4噓 28→)留言39則,0人參與, 1小時前最新作者yamakazi (大安吳彥祖)時間5小時前 (2026/02/17 13:40), 5小時前編輯資訊
0
0
3
內容預覽:
三個月過去了. 你的大神在推特上有對claude的評價. https://x.com/karpathy/status/2015883857489522876. 直接幫你畫重點. 隨著 LLM 程式能力最近大幅提升,我和許多人一樣,從 11 月約 80% 手寫+自動補全、20% 代理(agents)寫
(還有520個字)

推噓8(9推 1噓 18→)留言28則,0人參與, 3月前最新作者pacino (掃地僧)時間4月前 (2025/10/19 20:13), 編輯資訊
0
0
0
內容預覽:
失業?. 應該說是「不會用AI的人會失業」比較有可能. AI就是加速運算. 用它可以增加你的效率. 不是完全取代你. 例如從一堆沒看過的spec裏找某個定義. 你要一個一個spec去找. 還是讓AI幾秒就告訴你在哪裡?. 讀程式碼也可以. 對一些完全沒看過的,請他幫你總結一下. 不是很快就會找到切入

推噓7(7推 0噓 23→)留言30則,0人參與, 3月前最新作者SkankHunt42 (凱子爸)時間4月前 (2025/10/17 13:29), 4月前編輯資訊
0
0
7
內容預覽:
我覺得單純大家討論的沒有共通基準線而已. Leetcode跟codeforces所有的問題人類自己做過而且已經有解答的. 那我們也不挑hard的題目. 我是否可以說medium題目人類參賽者的基準就是通過率100%?. 如果我說人類表現,我會看常態分佈的數據,而不是所有人的最高得分. 對「用戶通過率
(還有1640個字)

推噓27(27推 0噓 138→)留言165則,0人參與, 3月前最新作者oopFoo (3d)時間4月前 (2025/10/17 08:01), 編輯資訊
0
0
2
內容預覽:
現在的llms是以人類為基準做測試。swe-bench 就是人類做過了,看llms可不可以做。. https://github.com/SWE-bench/SWE-bench. swe-bench是拿github已解決的issues來作為測試。. https://openai.com/index/i
(還有277個字)

推噓22(25推 3噓 53→)留言81則,0人參與, 3月前最新作者SkankHunt42 (凱子爸)時間4月前 (2025/10/15 11:19), 4月前編輯資訊
0
0
2
內容預覽:
沒有要ㄉ一ㄤ誰的意思. 就是這benchmark到底存不存在. 小弟我相信 這一定是有論文的. 找了一下. 還真的有. https://arxiv.org/html/2501.16857v1. 以下為AI翻譯 並由我這個人腦節錄:. 1. 在本研究中,我們使用 GPT-4(OpenAI 於 2024
(還有3504個字)