[心得] 純粹聊聊AI使用

看板Soft_Job作者 (北歐組一生推)時間12小時前 (2026/02/04 02:00), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
也不知道哪根筋不對半夜睡不著來這個基本沒在看的版發文 先上個人權 https://imgur.com/I7XPLK8
這篇文沒有打算細談任何AI實際應該怎麼使用的內容 一方面懶得說二方面我覺得這很因情況而異三方面我也不知道 純粹想到什麼打什麼打到我睡著為止 開頭放個Andrej Karpathy這篇推特 https://x.com/karpathy/status/2015883857489522876?s=46 我覺得這是最近我看到最符合個人使用經驗的文章 網路上充斥許多只有AI很強跟AI沒用論點的文章 真正中肯做出分析的反而很難看到 (當然也可能是推薦算法使然 喔對了小小自介一下 我最近的工作比較大的milestone是release了一個叫做nijiv7的動漫風格文生圖模型 https://x.com/nijijourney/status/2009714744597643503?s=20 更之前的話則是參與midjourney video 1的開發 我的工作內容基本包涵 - 上千卡gpu的模型訓練 - 以億為等級的圖片影片數據處理 - 圖片影像生成模型的各種調整跟feature development 比較忙的時候可能一天同時會碰到資料處理 訓練 跟模型推理的代碼 實際工作更雜像我最近就開副本在做別的事情 但上面可以當作是工作的主幹 而個人在ai coding這一方面覺得算是經歷了三個大的變革 1. chatgpt 出來後複製貼上問答 2. cursor 類型的 ide 直接導入 3. claude code等的自主 ai 代理人 3這一塊我們團隊也是到最近才開始比較積極探索 主要是opus 4.5, codex等模型讓agent能力大幅提升 也讓3使用起來帶來的效益更大 (個人覺得從hype到實際落地能用通常都需要一段緩衝期 而且比起1 2 要運用好3的learning curve更陡 我最近都開玩笑說vibe coding比coding難 寫skill比寫code難 現在使用算是2 3混合只有在非常偶爾的情況會把獨立的問題用1拿去問不同llm吧 至於模型嗎 我們都是用最好的甚至claude code直接開api usage (比 team plan速度快 一個月一個人燒個幾百幾千美元都有 (還沒算cursor跟其他雜七雜八的 ai agent這東西感覺是 用起來其實沒這麼容易 也沒有像網路上大部分講的這麼萬能 現在最大的問題基本是context management跟spec 畢竟目前ai還不會讀心 他不知道你想做什麼 而且就算spec寫好了實際跑起來還是會發現常常有遺漏 所以的確是一行code都不用寫 其實我去年用cursor就幾乎一行code都沒寫了 但會發現到頭來最大的bottleneck還是人類自己 因為人類要負責提出requirement (spec)跟做evaluation 這兩件事情並沒有這麼簡單 嘛所以像是brainstorm這種讓agent釐清requirement的就很好用 至於evaluation 作為有程式背景的直接做code review還是最直接的方式 (上面Andrej Karpathy的文也有提到 實際上ai寫的code有時候就算是對的 但就是看他的code style或是一些冗餘的內容很不爽 至於那些純vibe完全不看code的人 大概需要不同的evaluation方式吧 但考慮到ml這種超大規模數據處理跟模型訓練 坦白講你不看code你安心嗎 你除了看code有什麼方式保證他在所有情況的behavior都是對的 我還真不知道 所以說 這東西真的很看情況 網路上kol說了ai多好用 但他們也不會知道怎麼把它用在千卡的集群上對吧 我有朋友在銀行 或者在quant工作 那邊又是完全不同的情況跟問題 每個人都有自己的工作流程目標跟限制 只能在這個為基礎來嘗試把ai容納到工作流裡面去 是說既然為什麼這麼麻煩為什麼還要用ai agent呢 因為人就是懶 而agent雖然不是萬能 但如果用得好 對於偷懶 不對 對於提升工作效率 還是有很大幫助的 大概這樣 一時沒想到啥要寫了 睡覺去起來繼續當agent manager -- https://i.imgur.com/LKAEPG4.png
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 160.237.80.233 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1770141650.A.FD4.html
文章代碼(AID): #1fWZVI_K (Soft_Job)