到底

看板Marginalman作者caat0808 (桐生キキョウ)時間4月前 (2025/07/15 15:34)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串49/51 (看更多)

我傳訊息說你如果要自己train一個LLM 還是特定指定的最新最屌的模型款式而不是那種github寫的超迷你模型假設8B好了那要幾千億tokens才train的起來捏但是老闆堅持不要finetune啊他覺得浪費一大堆時間自己train一個別人3年前水準的東西很牛逼啊然後老闆跟我說要不同結構的data分門別類我同事就說這怎麼可能一個模型搞這麼複雜是把他當神了吧又要低parameters又要少資料又要自己train 這樣跟我說可以跟投資者要到錢 == 然後還要自己上GPT生一串自己覺得很酷很炫的書籍list 覺得這個屌打huggingface上現有的general dataset -- https://i.imgur.com/iL2iIMB.jpeg

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.80.7 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1752564868.A.6BF.html ※ 編輯: caat0808 (42.72.80.7 臺灣), 07/15/2025 15:35:38

‣ 返回看板[ Marginalman ] 心情

‣ 更多 caat0808 的文章

文章代碼(AID): #1eTWI4Q_ (Marginalman)