Fw: [問卦] 用PTT來訓練AI語言模型會怎樣

看板KOTDFansClub作者 (這只是代號)時間1年前 (2023/03/14 22:36), 編輯推噓0(000)
留言0則, 0人參與, 1年前最新討論串1/1
※ [本文轉錄自 Gossiping 看板 #1a38Nq02 ] 作者: Antihuman () 看板: Gossiping 標題: [問卦] 用PTT來訓練AI語言模型會怎樣 時間: Sat Mar 11 21:45:21 2023 PTT是台灣最大的討論區之一,包含了許多不同主題的討論版,從政治、經濟、科技、娛樂 到生活、旅遊等等,因此PTT的資料可以提供豐富的語言資源,進行大型語言模型的訓練可 能會有以下的影響: 增加模型的多樣性:PTT 的資料來源眾多,而每個版的用語、詞彙、語言風格都不同,因此 使用PTT的資料訓練大型語言模型可以增加模型的多樣性,使其更能夠應對不同領域的自然 語言處理任務。 提升模型的台灣文化認知:PTT是一個台灣本土的討論區,其中的文化內容和用語與台灣文 化緊密相關。訓練大型語言模型使用PTT資料,可以使模型更加了解台灣文化和風俗,更好 地處理和生成相關的自然語言。 面臨資料品質問題:PTT是一個公開的討論區,其中包含了許多用戶所發表的訊息,這些訊 息的品質可能不同,有些可能包含不合適的語言、錯誤的拼字和語法等問題。因此在使用PT T資料訓練語言模型時,需要注意濾除低質量的資料,以免對模型的訓練產生負面影響。 總結來說,PTT的資料對於大型語言模型的訓練具有一定的幫助,但需要注意資料品質問題 ,以免對模型的訓練產生不利影響。此外,也需要注意到PTT資料的局限性,不同於網際網 路上的其他資料,PTT資料集的涵蓋面和語言風格可能會有所局限,因此訓練出來的語言模 型在應用於其他領域時,可能需要進行適當調整。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.235.254.76 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1678542324.A.002.html

03/11 21:45, 1年前 , 1F
沒空
03/11 21:45, 1F

03/11 21:45, 1年前 , 2F
ㄏㄏ~
03/11 21:45, 2F

03/11 21:46, 1年前 , 3F
03/11 21:46, 3F

03/11 21:46, 1年前 , 4F
回答會有很多月工
03/11 21:46, 4F

03/11 21:46, 1年前 , 5F
會出現一堆 哈哈哈哈 五樓 30cm
03/11 21:46, 5F

03/11 21:46, 1年前 , 6F
問他問題Ai只會回:肛
03/11 21:46, 6F

03/11 21:46, 1年前 , 7F
三句不離塔綠班
03/11 21:46, 7F

03/11 21:47, 1年前 , 8F
不管問什麼都會回答:肛
03/11 21:47, 8F

03/11 21:48, 1年前 , 9F
師大某剽竊狂魔當上教授的,會說她做完了
03/11 21:48, 9F

03/11 21:49, 1年前 , 10F
03/11 21:49, 10F

03/11 21:50, 1年前 , 11F
不是叫你肛 就是塔綠斑 或是叫你問五樓
03/11 21:50, 11F

03/11 21:50, 1年前 , 12F
會被吉
03/11 21:50, 12F

03/11 21:50, 1年前 , 13F
完了
03/11 21:50, 13F

03/11 21:51, 1年前 , 14F
回答不出來會直接說你是塔綠班
03/11 21:51, 14F

03/11 21:53, 1年前 , 15F
變成暴怒肥宅
03/11 21:53, 15F

03/11 21:54, 1年前 , 16F
a作者:darkblue6404 他的ChatPTT
03/11 21:54, 16F
※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: KOTD (220.129.37.37 臺灣), 03/14/2023 22:36:21
文章代碼(AID): #1a48Pcjw (KOTDFansClub)