Re: [問題] 簡體字沒有"遊"嗎?

看板C_Chat作者 (dbwu)時間2年前 (2021/09/06 21:55), 2年前編輯推噓7(7017)
留言24則, 8人參與, 2年前最新討論串4/4 (看更多)
※ 引述《purewind》之銘言 : ※ 引述《sai0224sai (塞啦)》之銘言 : : 看中國那邊都在用游戲、手游 : : 沒看過遊這個字出現 : : 是真的沒有"遊"還是單純跟臺灣的"因該"一樣變成年輕人分不清的地方? : 說到簡轉繁,我搞不懂機器翻譯為什麼永遠搞不定常用的繁體字 : 舉例: : 遊戲→游戲、什麼→什么、豆干→豆幹 : 一個→壹個、一隻→一只 : 不該翻的亂翻,該翻的又不翻 : 現在AI文字處理不是在吹可以辨識情緒、寫詩、寫新聞 : 結果這麼簡單的簡轉繁反而做不到= = : 不過好處是跳板仔一下子就露餡了: p : ---- : Sent from BePTT on my Google Pixel 4a (5G) 因為簡體為求簡易,簡體會用大量同樣的字代換繁體 例如你舉例的游泳、遊戲,在繁體的編碼中是兩個不一樣的編碼 但在簡體裡是「游泳、游戏」,字都是「游」,編碼都是一樣的 你繁轉簡很簡單,反正導出的結果是唯一的 但簡轉繁,機器哪裡知道你要的繁體編碼是「游」的還是「遊」的? 比較智障的機器就會得出你舉的例子(但聰明一點的也只是預設字庫多一點點而已) 所以要精確簡轉繁,要嘛建立字庫彙集使用習慣 要嘛用AI自主學習,來輔助建立字庫 比如說「裡面」和人名「里昂」 簡體是「里面」和人名「里昂」 字庫裡就先設定好,繁化時遇到這種情況,一個要轉成「裡」,一個要轉成「里」 另外以前也有聽說過反向處理,轉換時去尋找簡體還沒被轉成簡體前的繁體編碼 來精確的還原正確的繁體字 不過我不懂程式,不知道這到底是傳說還是實際可用 ---- Sent from BePTT -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.33.134 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1630936528.A.681.html

09/06 21:56, 2年前 , 1F
字庫設定好 會變成鋼彈八成
09/06 21:56, 1F

09/06 21:57, 2年前 , 2F
09/06 21:57, 2F

09/06 21:58, 2年前 , 3F
字庫設定好有時候也會有過度翻譯,像那個王國計程車兵
09/06 21:58, 3F

09/06 22:01, 2年前 , 4F
楊文里面向南方 會變成楊文裡面向南方
09/06 22:01, 4F
這就很像調教注音輸入法 你到底是想要遇到「面向」時優先呢 還是遇到「裡面」時優先呢 這個字庫真的無法解決,唯有依靠AI學習

09/06 22:01, 2年前 , 5F
...的士
09/06 22:01, 5F

09/06 22:03, 2年前 , 6F
精準翻譯一定要人工,翻譯不只單純字體切換還要做到語
09/06 22:03, 6F

09/06 22:03, 2年前 , 7F
意跟表達,後者還會有創作的部分。所以翻譯通常屬於原
09/06 22:03, 7F

09/06 22:03, 2年前 , 8F
創,AI最高只能做到意思或字體轉換要詞達義目前的技術
09/06 22:03, 8F

09/06 22:03, 2年前 , 9F
做不到。(目前的最好方式回歸英文再翻出來,不過我覺
09/06 22:03, 9F

09/06 22:03, 2年前 , 10F
得這個有時會把狀況弄的更糟糕)
09/06 22:03, 10F
我說的這些僅止於「精準繁化」 尤其像備份對岸小說時,如果還要把用字遣詞和語句邏輯都轉成台灣的 那不是累死了xDD 不是單就用語習慣轉換的話,繁化姬表現的還不錯 不過說實話,真的會有人想要拿簡體去「翻譯」嗎?

09/06 22:07, 2年前 , 11F
反向那個除非原本就有刻意作保留 不然應該是辦不到
09/06 22:07, 11F
我也覺得是這樣,編碼轉換過都不見了 到底是要怎麼精準還原…不過如果有方法留下可能就可以了 但如果原本就是簡體,就算這個方法可行也無能為力 ※ 編輯: dbwu (122.116.33.134 臺灣), 09/06/2021 22:15:16

09/06 22:24, 2年前 , 12F
簡體的東西寧可看原文,反正都練習過了。
09/06 22:24, 12F

09/06 22:25, 2年前 , 13F
其實還蠻多簡體(翻譯)的,只是用在的地方可能不是文
09/06 22:25, 13F

09/06 22:25, 2年前 , 14F
章。通常用在程式跟人機介面,因為要簡單易懂邏輯合理
09/06 22:25, 14F

09/06 22:25, 2年前 , 15F
。台灣也有用日文的英文的都有,不過這類的翻譯通常是
09/06 22:25, 15F

09/06 22:25, 2年前 , 16F
工程師去寫的
09/06 22:25, 16F

09/06 22:25, 2年前 , 17F
花那個力氣去繁化就是麻煩。而且看了反而頭痛。
09/06 22:25, 17F

09/06 22:26, 2年前 , 18F
看那種取向,尤其是教育取向不可能給台灣的小孩子閱讀
09/06 22:26, 18F

09/06 22:26, 2年前 , 19F
簡體邏輯的
09/06 22:26, 19F

09/06 22:28, 2年前 , 20F
另外像技術文獻,台灣用詞一定要精準所以也不可能用對
09/06 22:28, 20F

09/06 22:28, 2年前 , 21F
岸用語
09/06 22:28, 21F

09/07 09:05, 2年前 , 22F
太極無按兩下
09/07 09:05, 22F

09/07 09:06, 2年前 , 23F
鋼彈五成
09/07 09:06, 23F

09/07 09:07, 2年前 , 24F
好奇簡繁轉換除了翻遊戲文本的以外都什麼人在用
09/07 09:07, 24F
文章代碼(AID): #1XDXtGQ1 (C_Chat)
文章代碼(AID): #1XDXtGQ1 (C_Chat)