[新聞] Meta 台語 AI 翻譯,專家實測:早期測試準確率待加強已刪文
原文標題: Meta 台語 AI 翻譯,專家實測:早期測試準確率待加強
原文連結: http://shorturl.at/flU02
發布時間: 發布日期 2022 年 10 月 21 日 8:36
記者署名: 中央社
原文內容:
Facebook 母公司 Meta 發表人工智慧(AI)翻譯系統,可讓閩南語(台語)與英語互譯
。3C 科技專家 20 日實測後指出,新系統準確率有待加強,超過兩句話就很容易翻譯錯
誤,是早期測試模型常見問題,Meta 積極投入估是為元宇宙社交鋪路。
Meta表示,AI翻譯主要著重於各種書寫語言,但在全球超過7,000種現存語言中,將近半
數主要以口語表達,沒有標準或廣泛使用的書寫文字系統,閩南語就是其中之一。這導致
Meta無法使用標準技術為這類語言打造機器翻譯工具,因為標準技術需有大量的書寫文字
來訓練AI模型。
為了開發只有語音的全新翻譯系統,Meta AI 研究人員必須克服許多來自傳統機器翻譯系
統的挑戰,包括資料蒐集、模型設計以及準確度評估,希望最終能為所有現存語言進行即
時語音翻譯,包括閩南語等主要以口語表達的語言。
YouTube頻道「壹哥的科技生活」主編壹哥接受《中央社》記者採訪表示,他實際測試
Meta AI翻譯系統從閩南語轉英語、英語轉閩南語,失誤率偏高,且反應速度也比較緩慢
,一句話明顯放慢速度念完,還可能出現翻譯錯誤,「不過對於早期的AI測試模型來說,
這都是很司空見慣的情況」。
壹哥坦言,閩南語資料庫建置不易,從時間、人力、物力投入成本的角度來看,都是不符
合成本的策略,這也是Google翻譯至今還未發展閩南語的原因。
讓壹哥比較訝異是Meta重視亞洲市場的程度,因為以往美國公司的測試模組會偏好在比較
大的市場進行,例如歐美、印度、加拿大、澳洲,這次卻從基數相對較少的閩南語出發,
或許說明兩件事。
第一,Meta相當重視亞洲市場動能,包括在台灣投入一定的人力與相關資源;第二,Meta
很可能已經掌握翻譯的關鍵技術,並且已經在做最終測試。
壹哥引述Meta的公開資料指出,這次的閩南語翻譯是透過中文當中介語言,進而在英語和
閩南語之間轉換。換言之,未來如果想以英文當中介語言來翻譯許多地區的當地母語,相
信也不是難事。
「這是一個相當有力的技術宣示」,壹哥認為,新的翻譯系統說明Meta透過AI形式,未來
在元宇宙空間裡以使用者母語直接和外國人暢所欲言的情境,將指日可待。
BBS網路論壇批踢踢(PTT)網友實測發現,MetaAI翻譯系統可以翻譯常見台語,但發音要
正確,但國罵和髒話可能被排除在資料庫外,很難翻譯出來;也有網友表示,英語翻台語
比較難有準確結果,可能還需要時間訓練AI模型。
心得/評論:
稍微測了一下確實準確度跟速度還離實用有段差距
不過感謝咩他又幫手機廠想出新的應用
這比脫褲子放屁的元宇宙用VR搞多人會議來的實用許多
影像跟聲音處理都快玩爛了 即時翻譯用硬體加速似乎有點搞頭
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.161.53.112 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1666433712.A.235.html
推
10/22 18:24,
1年前
, 1F
10/22 18:24, 1F
噓
10/22 18:28,
1年前
, 2F
10/22 18:28, 2F
官方說是Hokkien 你要怎麼解讀自己去想囉
推
10/22 18:36,
1年前
, 3F
10/22 18:36, 3F
推
10/22 18:39,
1年前
, 4F
10/22 18:39, 4F
推
10/22 18:40,
1年前
, 5F
10/22 18:40, 5F
→
10/22 18:40,
1年前
, 6F
10/22 18:40, 6F
確實如此 不過文字對文字我覺得大廠並沒有真的對東亞系的語言認真投入
咩他會選Hokkien當作嘗試 一方面是因為這個語言沒有獨立的書寫系統
文字對文字比較偏向純軟的AI 聲音對聲音要投入的硬體大的多
不過不得不說 yt上面的人工語音技術成熟的超快 很多甚至已經接近人類的語調
一堆明明就是罐頭影片也是做的有聲有色 台灣這方面感覺要加油
推
10/22 18:40,
1年前
, 7F
10/22 18:40, 7F
→
10/22 18:43,
1年前
, 8F
10/22 18:43, 8F
推
10/22 18:43,
1年前
, 9F
10/22 18:43, 9F
→
10/22 18:43,
1年前
, 10F
10/22 18:43, 10F
推
10/22 18:46,
1年前
, 11F
10/22 18:46, 11F
推
10/22 18:48,
1年前
, 12F
10/22 18:48, 12F
噓
10/22 18:48,
1年前
, 13F
10/22 18:48, 13F
確實沒有阿
你認真去看手機廠開發的各種AI 影像處理跟聲音去噪等技術都滿成熟了
機翻確實是一個還沒有很成熟的領域
推
10/22 18:49,
1年前
, 14F
10/22 18:49, 14F
推
10/22 18:49,
1年前
, 15F
10/22 18:49, 15F
推
10/22 18:50,
1年前
, 16F
10/22 18:50, 16F
噓
10/22 18:51,
1年前
, 17F
10/22 18:51, 17F
推
10/22 18:52,
1年前
, 18F
10/22 18:52, 18F
→
10/22 18:52,
1年前
, 19F
10/22 18:52, 19F
推
10/22 18:53,
1年前
, 20F
10/22 18:53, 20F
→
10/22 18:53,
1年前
, 21F
10/22 18:53, 21F
噓
10/22 18:53,
1年前
, 22F
10/22 18:53, 22F
推
10/22 18:55,
1年前
, 23F
10/22 18:55, 23F
→
10/22 18:55,
1年前
, 24F
10/22 18:55, 24F
→
10/22 18:58,
1年前
, 25F
10/22 18:58, 25F
股點在哪喔...............
當年5G 3D列印 人工肉剛出來 你大概也是這種問號吧
推
10/22 18:59,
1年前
, 26F
10/22 18:59, 26F
推
10/22 19:01,
1年前
, 27F
10/22 19:01, 27F
推
10/22 19:04,
1年前
, 28F
10/22 19:04, 28F
→
10/22 19:04,
1年前
, 29F
10/22 19:04, 29F
→
10/22 19:05,
1年前
, 30F
10/22 19:05, 30F
※ 編輯: mooto (218.161.53.112 臺灣), 10/22/2022 19:15:34
→
10/22 19:05,
1年前
, 31F
10/22 19:05, 31F
→
10/22 19:05,
1年前
, 32F
10/22 19:05, 32F
→
10/22 19:05,
1年前
, 33F
10/22 19:05, 33F
→
10/22 19:08,
1年前
, 34F
10/22 19:08, 34F
→
10/22 19:08,
1年前
, 35F
10/22 19:08, 35F
推
10/22 19:09,
1年前
, 36F
10/22 19:09, 36F
→
10/22 19:09,
1年前
, 37F
10/22 19:09, 37F
推
10/22 19:10,
1年前
, 38F
10/22 19:10, 38F
推
10/22 19:12,
1年前
, 39F
10/22 19:12, 39F
→
10/22 19:12,
1年前
, 40F
10/22 19:12, 40F
推
10/22 19:14,
1年前
, 41F
10/22 19:14, 41F
推
10/22 19:15,
1年前
, 42F
10/22 19:15, 42F
推
10/22 19:16,
1年前
, 43F
10/22 19:16, 43F
這種東西只要演算法夠進步就不是問題了
噓
10/22 19:17,
1年前
, 44F
10/22 19:17, 44F
→
10/22 19:21,
1年前
, 45F
10/22 19:21, 45F
噓
10/22 19:21,
1年前
, 46F
10/22 19:21, 46F
推
10/22 19:21,
1年前
, 47F
10/22 19:21, 47F
→
10/22 19:22,
1年前
, 48F
10/22 19:22, 48F
→
10/22 19:22,
1年前
, 49F
10/22 19:22, 49F
→
10/22 19:23,
1年前
, 50F
10/22 19:23, 50F
不好意思 為何曾為全球十大市值的公司發表技術沒有股點
我都說明這個在手機上有賣點了為何毫無股點
噓
10/22 19:23,
1年前
, 51F
10/22 19:23, 51F
→
10/22 19:23,
1年前
, 52F
10/22 19:23, 52F
※ 編輯: mooto (218.161.53.112 臺灣), 10/22/2022 19:28:34
推
10/22 19:26,
1年前
, 53F
10/22 19:26, 53F
→
10/22 19:27,
1年前
, 54F
10/22 19:27, 54F
推
10/22 19:31,
1年前
, 55F
10/22 19:31, 55F
→
10/22 19:40,
1年前
, 56F
10/22 19:40, 56F
→
10/22 19:40,
1年前
, 57F
10/22 19:40, 57F
→
10/22 19:41,
1年前
, 58F
10/22 19:41, 58F
其實這就是資源跟回收利潤的問題
不過你講得比較偏向傳統的大數據作法 用大量輸入去取得數據
如果演算法能有進步到自己去影片爬出數據就沒有這些限制
我覺得總有一天是可行的 畢竟語言進化的速度遠比運算速度慢
推
10/22 19:43,
1年前
, 59F
10/22 19:43, 59F
→
10/22 19:44,
1年前
, 60F
10/22 19:44, 60F
福建的地形跟歷史因素 那語系的確差異很大
※ 編輯: mooto (218.161.53.112 臺灣), 10/22/2022 19:52:10
推
10/22 19:53,
1年前
, 61F
10/22 19:53, 61F
推
10/22 19:53,
1年前
, 62F
10/22 19:53, 62F
→
10/22 19:53,
1年前
, 63F
10/22 19:53, 63F
→
10/22 19:54,
1年前
, 64F
10/22 19:54, 64F
推
10/22 19:55,
1年前
, 65F
10/22 19:55, 65F
→
10/22 19:55,
1年前
, 66F
10/22 19:55, 66F
→
10/22 19:56,
1年前
, 67F
10/22 19:56, 67F
→
10/22 19:56,
1年前
, 68F
10/22 19:56, 68F
→
10/22 19:57,
1年前
, 69F
10/22 19:57, 69F
→
10/22 19:57,
1年前
, 70F
10/22 19:57, 70F
→
10/22 19:58,
1年前
, 71F
10/22 19:58, 71F
→
10/22 20:02,
1年前
, 72F
10/22 20:02, 72F
→
10/22 20:02,
1年前
, 73F
10/22 20:02, 73F