[討論] 台灣語言的 Siri / Google Assistant

看板Soft_Job作者 (館長用朕名號 請付費)時間6年前 (2018/03/31 23:21), 6年前編輯推噓22(341271)
留言117則, 52人參與, 6年前最新討論串1/4 (看更多)
最近假日有空常常在調戲 iPad 的 Siri, 但用到一半, 就很感嘆台灣人為什麼只能用中國話, 而不能用台灣人自己的語言作語音助手? (當然我知道 siri 會幾句台語, 但是那根本不叫"會". 客語原語根本就不用想了.) 上網查了一下, 好像還沒有人作相關計畫. 政府最近不是要花錢補助 AI? 是否應該分出一部份的錢, 補助廠商在台灣聘請相關人員研發相關技術? 好處有三: 1. 研發的主體性 若是研究中文或英文等主要語言辯識, 台灣因為走的太慢, 必然是研發中心的邊緣, 特別是外商不會把研發的主體放在台灣. 若是以台灣語種作為研發中心, 則最核心的部門都會在台灣(就算受補助的是外商), 在台灣的研究人員可以作為整個研究的主體, 且永遠不會被邊緣化. 且這些研究結果, 除了台客語在中國數省及東南亞有大量應用外. 原語因為與南島各語有關連性, 在現在南島多數語言尚未有語音助手的情況下, 台灣研究人員先作下去, 是否就可以搶占一部份先機? 2. 政治的主體性 這就不用說了, 語言越分離, 則雙方心理上分離的傾向越大. 這也是中國政府這十幾年傾力消滅漢語方言及少民語言的原因. 3. 文化的延續性 我真的不希望, 十幾二十年後電腦多數用語音操作時, 仍然只能用中文. 真的很可悲. 在這樣環境成長的下一代, 縱使會說一部份台灣語言, 對台灣各語的想法可能就和古文和拉丁文差不多了吧? 這樣台灣的文化是不是亡了呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.194.159.170 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1522509694.A.C0D.html

03/31 23:28, 6年前 , 1F
這就是必然的一種消長吧
03/31 23:28, 1F
希伯來文還從死語復活呢. 且這也是替台灣自然語言處理人員取得研發主體性的機會.

03/31 23:45, 6年前 , 2F
市場不夠大,要投入的資源不符成本
03/31 23:45, 2F
所以政府要補助啊.

04/01 00:32, 6年前 , 3F
政府規定的官方語言是北京漢語 什麼時候是台語了 嚴格來說
04/01 00:32, 3F

04/01 00:32, 6年前 , 4F
那也不是台語 是福建一帶的話 去福建一堆人都在講河洛話
04/01 00:32, 4F

04/01 00:32, 6年前 , 5F
要siri學地方方言 大陸有多少方言要入列啊
04/01 00:32, 5F
1. 台語比褔建話一詞更早被人說. 而且褔建也不是只有河洛話. 2. 中國要不要做相關研究干台灣人屁事, 台灣先做搞不好還佔先機. 因為現在中國法西斯不會讓褔建&客家搞漢語分化 (連siri粵語中國人都有不爽的) 等到他們過幾十年想撿回來時, 台灣就是這些地方的精神祖宗了.

04/01 00:34, 6年前 , 6F
事實就是不是全台灣人都說閩南語
04/01 00:34, 6F
我有說只做河洛話嗎? 滿腦子獨尊中國話卻連中文也看不懂? ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 00:46:20

04/01 00:45, 6年前 , 7F
很有理想 很好 不過蘋果公司不是慈善企業
04/01 00:45, 7F

04/01 00:45, 6年前 , 8F
聽說蘋果之前有找做台語語音處理的人
04/01 00:45, 8F

04/01 00:46, 6年前 , 9F
不管是不是官方語言 夠多人說他一定做
04/01 00:46, 9F
所以我說這次政府AI補助可以走這個方向啊. = = 麻煩看一下全文吧. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 00:47:31

04/01 00:53, 6年前 , 10F
讓你更崩潰的事實是:科大訊飛的閩南語辨識已經領先了
04/01 00:53, 10F

04/01 00:54, 6年前 , 11F
市場輸人 技術也輸人 不要以為自己文化有多大吸引力
04/01 00:54, 11F
科大最近才剛來台灣找金融等業的合作機會. 我是不知道他們有在搞這些, 但是連中國這種獨尊中文的環境人家都在搞, 台灣人難道不能作? 另外鄭重說明, 台灣文化外國人有多大吸引力我管不著, 若台灣人不想尊重本國文化, 可以選擇不要在台灣. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:12:31

04/01 01:16, 6年前 , 12F
為什麼說台語就是台灣文化啊?
04/01 01:16, 12F

04/01 01:18, 6年前 , 13F
科大本來就在做中國各地方言了,閩南語當然是其中之一
04/01 01:18, 13F

04/01 01:19, 6年前 , 14F
你好像以為做一個大規模商用的語音辨識很容易 XDD
04/01 01:19, 14F
就是不容易, 不然我幹麻不直接捐錢給研究室做一個. 因為不容易, 所以希望政府這次AI出錢的計畫能放一些有意義的東西上面. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:23:17

04/01 01:22, 6年前 , 15F
做不出來的原因就是:講台語的人1)太窮 做完也沒價值 2)
04/01 01:22, 15F

04/01 01:22, 6年前 , 16F
太廢 收不到資料 做不出研究
04/01 01:22, 16F

04/01 01:22, 6年前 , 17F
不是你"想不想"或"難道不行"的問題
04/01 01:22, 17F

04/01 01:25, 6年前 , 18F
但文化內涵又不足以吸引外國人來做 就這樣
04/01 01:25, 18F

04/01 01:27, 6年前 , 19F
而且保存文化也應該是鼓勵學習和創作 建個模型要幹嘛XDD
04/01 01:27, 19F

04/01 01:29, 6年前 , 20F
你以為政府都沒補助台語ASR的計畫?多了去了,為什麼你
04/01 01:29, 20F

04/01 01:29, 6年前 , 21F
都一無所知 想過原因嗎
04/01 01:29, 21F
台語asr的部份可以舉幾個過去案例嗎? 打算了解其過去失敗原因. ※ 編輯: GenghisKhan (123.194.159.170), 04/01/2018 01:32:14

04/01 01:35, 6年前 , 22F
data有點少有點難學耶 光是找一個大corpus學embedding
04/01 01:35, 22F

04/01 01:35, 6年前 , 23F
就不知道哪裡找 遍還要可以index的concept數量可能也不
04/01 01:35, 23F

04/01 01:35, 6年前 , 24F
04/01 01:35, 24F

04/01 01:39, 6年前 , 25F
因為沒有需求 業界沒有動機投入太多心力 開發能量只有幾
04/01 01:39, 25F

04/01 01:40, 6年前 , 26F
間大學和中研院的語音lab 真的有戰力的教授可能不到十
04/01 01:40, 26F

04/01 01:40, 6年前 , 27F
個…
04/01 01:40, 27F

04/01 01:42, 6年前 , 28F
而且成果質量最多是發paper 其實不足以商用 往往是技轉
04/01 01:42, 28F

04/01 01:42, 6年前 , 29F
之後就沒下文了 從沒在市場上出現
04/01 01:42, 29F

04/01 01:45, 6年前 , 30F
你把原住民話放在哪?應該先做原住民話吧?
04/01 01:45, 30F

04/01 01:52, 6年前 , 31F
這樣算失敗嗎 不算吧 只是不合你那無謂自卑和莫名自大
04/01 01:52, 31F
還有 46 則推文
04/01 13:26, 6年前 , 78F
方言用戶太少=沒市場 商用實用化很難大公司沒人會做吧
04/01 13:26, 78F

04/01 13:27, 6年前 , 79F
況且台語/閩南語分支超多 要用哪個地區的為主都是問題
04/01 13:27, 79F

04/01 13:27, 6年前 , 80F
光是台灣簡單的一句 "洗"菜 "煮"飯 就有多少講法了
04/01 13:27, 80F

04/01 13:43, 6年前 , 81F
認同 請政府大力砸錢 像離岸風力一樣 我先佈局
04/01 13:43, 81F

04/01 14:42, 6年前 , 82F
別鬧了
04/01 14:42, 82F

04/01 15:36, 6年前 , 83F
資料謝謝 哪裡來台語corpus??????
04/01 15:36, 83F

04/01 15:40, 6年前 , 84F
台灣很多人做事之前都會先想好100個做不到的理由
04/01 15:40, 84F

04/01 15:45, 6年前 , 85F
我會是不贊成做的其中一個. 理由無它, 資源有限, 要補助也要
04/01 15:45, 85F

04/01 15:46, 6年前 , 86F
是補助能幫助台灣在AI技術某些領域領先並且能商業化
04/01 15:46, 86F

04/01 15:46, 6年前 , 87F
你說的偏個人情感與政治傾向, 可以自己出錢做, 但不適合用
04/01 15:46, 87F

04/01 15:47, 6年前 , 88F
公眾資源
04/01 15:47, 88F

04/01 15:47, 6年前 , 89F
你知道閩南語很多地方的語調都不同嗎? 滾回八卦板取暖比
04/01 15:47, 89F

04/01 15:47, 6年前 , 90F
較實在
04/01 15:47, 90F

04/01 15:48, 6年前 , 91F
補助能夠商業化的技術重點在於, 它才有帶動後續投資的效益
04/01 15:48, 91F

04/01 15:48, 6年前 , 92F
以及不會因為沒有市場而錢灑完就無以為繼
04/01 15:48, 92F

04/01 17:51, 6年前 , 93F
有反面意見你就開嗆 情緒管理也太差XDD
04/01 17:51, 93F

04/01 18:22, 6年前 , 94F
蚊子館,蚊子語音助理
04/01 18:22, 94F

04/01 20:09, 6年前 , 95F
推 atpx大 的意見
04/01 20:09, 95F

04/01 20:45, 6年前 , 96F
就算台語腔調都有很多種 這樣要做哪一個
04/01 20:45, 96F

04/01 20:46, 6年前 , 97F
而且現在中文 英文也不是說就做多好了
04/01 20:46, 97F

04/01 20:46, 6年前 , 98F
還有很多要改善的
04/01 20:46, 98F

04/01 20:47, 6年前 , 99F
另外如前面說的 根本沒市場 正負要補助的東西還要很多
04/01 20:47, 99F

04/01 23:44, 6年前 , 100F
你自己都不尊重你自己國家的人了 滿腦熱血文青qq 有夢最
04/01 23:44, 100F

04/01 23:44, 6年前 , 101F
美 加油
04/01 23:44, 101F

04/02 00:54, 6年前 , 102F
http://bit.ly/2Ij8CMI 雅婷一號開始學台灣人的語言習慣了
04/02 00:54, 102F

04/02 16:19, 6年前 , 103F
台灣就一堆文青在喊主體/文化/環保/反核讓台灣一直空轉
04/02 16:19, 103F

04/02 16:19, 6年前 , 104F
拜託把心思放在國際都在競爭的議題上好咪
04/02 16:19, 104F

04/02 21:10, 6年前 , 105F
中文都做不好了還要做台語 更何況根本沒語料
04/02 21:10, 105F

04/02 23:39, 6年前 , 106F
講白了就是台語只是政治正確的工具,根本沒有商業性。 不支
04/02 23:39, 106F

04/02 23:39, 6年前 , 107F
持就嗆滾出台灣,還真是沒新意,不如說滾回美國或日本喇~
04/02 23:39, 107F

04/02 23:45, 6年前 , 108F
覺得只能說中文很可悲,那就用英文或日文啊? 幹嘛強迫自己
04/02 23:45, 108F

04/02 23:47, 6年前 , 109F
那麼可悲咧? 人家非洲墨人就沒在管那些,一直講母語用母語
04/02 23:47, 109F

04/02 23:48, 6年前 , 110F
因為他們沒有這些需求。 那你現在談的是商業產品,你講的三
04/02 23:48, 110F

04/02 23:49, 6年前 , 111F
件事情,對於商業化來說都是沒意義的東西。 未來世界一堆語
04/02 23:49, 111F

04/02 23:53, 6年前 , 112F
言會消失,只剩下英系、拉丁語、阿拉伯語、中文等語言,就
04/02 23:53, 112F

04/02 23:54, 6年前 , 113F
只是因為用的人口多。 台語不會消失,原因單純是因為它是中
04/02 23:54, 113F

04/02 23:55, 6年前 , 114F
文的方言之一而己。 沒人用的東西,就不會有人開發。
04/02 23:55, 114F

04/02 23:59, 6年前 , 115F
同意樓上 就連學校的Lab也不太願意研究沒人關注的議題
04/02 23:59, 115F

04/03 00:00, 6年前 , 116F
需要賺錢維持經營的公司 更不可能研究沒商業價值的事情
04/03 00:00, 116F

04/06 08:19, 6年前 , 117F
你可以去請中國福建省的主委補助你
04/06 08:19, 117F
文章代碼(AID): #1QlwT-mD (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1QlwT-mD (Soft_Job)