Re: [請益] Alexa費用問題

看板Soft_Job作者 (lan)時間6年前 (2017/09/15 13:59), 6年前編輯推噓5(5013)
留言18則, 5人參與, 最新討論串2/3 (看更多)
基本上 推文的回覆是錯的 如果你要的是speech to text 那你沒辦法透過alexa拿到使用者的完整對話 https://goo.gl/VsmzHQ 你應該先看一下AVS或是alexa的文件 alexa解決的是辨識使用者的意圖 告訴你這個意圖對應的slot type & value 舉個例子,你要開發一個智慧開燈裝置 你必須針對這件事定義出一個intention => ControlLight 然後這個控制燈的意圖底下可以有對應的slot 像是LightState:on, off 然後給它幾個 Sample Utterances ControlLight Turn {LightState} the light ControlLight Turn the light {LightState} https://goo.gl/WYef22 https://goo.gl/f9siVU 那這樣不管使用者說了甚麼 從最簡單的turn on light 或是 please turn on light 或是 xxx xxx xxxx turn on light xxxx alexa都可以解析出使用者要打開燈 然後對應到燈的狀態是開 alexa就只做到這個程度 也不會跟你收半毛錢 不過你也拿不到使用者當初到底是怎麼說的 後續你可以在endpoint裡面設定這個解析結果要發到哪裡 可以是lambda或是你自己的server 然後去做對應的處理 會被收錢的是這部分 然後我看你的要求 如果不排斥大陸人的產品 那就用這個吧 http://ai.chumenwenwen.com/pages/document/android/example ※ 引述《checkIO (chec)》之銘言: : 大家好 : 不知道有沒有版友的專案有使用到Amazon Alexa : 想了解一下面對一般user的使用量跟費用 : 大概會是多少(多少user跟辨識的用途) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.70.78 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1505455143.A.5AC.html

09/15 14:04, , 1F
如果我不需要知道使用者說了甚麼 只需要辨識出"開燈意圖"
09/15 14:04, 1F

09/15 14:05, , 2F
如果我需要ALEXA回傳"TURN ON"字串 這樣是不需要收錢的?
09/15 14:05, 2F

09/15 14:05, , 3F
喔...是解析的結果......
09/15 14:05, 3F
看不懂你要的東西耶@@? 解析結果是不收費的啊 但是alexa不會告訴你使用者當時到底是怎麼說的 只會把開燈這個結果傳給你指定的位置 後面你再根據這個結果去打開燈 如果你是把結果送到lambda,然後透過aws iot去開燈 那你就會被收費 如果你是把結果送到自己的伺服器,然後自己弄個mqtt server去開燈 那你就不會被收費 如果這是你的需求 你也可以去看一下amazon lex,它是alexa的本體,你把alexa左右兩個a拿到就是它了 因為alexa的彈性還是沒有lex好 舉個例子 定飯店 book hotel 你知道系統要完成訂飯店這件事,大概需要日期、時間、地點、房型這些資訊 但是使用者說話沒有固定的順序 它可能說我要訂紐約9.10號的飯店 或是我要訂9.10號的飯店 或是我要訂飯店 還是我要訂紐約最高級的飯店 這些都是不固定的對話方式,要用alexa解決會很麻煩 但lex自己會根據缺少的資訊,自動跟使用者對話&詢問,把需要的東西補齊 而且它不只語音,連文字也支援 就是可以讓你做個chatbot的意思了 不過既然它這樣厲害 當然就要收費了 https://aws.amazon.com/tw/lex/pricing/ 但amazon目前只支援英文跟德文 如果你要中文 就只能用我上面給的問問了 ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:31:35

09/15 14:37, , 4F
確實可透過lambda那文字意圖和部份speech to text,我實作過
09/15 14:37, 4F

09/15 14:38, , 5F
然後再送文字資料到client
09/15 14:38, 5F
還是你可以分享一下做法 因為alexa解析出的就是intention & slots 你在lambda收到的就已經是辨識完的結果了 所以amazon官方也是這樣回答 test頁面有一個 voice simulator https://imgur.com/a/UeRtV 裡面可以看到送出的封包根本不會有使用者當初說的話 不知道你是怎麼作到的 @@? ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:48:28

09/15 14:41, , 6F
lex是另一套,跟alexa沒直接關係
09/15 14:41, 6F
https://aws.amazon.com/tw/lex/faqs/ 問:什麼是 Amazon Lex? Amazon Lex 是一種服務,用於使用語音和文字來建立交談界面。Amazon Lex 使用與 Alexa 相同的交談引擎技術支援, 提供高品質的語音辨識和語言理解功能,因此可在新 的和現有應用程式中加入複雜的自然語言「聊天機器人」。Amazon Lex 簡化多平台開發 的工作,讓您輕鬆地將語音或文字聊天機器人發佈到行動裝置和多種聊天服務 (如 Facebook Messenger、Slack 或 Twilio SMS)。與 AWS Lambda、AWS MobileHub 及 Amazon CloudWatch 的原生相互操作性,以及易於整合 AWS 平台上許多其他服務 (包括 Amazon Cognito 和 Amazon DynamoDB),這些特性讓機器人開發變得毫不費力。 ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:54:15

09/15 16:04, , 7F
好棒的分享
09/15 16:04, 7F

09/15 16:15, , 8F
09/15 16:15, 8F

09/15 20:05, , 9F
我試過把整個speech當作一個slot XD 高機率成功
09/15 20:05, 9F

09/15 20:05, , 10F
這樣子拿到的就是使用者整個完整的speech
09/15 20:05, 10F

09/15 20:06, , 11F
當然這個intention不能跟其他intention的關鍵字衝到
09/15 20:06, 11F
要硬幹也是可以 但如果是一些語助詞呢 就像開燈 偏偏有人就是喜歡說 乾!給我開燈 這樣這句話要完整捕捉到,我還真不知道slottype跟例句要怎麼設 而且如果為了包山包海設了一堆句子,那系統誤判的機率又更高了 所以重點還是... 如果只是要把聲音轉文字,那從一開始就不應該用alexa啊 alexa是要幫你把使用者的意圖跟關鍵字自動抓出來 使用者原先說什麼,在這邊根本不是重點 重點是使用者的意圖才是 ※ 編輯: langrisser19 (114.198.170.96), 09/15/2017 20:27:27

09/15 21:32, , 12F
你好像誤會我的意思? 因為問題似乎不是出在你說的case
09/15 21:32, 12F

09/15 21:36, , 13F
自訂slot type,列舉的時候多列一點各種字數的句子
09/15 21:36, 13F

09/15 21:38, , 14F
然後整個intent就只有一個slot, ex: "{Message}"
09/15 21:38, 14F

09/15 21:39, , 15F
我大概有列了7~8個各種不同字數的句子,高機率能match到
09/15 21:39, 15F

09/15 21:40, , 16F
當然如果你的case是沒有意義的發音,那本來就轉不成文字
09/15 21:40, 16F

09/15 21:42, , 17F
另外如果是要speech recognition的話,alexa本來就不太適
09/15 21:42, 17F

09/15 21:43, , 18F
合XDD 還不如去用microsoft cognitive
09/15 21:43, 18F
文章代碼(AID): #1PksmdMi (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1PksmdMi (Soft_Job)