[請益] AlphaGo Zero方法的運用場景?

看板Soft_Job作者 (達)時間6年前 (2017/11/05 23:40), 6年前編輯推噓14(14035)
留言49則, 17人參與, 6年前最新討論串1/3 (看更多)
圍棋給初始規則後,AI不再需要人類插手(人類棋譜) 因為規則和勝負條件明確 AI可自己產生天文數字的對局來訓練 自行學習進化打敗人類 但如果是語音/影像辨識 好像還是必須靠人類不斷餵題目和正確答案 AI才能由給定的題目和答案,找出其中的關係 語音影像辨識這種AI無法自己製造樣本 AlphaGo Zero方法是不是就不適用 這樣AlphaGo Zero這種模式(不用人類給樣本) 除了益智遊戲 還有哪些可應用啊? thanks -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.65.89.53 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1509896457.A.495.html

11/05 23:57, 6年前 , 1F
金融交易
11/05 23:57, 1F
可行,不用人工一直給確認樣本

11/06 00:42, 6年前 , 2F
影像聲音才是生成樣本最多的==最近gan那麼紅
11/06 00:42, 2F

11/06 00:44, 6年前 , 3F
現在生成樣本解析度很高了
11/06 00:44, 3F
影像聲音還是需要人類給答案啊

11/06 01:08, 6年前 , 4F
醫療的應用,像是病理分析、基因定序、遺傳解析、物理
11/06 01:08, 4F

11/06 01:08, 6年前 , 5F
方面的應用也可以,公式推導、模式預測等等,其實人類
11/06 01:08, 5F

11/06 01:08, 6年前 , 6F
目前還有很多事物是知道結果並不清楚原因,人工智慧可以
11/06 01:08, 6F

11/06 01:08, 6年前 , 7F
幫助我們用新的角度檢視既定事實並且釐清過程
11/06 01:08, 7F

11/06 01:28, 6年前 , 8F
是說學語音辨識,可以先想想一般人學一門語言也是前人、父
11/06 01:28, 8F

11/06 01:28, 6年前 , 9F
母仰賴經驗傳承、大量收集跟閱聽影音訓練出來的嗎
11/06 01:28, 9F

11/06 01:29, 6年前 , 10F
所以說,我不認為做語音或影像辨識資料依賴樣本,是有哪裡
11/06 01:29, 10F

11/06 01:29, 6年前 , 11F
不正確
11/06 01:29, 11F

11/06 01:31, 6年前 , 12F
阿發狗 0 他厲害的地方在於不用仰賴別人的套路,自己找出一
11/06 01:31, 12F

11/06 01:31, 6年前 , 13F
些作法來解決該棋局怎麼下到贏,他可能在解決一些人類無法
11/06 01:31, 13F

11/06 01:31, 6年前 , 14F
探究或是在有限的時間都無法解決的事情上可能會帶來其他的新
11/06 01:31, 14F

11/06 01:31, 6年前 , 15F
觀點
11/06 01:31, 15F

11/06 01:33, 6年前 , 16F
但語言辨識用不用著alpha go zero這種
11/06 01:33, 16F

11/06 01:33, 6年前 , 17F
我的看法是,你既然要辨識(學習)某些語言
11/06 01:33, 17F

11/06 01:35, 6年前 , 18F
你自己想出一個套語言意義何在,那到底是外星語 還是你要學
11/06 01:35, 18F

11/06 01:35, 6年前 , 19F
習的那個目標語言?當然要跟別人從溝通、書籍來學習啊..
11/06 01:35, 19F

11/06 01:56, 6年前 , 20F
協助人類做辨識還是得用人類的方法來學習,不然出來的結果
11/06 01:56, 20F

11/06 01:56, 6年前 , 21F
未必不好,但看的人未必能同意你辨識的正確。
11/06 01:56, 21F
同意 Zero不太適合語音影像辨識

11/06 04:42, 6年前 , 22F
我的理解是Alphago也是從人類棋譜做supervised lear
11/06 04:42, 22F

11/06 04:42, 6年前 , 23F
ning,再以reinforcement learning不斷強化。若定好
11/06 04:42, 23F

11/06 04:42, 6年前 , 24F
規則後就單靠RL一直學,感覺很容易落入local optimu
11/06 04:42, 24F

11/06 04:42, 6年前 , 25F
m。聽過的類似場景有決策類遊戲,deep mind好像打
11/06 04:42, 25F

11/06 04:42, 6年前 , 26F
算征服星海爭霸
11/06 04:42, 26F

11/06 04:58, 6年前 , 27F
啊...抱歉 剛看了下alphago zero的相關文章,發現是
11/06 04:58, 27F

11/06 04:58, 6年前 , 28F
自己的資訊太落後了,請無視QQ
11/06 04:58, 28F

11/06 05:44, 6年前 , 29F
方法是要想的囉 如果你的意思是拿az的RL方法直接套
11/06 05:44, 29F

11/06 05:45, 6年前 , 30F
那應用範圍的確不怎麼廣 不過我覺得主要是吸收那個精神
11/06 05:45, 30F

11/06 05:46, 6年前 , 31F
怎麼利用RL或者其他方法來減少對labeled資料的需求
11/06 05:46, 31F

11/06 08:33, 6年前 , 32F
初音才不是軟體呢
11/06 08:33, 32F

11/06 10:16, 6年前 , 33F
自己想像成自己是一個陌生人,到別的環境生存,你會給自己
11/06 10:16, 33F

11/06 10:16, 6年前 , 34F
怎樣的指令,這就是 AI
11/06 10:16, 34F

11/06 10:17, 6年前 , 35F
在以前光是分裝貨物與貨物,或許都要寫很多判斷程式
11/06 10:17, 35F

11/06 10:17, 6年前 , 36F
但交給 AI 負責這塊工作類別,你只需要跟他溝通負責教會他
11/06 10:17, 36F

11/06 10:18, 6年前 , 37F
而不是重構他的系統程式
11/06 10:18, 37F

11/06 14:37, 6年前 , 38F
星海爭霸未來可能就會出現能互打的AI了
11/06 14:37, 38F

11/06 17:40, 6年前 , 39F
如果星海的自我學習AI被做出來了,大概實際軍事AI也不遠了.
11/06 17:40, 39F

11/06 19:11, 6年前 , 40F
星海人機大戰早比完了,人全勝。
11/06 19:11, 40F

11/06 19:58, 6年前 , 41F
樓上說的是這個嗎?
11/06 19:58, 41F

11/06 21:31, 6年前 , 42F
AlphaGo的星海還沒比吧
11/06 21:31, 42F

11/06 21:56, 6年前 , 43F
用在氣象預測上會有用嗎?
11/06 21:56, 43F

11/07 02:50, 6年前 , 44F
你知道GAN是什麼嗎?
11/07 02:50, 44F

11/07 10:28, 6年前 , 45F
星海的問題在於沒有可以直接給電腦使用的訓練環境 (?
11/07 10:28, 45F

11/07 14:04, 6年前 , 46F
有吧 我印象中deep mind有和bz合作 連環境都開放給大家
11/07 14:04, 46F

11/07 14:04, 6年前 , 47F
玩了 這幾個月的事情
11/07 14:04, 47F

11/08 10:24, 6年前 , 48F
GAN不就罵人的髒字 以前打遊戲常用
11/08 10:24, 48F

11/11 09:19, 6年前 , 49F
樓樓上 pysc2
11/11 09:19, 49F
※ 編輯: dharma (210.65.89.53), 11/11/2017 16:43:16
文章代碼(AID): #1P_p49IL (Soft_Job)
文章代碼(AID): #1P_p49IL (Soft_Job)