[情報] AlphaGo的未來計畫

看板GO作者 (異質運算)時間7年前 (2017/01/17 15:41), 7年前編輯推噓22(22017)
留言39則, 20人參與, 最新討論串1/1
https://twitter.com/danielequercia/status/820998043629748224 簡單翻譯一下 探索極限 修復知識斷層和最佳化性能 理解AlphaGo的表達,增加可讀性 完全不學習人類棋譜 尋找自我進步的極限 看來目前還沒達到完全不學人類棋譜啊。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.114.32 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1484638905.A.EDF.html

01/17 15:50, , 1F
像搞個全新會自我進化的生物。
01/17 15:50, 1F

01/17 15:52, , 2F
不知道知識斷層是指什麼
01/17 15:52, 2F

01/17 15:59, , 3F
所以master應該就是V25版了,經過一年的自我對弈
01/17 15:59, 3F

01/17 16:05, , 4F
因為AI的深度學習就像個黑箱,人類要搞懂如何變強的?
01/17 16:05, 4F

01/17 16:08, , 5F
原文是Fix knowledge gaps,比較像是找出知識極限的意思
01/17 16:08, 5F

01/17 16:29, , 6F
唉抱歉Google了一下,應該是停止知識鴻溝繼續擴大的意思吧..
01/17 16:29, 6F

01/17 17:41, , 7F
自我增殖、自我再生、自我進化?
01/17 17:41, 7F

01/17 20:21, , 8F
增加可讀性,意味要增加勝率之外的形勢判斷參數?
01/17 20:21, 8F

01/17 21:17, , 9F
增加可讀性的意思是要探討如何讀取AlphaGo的思維邏輯吧
01/17 21:17, 9F

01/17 21:20, , 10F
看來沒多久會出 阿法狗定石精選了…
01/17 21:20, 10F

01/17 22:34, , 11F
[阿法狗自戰解說] 阿法狗著
01/17 22:34, 11F

01/17 22:41, , 12F
狗哥的圍棋階梯教室
01/17 22:41, 12F

01/18 01:30, , 13F
阿發狗youtube實況解說...
01/18 01:30, 13F

01/18 03:40, , 14F
咦,上次Master師父不是說沒喂過任何人類棋譜?
01/18 03:40, 14F
因為上次deepmind說master是new prototype, 有人就引申成沒有餵過人類棋譜。

01/18 05:01, , 15F
推測而己
01/18 05:01, 15F
※ 編輯: HeterCompute (220.136.114.32), 01/18/2017 07:10:03

01/18 09:16, , 16F
new prototype也有可能是加入(或更新)新的演算法。
01/18 09:16, 16F

01/18 10:26, , 17F
不太可能沒餵人類棋譜
01/18 10:26, 17F

01/18 10:29, , 18F
先出個alphago自戰精選集好了,我不貪心,來個兩千譜
01/18 10:29, 18F

01/18 10:29, , 19F
就好xd
01/18 10:29, 19F

01/18 11:00, , 20F
就理論上是可能不餵棋譜的,只是可能需要自我模擬更多局
01/18 11:00, 20F

01/18 11:00, , 21F
棋了,收斂速度可能會慢很多。他們之前就說要做,結果這一
01/18 11:00, 21F

01/18 11:00, , 22F
版還是沒做的理由我猜可能是有短測試覺得收斂速度不夠趕上
01/18 11:00, 22F

01/18 11:00, , 23F
延續熱潮,所以就還是選用有餵棋譜的做法吧,只是我的推
01/18 11:00, 23F

01/18 11:00, , 24F
測就是
01/18 11:00, 24F

01/18 12:12, , 25F
沒有喔 還是有人類棋譜
01/18 12:12, 25F

01/18 14:53, , 26F
alphaGO自戰精選 前幾手會不會都一模一樣啊
01/18 14:53, 26F

01/18 17:14, , 27F
應該還是會有很多下法機率相近所以被隨機選取
01/18 17:14, 27F

01/18 20:55, , 28F
不吃棋譜 就有點像暴力搜尋了 各個位置都試一下 @_@
01/18 20:55, 28F

01/19 01:12, , 29F
現在還有餵的話 意思是初手天元祂可能沒什麼練過?
01/19 01:12, 29F

01/19 01:19, , 30F
餵資料只是初始模型 後面隨著訓練會修正很多
01/19 01:19, 30F

01/19 01:19, , 31F
而且人的棋譜本來就有一些初手天元
01/19 01:19, 31F

01/19 06:53, , 32F
期待新部局 新定石 新觀念 金肚銀邊草角地
01/19 06:53, 32F

01/19 15:47, , 33F
就是一模一樣才有趣,就像有些人會仔細研究某個佈局
01/19 15:47, 33F

01/19 15:47, , 34F
那樣
01/19 15:47, 34F

01/19 17:11, , 35F
沒學棋譜的版本應該會跟學過的對弈吧
01/19 17:11, 35F

01/19 17:12, , 36F
或是直接跟Master來對弈,試著修正模型來取得勝利
01/19 17:12, 36F

01/19 17:18, , 37F
應該讓自己摸索的跟自己摸索的訓練,這樣比較有趣XD
01/19 17:18, 37F

01/19 17:18, , 38F
等哪天自己摸索的能贏現在的alphaGO老師時就厲害了w
01/19 17:18, 38F

01/19 19:57, , 39F
我覺得是跟現在的AlphaGO打,類似進藤光跟佐為那樣XD
01/19 19:57, 39F
文章代碼(AID): #1OVSgvxV (GO)