[問題] 為什麼現在AlphaGO開始會"讓"呢?

看板GO作者 (いちご)時間7年前 (2017/05/23 16:08), 7年前編輯推噓27(28117)
留言46則, 29人參與, 最新討論串1/5 (看更多)
其實不是讓 它還是追求勝率 只是如果有勝率90%賺2目 80%賺5目兩種選擇 它會選前者 以人類的角度看起來就像在讓 可是 應該也有勝率90%賺5目 80%賺2目這種可能不是嗎?? 而且應該比前面那種出現的機率要大得多吧? 搞不好10步裡有7步是屬於後者 可能還更多 我覺得目數跟勝率之間還是有相關性的 感覺去年的AlphaGO 這樣的傾向還沒有那麼明顯 之後的Master很明顯就有這種情況 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495526916.A.E4F.html

05/23 16:10, , 1F
樓下AI大師
05/23 16:10, 1F

05/23 16:10, , 2F
去年alphago明明就也很多讓很多空...,另外AlphaGo
05/23 16:10, 2F

05/23 16:11, , 3F
因為他平常訓練的對象 讓他的習慣需要步步為營
05/23 16:11, 3F

05/23 16:11, , 4F
目數概念跟人類相比很薄弱,他每一步看起來是勝率
05/23 16:11, 4F

05/23 16:12, , 5F
一個數字,這個數字是由過往下的棋譜決定的。
05/23 16:12, 5F

05/23 16:13, , 6F
因為他的對手是ALPHAGO,一個不小心會翻盤的阿
05/23 16:13, 6F
我沒說去年的AlphaGO沒有讓 但從Master開始就很明顯 當時就有人開玩笑說 當Master開始下緩手 就表示可以抬下去了XDD ※ 編輯: ykes60513 (140.112.25.100), 05/23/2017 16:14:33

05/23 16:14, , 7F
就AlphaGO自己打自己打多了 以為留下變化更有可被
05/23 16:14, 7F

05/23 16:16, , 8F
記者會說,只有一個條件.就是贏,每一步都是追求最高勝率..
05/23 16:16, 8F

05/23 16:16, , 9F
翻盤機會 畢竟他看的是勝率不是目
05/23 16:16, 9F

05/23 16:17, , 10F
追求的是勝利,而不是目數
05/23 16:17, 10F

05/23 16:18, , 11F
alphago 五盤全都是中押..
05/23 16:18, 11F

05/23 16:18, , 12F
是 追求的是勝率 我一開始就這樣講了
05/23 16:18, 12F

05/23 16:18, , 13F
前者機率比較大,步步為營比步步進逼勝率高
05/23 16:18, 13F
前者的機率比較大嗎?! 好像也有道理 可是有點違反直覺XD

05/23 16:19, , 14F
去年一、二、五盤都讓得明顯,可能是前兩盤大贏讓你感覺
05/23 16:19, 14F

05/23 16:19, , 15F
沒讓很誇張
05/23 16:19, 15F

05/23 16:20, , 16F
如果當初寫的回饋函數是追求最大目數,那他就會有不同
05/23 16:20, 16F

05/23 16:20, , 17F
的樣貌
05/23 16:20, 17F
※ 編輯: ykes60513 (140.112.25.100), 05/23/2017 16:22:57

05/23 16:22, , 18F
你說的第二種可能性應該是前中盤就下掉了
05/23 16:22, 18F

05/23 16:23, , 19F
人機配對賽也許可看出些端倪 到底人直覺跟alphaGO
05/23 16:23, 19F

05/23 16:23, , 20F
對目數
05/23 16:23, 20F

05/23 16:23, , 21F
應該這樣說,當你有n種走法都會贏,但是n種裡面只有
05/23 16:23, 21F

05/23 16:24, , 22F
看法到底差別如何 好壞如何
05/23 16:24, 22F

05/23 16:24, , 23F
2種是不會損目的,這種情況下你會有很大的機率選到
05/23 16:24, 23F

05/23 16:24, , 24F
那n-2種,所以看起來一直在損,但在alphago來看下哪
05/23 16:24, 24F

05/23 16:24, , 25F
都行
05/23 16:24, 25F

05/23 16:31, , 26F
可能到最後勝率都一樣穩贏了吧,就隨機挑一種
05/23 16:31, 26F

05/23 16:40, , 27F
因為你還停留在 下一步贏幾目 他想的是大局雖然這裡虧
05/23 16:40, 27F

05/23 16:40, , 28F
但是整體勝率可以提高
05/23 16:40, 28F

05/23 16:46, , 29F
下小損失的位置,但人類會跟著下消耗掉手數,讓整體結果收
05/23 16:46, 29F

05/23 16:46, , 30F
斂,因此可以提高勝率
05/23 16:46, 30F

05/23 16:47, , 31F
因為已經有一位the 不讓 只好開始讓 >\\\\\\\<
05/23 16:47, 31F

05/23 17:19, , 32F
the 不讓 XD
05/23 17:19, 32F

05/23 17:22, , 33F
配對賽看看如果人類不讓是不是真被AlphaGO打爆
05/23 17:22, 33F

05/23 17:41, , 34F
好幾點都穩贏 所以隨意挑一點下
05/23 17:41, 34F

05/23 17:42, , 35F
Master收官時常下一些明顯虧損的棋
05/23 17:42, 35F

05/23 17:47, , 36F
可以99%贏的落點選擇太多了 只好隨便挑一個點
05/23 17:47, 36F

05/23 17:54, , 37F
樓樓上切錯帳號
05/23 17:54, 37F

05/23 18:02, , 38F
怕人類吐血
05/23 18:02, 38F

05/23 18:26, , 39F
一日圍棋大師、ai大師很多。
05/23 18:26, 39F

05/23 18:28, , 40F
超多 好想電他們喔> <
05/23 18:28, 40F

05/23 18:56, , 41F
the 讓
05/23 18:56, 41F

05/23 19:23, , 42F
怎麼這邊也出現姆斯的梗
05/23 19:23, 42F

05/23 20:01, , 43F
因為alphago在下一盤很大的奇
05/23 20:01, 43F

05/23 23:43, , 45F
反正下週就消失了
05/23 23:43, 45F

05/24 04:25, , 46F
the 不讓
05/24 04:25, 46F
文章代碼(AID): #1P8-u4vF (GO)
討論串 (同標題文章)
文章代碼(AID): #1P8-u4vF (GO)