[討論] Alphago 離圍棋之神多遠 ?

看板GO作者 (懶龍)時間7年前 (2017/05/28 22:43), 編輯推噓26(26060)
留言86則, 22人參與, 最新討論串1/1
剛寫文時突然有事手殘眼花搞成誤按誤發在此先行致歉。 假定 Alphago 或 後面的AI 不斷進化 , 不知還要進步多少才能 達到終極圍棋或我們說的圍棋之神的境界 ? Alphago要退役 後面就看其他圍棋AI的發展了。 日本古代有棋手說以砍頭為注的話受讓4子就敢奉陪, 跟最新版的 Alphago 不知高手們覺得要被讓到何種程度就有把握 勝算破5成以上? -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.205.236.72 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495982624.A.3C9.html

05/28 22:47, , 1F
是時候廢除職棋九段封頂制了 大家一樣強只是自欺欺人而已
05/28 22:47, 1F

05/28 22:49, , 2F
除了廢除封頂,也要有降段
05/28 22:49, 2F

05/28 22:50, , 3F
三顆以上
05/28 22:50, 3F

05/28 22:51, , 4F
週經文,5/24才被問過
05/28 22:51, 4F

05/28 22:53, , 5F
高川(真正的高川)說 讓九顆也不敢下
05/28 22:53, 5F

05/28 22:54, , 6F
我lag了~~
05/28 22:54, 6F

05/28 23:02, , 7F
以前我還以為大李的全盛期已離圍棋之神不到一先了~~
05/28 23:02, 7F

05/28 23:04, , 8F
黃士傑受訪時說每個月都看得到AG的進步,所以AG離神都還有
05/28 23:04, 8F

05/28 23:05, , 9F
其實我們都看不到
05/28 23:05, 9F

05/28 23:05, , 10F
明顯距離
05/28 23:05, 10F

05/28 23:13, , 11F
只要存在某個貼目,alphaGo自我對戰的黑白勝率無法到95
05/28 23:13, 11F

05/28 23:13, , 12F
:5那麼懸殊,他就沒資格靠近神
05/28 23:13, 12F

05/28 23:16, , 13F
等訓練AI一陣發現AI沒太明顯進步了也許可以說接近了某個極
05/28 23:16, 13F

05/28 23:16, , 14F
線,學習曲線理論上是會越來越平緩的
05/28 23:16, 14F

05/28 23:17, , 15F
但AI到了的極限又有多接近神好像也難講
05/28 23:17, 15F

05/28 23:18, , 16F
像現在貼7.5目,人類黑白勝率大致相近,就可推知離神超
05/28 23:18, 16F

05/28 23:18, , 17F
05/28 23:18, 17F

05/28 23:19, , 18F
樓上的意思我能理解,如果黑貼7.5目是過重的話
05/28 23:19, 18F

05/28 23:20, , 19F
那白棋的勝率應該會在九成以上,因為他已經可以算到
05/28 23:20, 19F

05/28 23:20, , 20F
終盤極大部份的變化了
05/28 23:20, 20F

05/28 23:21, , 21F
假設先行優勢是5目,圍棋之神要做到貼5.5目白全勝,貼4.
05/28 23:21, 21F

05/28 23:21, , 22F
5目黑全勝
05/28 23:21, 22F

05/28 23:22, , 23F
圍棋之神就是窮舉法,但窮舉圍棋變化就連量子電腦也難
05/28 23:22, 23F

05/28 23:23, , 24F
個人覺得有到九成以上,那對我而言就是圍棋之神了
05/28 23:23, 24F

05/28 23:23, , 25F
你是說只要貼目稍不平衡 棋神就能讓某邊勝率100%的意思
05/28 23:23, 25F

05/28 23:24, , 26F
是這樣理解嗎?
05/28 23:24, 26F

05/28 23:25, , 27F
是啊
05/28 23:25, 27F

05/28 23:26, , 28F
先手必勝, 先手必和, 先手必負. 猜完先就決定勝負者為神.
05/28 23:26, 28F

05/28 23:29, , 29F
不過貼目不可能平衡的 現在白棋勝率75% 所以還不算神
05/28 23:29, 29F

05/28 23:30, , 30F
如果AlphaGO訓練到最後單邊勝率100%就能叫神了?
05/28 23:30, 30F

05/28 23:31, , 31F
黃博士說alphago每個月都還在進步,所以有可能100%
05/28 23:31, 31F

05/28 23:32, , 32F
單邊勝率100是必要條件,不是充分條件
05/28 23:32, 32F

05/28 23:32, , 33F
代表未來絕藝或zen團隊有按照論文做的話,要達到目前
05/28 23:32, 33F

05/28 23:33, , 34F
master的強度也是有可能的,還沒看到極限
05/28 23:33, 34F

05/28 23:35, , 35F
不是說要弄個不吃人棋譜自學的版本 不知有沒有再做了
05/28 23:35, 35F

05/28 23:44, , 36F
這次的AG就是不學人類棋譜不是??
05/28 23:44, 36F

05/28 23:45, , 37F
用上一版的AG來教這版的AG,這版用的棋譜是上一版的AG
05/28 23:45, 37F

05/28 23:45, , 38F
還是有人搞不清楚,這版本是自李世石版本自我對奕而來
05/28 23:45, 38F

05/28 23:46, , 39F
但李世石的版本是有參考人類棋譜的。
05/28 23:46, 39F

05/28 23:47, , 40F
就是說有人類血統 但基本上還是個外星人
05/28 23:47, 40F

05/28 23:54, , 41F
想看沒參考純自學會不會真的下成外星人圍棋
05/28 23:54, 41F

05/29 00:00, , 42F
純自學的話 開盤定石會形成非常慢 不是合理的做法
05/29 00:00, 42F

05/29 00:01, , 43F
他是一個學很快的機器,但你基礎不教他要他瞎子摸象他可能
05/29 00:01, 43F

05/29 00:01, , 44F
自學有個缺點是錯誤可能會被保留或放大 因為沒人跟它講
05/29 00:01, 44F

05/29 00:01, , 45F
它可能永遠不知道那邊是錯的 可能還會擴大
05/29 00:01, 45F

05/29 00:01, , 46F
幾年也進步不到人類頂尖。但也許另闢蹊徑時間夠長有另一套
05/29 00:01, 46F

05/29 00:01, , 47F
嗯 沒錯
05/29 00:01, 47F

05/29 00:02, , 48F
神奇的領悟也不一定
05/29 00:02, 48F

05/29 00:35, , 49F
自學錯誤被保留或放大不太可能,除非下錯還能贏..
05/29 00:35, 49F

05/29 00:37, , 50F
要看你怎麼定義,如果自己沒用棋譜,下贏有學棋譜的人
05/29 00:37, 50F

05/29 00:38, , 51F
這樣也算學習人類棋譜的話,那不管幾代AG都不可能達到
05/29 00:38, 51F

05/29 00:39, , 52F
不用人類棋譜的方式
05/29 00:39, 52F

05/29 00:42, , 53F
怎麼不可能 兩邊都用錯的方法下棋啊 當然其中一邊會贏
05/29 00:42, 53F

05/29 00:57, , 54F
自學錯誤是很有可能的,但是以現在這種基於人類棋譜衍生的
05/29 00:57, 54F

05/29 00:57, , 55F
人工智慧,說不定人類也沒辦法找出錯誤之處 XD
05/29 00:57, 55F

05/29 00:58, , 56F
不過印象 DeepMind 團隊有在對局中製造一些雜訊干擾試圖讓
05/29 00:58, 56F

05/29 00:59, , 57F
自我學習的過程盡量不要有這種區域最佳的問題,細節就
05/29 00:59, 57F

05/29 00:59, , 58F
不得而知了
05/29 00:59, 58F

05/29 01:23, , 59F
說的好,還有很大的距離
05/29 01:23, 59F

05/29 01:30, , 60F
我覺得還有三子左右 圍棋這水太深了
05/29 01:30, 60F

05/29 01:34, , 61F
目前窮舉法都算不完 所以一定有變強的可能
05/29 01:34, 61F

05/29 01:34, , 62F
人類的話跟AlphaGo大概兩子以上三子未滿五成勝率吧 跟柯
05/29 01:34, 62F

05/29 01:34, , 63F
潔第二盤看到點希望
05/29 01:34, 63F

05/29 01:39, , 64F
DeepMind有說過,他們在AlphaGo的模擬對手中有刻意加入反
05/29 01:39, 64F

05/29 01:40, , 65F
AlphaGo,專門選擇AlphaGo不太會去選的著手
05/29 01:40, 65F

05/29 01:41, , 66F
用這種方式來減少徹底走偏然後有些著手幾乎沒有評估到的情
05/29 01:41, 66F

05/29 01:41, , 67F
況,這也算是李世石戰神之一手給他們抓出來的問題之解決案
05/29 01:41, 67F

05/29 01:42, , 68F
但我覺得軟體實力大概就這樣了吧 google 也不會再研發了
05/29 01:42, 68F

05/29 01:42, , 69F
現行CNN based演算法一定有極限 不會超出現在alphago太多
05/29 01:42, 69F

05/29 01:42, , 70F
缺少世界頂級科學家的幫助 再突破的機會很小
05/29 01:42, 70F

05/29 01:43, , 71F
D大說的是GAN吧 這一年大家都在玩GAN
05/29 01:43, 71F

05/29 01:47, , 72F
也不完全是,因為AlphaGo並沒有需要區分是否人類著手或是
05/29 01:47, 72F

05/29 01:48, , 73F
AlphaGo著手的這種需求,我覺得基本概念上不太像,雖然實
05/29 01:48, 73F

05/29 01:48, , 74F
做可能有些部分是相通的
05/29 01:48, 74F

05/29 01:49, , 75F
主要是GAN是要盡量「像」某個目標讓判別猜不出來,讓生成
05/29 01:49, 75F

05/29 01:50, , 76F
跟判別同時進步,不過AlphaGo是讓生成中加入「盡量不像」
05/29 01:50, 76F

05/29 01:51, , 77F
的部分來脫出局部最佳,硬要說比較像基因演算法的突變機制
05/29 01:51, 77F

05/29 01:53, , 78F
,用人類的說法就是故意出定石書裡沒有的變化讓他解題XD
05/29 01:53, 78F

05/29 01:55, , 79F
原來如此 超期待AlphaGo的新論文!
05/29 01:55, 79F

05/29 12:46, , 80F
段位制早就不是實力指數了吧
05/29 12:46, 80F

05/29 13:26, , 81F
一些關於anti-AG的討論 https://goo.gl/tqL5hm
05/29 13:26, 81F

05/29 15:49, , 82F
不是gan吧 聽起來比較像RL的Q-learning裡面的explore
05/29 15:49, 82F

05/29 15:50, , 83F
and exploit的explore的部分 順道一提的話 之前Deep
05/29 15:50, 83F

05/29 15:50, , 84F
mind做AlphaGO讓他玩打磚塊 就已經在實作Deep Q L
05/29 15:50, 84F

05/29 22:25, , 85F
如果是人類早就封神了
05/29 22:25, 85F

05/30 18:28, , 86F
對,應該不是GAN
05/30 18:28, 86F
文章代碼(AID): #1PAk8WF9 (GO)