[討論] 淺談AlphaGo

看板GO作者 (いちご)時間7年前 (2017/01/05 10:04), 7年前編輯推噓17(17043)
留言60則, 19人參與, 最新討論串1/4 (看更多)
這幾天 AI又帶給了大家新的衝擊 AlphaGo又再次進化了 而且遠超乎大家的想像 顯然之後AI會更加深入這塊圈子 影響只會越來越廣 不得不深思要怎麼看待這場新的革命 雖然有些人說AI能使圍棋的發展更進一步 但坦白說我是有些悲觀的 因為從本質上AlphaGo就跟人類差太多了 首先 AlphaGo的演算法是追求勝率最高 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者 因為對它來說目數不重要 只要能贏就夠了 另外 AlphaGo都是在做全域運算 它沒有局部的概念 這兩點就跟人類的思考方式南轅北轍 難怪有人看了AlphaGo的棋感嘆 之前所學的都是錯的 就因為兩者的基礎點不同 也可說是演算法的不同 當然演化出來的棋路會有差別 而哪邊更加接近圍棋之神呢 相信AlphaGo已給出了答案 你可以說人類一直都用錯誤的方法學圍棋 但這是人類生理上的拘限性所導致的 我們幾乎永遠不可能像AlphaGo那樣思考 比起目數 勝率那種東西是虛無飄渺的 人類又怎麼能量化呢 當然只能計算目數 所以說要向AI學習 我是有些疑問的 要怎麼學呢 AlphaGo會告訴你要那樣下 但為什麼? 不知道 你沒法把AlphaGo的棋路內化 因為思考模式就不同 頂多只能依樣畫葫蘆 這樣的學習效果是有限的 我想過如果AlphaGo不追求最大勝率 而是最大目數的話會如何 這樣發展出的圍棋會不會更接近人類呢 這樣的發展或許會很有意思 相對的 我們對人類至今發展出的圍棋也不需太過悲觀 雖然舊的棋路 定石在AlphaGo 甚至圍棋之神眼中或許是錯的 但我們還是得擁抱它 因為我們是人類 不是AlphaGo -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.167.183.5 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483581860.A.95D.html

01/05 10:17, , 1F
推 有道理
01/05 10:17, 1F
※ 編輯: ykes60513 (118.167.183.5), 01/05/2017 10:20:34

01/05 10:20, , 2F
這很難說 吳國手也層革命說高者在腹 以前人也都不下星
01/05 10:20, 2F

01/05 10:20, , 3F
位的
01/05 10:20, 3F

01/05 10:26, , 4F
我認為等圍棋AI普及後,它是會告訴你「為什麼」要這樣
01/05 10:26, 4F

01/05 10:26, , 5F
下的。將棋軟體的顯示方式就是和你說不同下法的評級值
01/05 10:26, 5F

01/05 10:26, , 6F
,以及這下法的後續各種變化可以隨時參照。圍棋到時也
01/05 10:26, 6F

01/05 10:26, , 7F
是做得到
01/05 10:26, 7F

01/05 10:30, , 8F
人類也是追求最高勝率吧 不然怎麼有贏棋不鬧事的說法呢
01/05 10:30, 8F

01/05 10:37, , 9F
人類是追求目數也追求勝率, 只是兩件事都做不好而已
01/05 10:37, 9F

01/05 10:39, , 10F
理論上棋神只追求目數, 因為祂知道每一手的目數...
01/05 10:39, 10F

01/05 10:46, , 11F
"讓AI指導人類"本身也是一種AI,可能會成為未來的發展
01/05 10:46, 11F

01/05 10:51, , 12F
確實人類究竟可以跟阿法狗學到多少,還很難說。畢竟阿法
01/05 10:51, 12F

01/05 10:51, , 13F
狗實力領先人類太多,思維也不同,棋手真要模仿阿法狗下
01/05 10:51, 13F

01/05 10:51, , 14F
棋,恐怕會被傳統棋士電
01/05 10:51, 14F

01/05 11:05, , 15F
最大勝率跟最大目數沒有衝突吧
01/05 11:05, 15F

01/05 11:06, , 16F
圍棋實力是經驗與計算力的綜合表現
01/05 11:06, 16F

01/05 11:06, , 17F
論經驗AI下棋數量遠大於人類 論計算能力AI更是遠勝人類
01/05 11:06, 17F

01/05 11:08, , 18F
這樣的條件下 人類如何跟AI學習
01/05 11:08, 18F

01/05 11:24, , 19F
拜託...阿法狗演算法也是人寫出來的好嗎..
01/05 11:24, 19F

01/05 11:24, , 20F
計算最難的是殺棋跟死活,目前來看,局部人沒輸
01/05 11:24, 20F

01/05 11:25, , 21F
開發團隊絕對能用人腦算出每一步只是時間問題
01/05 11:25, 21F

01/05 11:25, , 22F
問題是Master總是下到一半,發現人類棋手會有一塊孤
01/05 11:25, 22F

01/05 11:25, , 23F
01/05 11:25, 23F

01/05 11:26, , 24F
至於人類一直懷疑為什麼電腦不追求最大目數勝利
01/05 11:26, 24F

01/05 11:26, , 25F
沒有捉摸不定,只要你了解演算法且算的夠快,也能當
01/05 11:26, 25F

01/05 11:26, , 26F
阿法狗,就這樣
01/05 11:26, 26F

01/05 11:27, , 27F
那只是不懂的人在瞎起鬨,難道人類棋手一開始是?
01/05 11:27, 27F

01/05 11:32, , 28F
也許能從中找到規律跟棋理,幫助人類
01/05 11:32, 28F

01/05 11:33, , 29F
就像三行程式可以簡化為一行程式
01/05 11:33, 29F

01/05 11:33, , 30F
這個只要練習跟研究過,還是可以達到的
01/05 11:33, 30F

01/05 11:35, , 31F
簡單講如果今天下慢棋,電腦能六十盤全贏嗎?很難說
01/05 11:35, 31F

01/05 11:35, , 32F
去年的alphago每秒鐘能考慮10萬種棋路 這個計算能力
01/05 11:35, 32F

01/05 11:35, , 33F
人類要怎麼彌補
01/05 11:35, 33F

01/05 11:40, , 34F
李世石有贏一盤
01/05 11:40, 34F

01/05 11:44, , 35F
圍棋高段打低段也不是100%勝率阿
01/05 11:44, 35F

01/05 11:46, , 36F
局部死活人早就輸了,估一下熊貓老師
01/05 11:46, 36F

01/05 12:02, , 37F
演算法是人寫的 但演算是電腦做的
01/05 12:02, 37F

01/05 12:03, , 38F
電腦的經驗是靠電腦自己演算取得的
01/05 12:03, 38F

01/05 12:04, , 39F
你開發團隊教電腦怎麼學 但你跟不上電腦學的速度
01/05 12:04, 39F

01/05 12:04, , 40F
電腦轉瞬間創造一億盤的經驗 你是黃也跟不上
01/05 12:04, 40F

01/05 12:05, , 41F
所以 論經驗和計算速度 人類確實不可能超越電腦
01/05 12:05, 41F

01/05 12:11, , 42F
研究這60盤棋之後,再仔細細想要怎麼贏,連職業棋士都明白
01/05 12:11, 42F

01/05 12:12, , 43F
沒讓子的狀況下,再怎麼樣都沒什麼機會贏..
01/05 12:12, 43F

01/05 12:30, , 44F
我是覺得看多了自然對勝率會有感覺,也許以後每天人類
01/05 12:30, 44F

01/05 12:31, , 45F
每天看AlphaGO自戰500盤,不要多想一盤5分鐘,看看它
01/05 12:31, 45F

01/05 12:32, , 46F
怎麼圍空的,20年後就能對那種勝率有大約的感覺
01/05 12:32, 46F

01/05 12:35, , 47F
講錯了,100盤就好,500盤要40小時XD
01/05 12:35, 47F

01/05 12:37, , 48F
所以以後最強棋手都30歲以上,從6歲開始每天看100盤
01/05 12:37, 48F

01/05 12:38, , 49F
每天8小時看AI棋譜100盤、4小時正常練棋、3小時對役
01/05 12:38, 49F

01/05 12:42, , 50F
看幾盤根本不是重點 重點是看了之後是否能吸收進而增加
01/05 12:42, 50F

01/05 12:42, , 51F
棋力 你讓小學生每天看10題微積分 又不加以指導
01/05 12:42, 51F

01/05 12:42, , 52F
小學生會變成微積分高手嗎
01/05 12:42, 52F

01/05 12:44, , 53F
高手的棋感本來就是靠下幾千盤幾萬盤從小養成的
01/05 12:44, 53F

01/05 12:45, , 54F
所以都說頂尖高手要再進步1目都很困難
01/05 12:45, 54F

01/05 12:48, , 55F
一盤5分鐘 一天100盤 能做得到當然是頂尖高手 無話可說
01/05 12:48, 55F

01/05 12:51, , 56F
而且還是看AI而非人類下出來的棋譜
01/05 12:51, 56F

01/05 13:48, , 57F
厄 DM寫的不是圍棋演算法 是學習演算法 學成什麼東西不是程
01/05 13:48, 57F

01/05 13:48, , 58F
式人員控制的
01/05 13:48, 58F

01/05 13:50, , 59F
AG列出所有它想過的棋路,不過那也不是人類可以消化的
01/05 13:50, 59F

01/05 13:54, , 60F
就是只跟AlphaGo說圍棋規則 剩下的就是AlphaGo自己學習
01/05 13:54, 60F
文章代碼(AID): #1ORQcabT (GO)
討論串 (同標題文章)
文章代碼(AID): #1ORQcabT (GO)