Re: [討論] 淺談AlphaGo

看板GO作者ilw4e (可以吃嗎？)時間7年前 (2017/01/05 14:06)推噓12(12推 0噓 29→)

留言41則, 10人參與討論串4/4 (看更多)

※ 引述《ykes60513 (いちご)》之銘言： : 這幾天 AI又帶給了大家新的衝擊 : AlphaGo又再次進化了而且遠超乎大家的想像 : 顯然之後AI會更加深入這塊圈子 : 影響只會越來越廣不得不深思要怎麼看待這場新的革命 : 雖然有些人說AI能使圍棋的發展更進一步但坦白說我是有些悲觀的 : 因為從本質上AlphaGo就跟人類差太多了 : 首先 AlphaGo的演算法是追求勝率最高 : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者 : 因為對它來說目數不重要只要能贏就夠了其實這也不算顛覆的概念，學棋的時候老師也會教你，殺了大龍或大幅領先幾乎勝定的時候，你甚至可以自己走幾手單官來確保殺得乾乾淨淨不會出棋只是人的行棋沒有電腦那麼精準，對棋力低的可能領先二十目才能下得這麼保守，不然很可能被翻盤。高手可能十目就能保持勝勢，對電腦可能就是兩目他就可以這樣下了 : 另外 AlphaGo都是在做全域運算它沒有局部的概念 : 這兩點就跟人類的思考方式南轅北轍 : 難怪有人看了AlphaGo的棋感嘆之前所學的都是錯的 : 就因為兩者的基礎點不同也可說是演算法的不同當然演化出來的棋路會有差別我覺得說他沒有局部概念也不正確，AI取點模擬的時候不會全盤每個點都等價，他用訓練出的棋感來猜的時候局部的點一定猜得多。只是說他的模擬方式是全局下完而已 "過去學得都是錯的"我覺得只是柯潔誇飾性的說法。AI多數行棋也還在人的理解範圍，會有下完不知道怎麼輸的原因就是他棋力更高。就像低段跟高段下，明明感覺每個區域都是照定石走，可是就是下不贏這種感覺吧，因為對方子效就是比你高當然一定會有顛覆的地方，因為人類對前期的下法好壞本來就是模糊不太確定的，看布局跟定石都是一陣陣流行的就很明顯。有時候過去覺得不好的定石重新被拿出來用，結果變成標準型，就知道人對這種東西的判斷是不準確的比方說AI的五路尖衝，過去棋理告訴人說被四路圍空是吃虧的，但或許這是建立在一般人對外勢的運用效率不夠好的原因下。看AI的對局，它的外勢不是最終成空就是能配合攻擊在其他地方取利。人類當然也知道攻擊取利順勢圍空這些道理，但看AI的對手的外勢常常最後就變單官或是兩眼做活，這就是棋力差異造成的 : 而哪邊更加接近圍棋之神呢相信AlphaGo已給出了答案 : 你可以說人類一直都用錯誤的方法學圍棋 : 但這是人類生理上的拘限性所導致的 : 我們幾乎永遠不可能像AlphaGo那樣思考 : 比起目數勝率那種東西是虛無飄渺的人類又怎麼能量化呢 : 當然只能計算目數 : 所以說要向AI學習我是有些疑問的要怎麼學呢 : AlphaGo會告訴你要那樣下但為什麼? 不知道 : 你沒法把AlphaGo的棋路內化因為思考模式就不同 : 頂多只能依樣畫葫蘆 : 這樣的學習效果是有限的人類不可能用勝率模擬，所以目數是最精確的評估了。人類在小區域對目數的判斷應該是可以更勝電腦的。比方說一個手筋可以掏掉幾目、每個官子價值多少、局部死活，這些都是人類已經用窮舉法確定的東西了。只要電腦是用機率在模擬，這些部分就不會超過人類(人類自己眼殘或腦袋打結的情況先忽略XD) 能不能照學的確是有疑問的，像前面說的，人學AI搶了外勢，理論上不虧，可是人類能將那道牆運用得跟電腦一樣好嗎？或是像點三三，AI說下完先手他不虧，但你棋力不到，你搶了先手卻佔不到急場，那你的先手價值就不像AI模擬的能提高勝率了。也就是說要學AI可能不能只學個走法，你得把他後續的整個應用的方法稍微搞懂這樣學了才有意義 : 我想過如果AlphaGo不追求最大勝率而是最大目數的話會如何 : 這樣發展出的圍棋會不會更接近人類呢 : 這樣的發展或許會很有意思 : 相對的我們對人類至今發展出的圍棋也不需太過悲觀 : 雖然舊的棋路定石在AlphaGo 甚至圍棋之神眼中或許是錯的 : 但我們還是得擁抱它 : 因為我們是人類 : 不是AlphaGo 我猜測AI反覆使用的型應該是他確定有好處的下法，可以研究。但不見得他每個走法都是最優。其實從AI的下棋邏輯就可以理解，他既然是靠機率，選的就不一定是"只此一手"最佳解，只是通常能選到"相對佳"的著手。人類為什麼下不贏呢？因為人失誤更多，可能某個區域人類細算後選到更佳解或最佳解賺了三目，但其他小地方一下虧五目一下虧兩目，那盤面還是一直被牽著走。其實人類也是求勝而不是追求最大目數，人類會想多追目是因為目數領先越多對人類來說等同勝率越高，也就是人類很清楚意識到自己會失誤所以留給自己緩衝失誤的空間。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.235.66 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483596361.A.D60.html

→

aaaba

01/05 14:10, , 1^F

01/05 14:10, 1^F

→

aaaba

01/05 14:10, , 2^F

01/05 14:10, 2^F

或者從AI有用minimax來想就知道了，近距接觸的話不下在附近有機會崩盤，那自然會取附近區域的點為主(我的理解是這樣，不一定對XD)。跟人下棋很類似，局部沒告一段落前落子會先從局部考量吧。

推

aegis43210

01/05 14:12, , 3^F