[新聞] 圍棋AI給出的手段，難道就是正解嗎？

看板GO作者joanzkow (星浪)時間1年前 (2023/04/03 15:46)推噓2(2推 0噓 0→)

留言2則, 2人參與討論串1/1

【安靜】圍棋AI給出的手段，難道就是正解嗎？騰訊圍棋作者：找藉口安靜點擊：2472023-04-03 13:25 圖片原址：https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html 原題：AIの手は正解なのか～大橋拓文七段と考えるAIとの付き合い方「つるりん式観る碁のすすめ～こぼれ話」摘自：日本棋院作者：編輯K 翻譯和整理：找藉口安靜這篇比較長就翻了 https://www.foxwq.com/Public/Uploads/image/20230403/t_16804987161.peg 這一次我們請了學術類鋼琴家，被譽為是太空人的大橋拓文七段。大橋拓文的鋼琴水平應該是棋界第一人，對圍棋AI方面有著非常廣泛的知識，在經常下出一些AI手段的同時，還研究AI是不是有極限，AI認為的最強手段是怎麼定義的，從科學和哲學領域對其進行研究。當今AI已經成為了觸手可及的工具，想到AI就想到能給我們準確的下法。將實力的基準提升到了和AI的吻合度。但是AI真的是正確的嗎？難道提升和AI的吻合度才能是接近最好手段的方式嗎？在這個專欄中，我們直接把這些問題拋給大橋拓文，對AI的現狀進行探究。AI實力強勁，並且能看到絕對的結論。而AI給我們顯示的手段，是不是我們想到的神之一手呢？我們借此來瞭解一下深奧的AI世界的冰山一角。 ——大橋拓文七段今天請多關照。大橋拓文：請多關照。 ——長話短說我們想針對AI進行採訪，AlphaGo出現至今已有7年多，AI現在已經成為了我們觸手可及的東西。現在棋手們用AI進行研究已經是常態，在直播中用AI勝率值進行表示，還用AI顯示出當前局面的推薦手段。拿自己來說，我在看棋的時候也會下意識地把AI給出的手段當作是“正解”，實際上你覺得AI給出的手段就真的是“正解”嗎？大橋拓文：這個確實很複雜，首先我們要對“正解”進行定義。多數情況下，下出比人類更加精准，並且能贏棋的手段，我覺得比較接近于“正解”的。 ——也就是說這不是“正解”，應該是屬於“最佳”。那你覺得AI給出的手段是“最佳” 手段嗎？大橋拓文：我們先不談人類怎麼接受這些下法，首先AI是沒有“最佳”的概念的。在這種情況下來評判“最佳”，是不是覺得是一件很困難的事情呢？比如說用最短的手數贏棋，還是贏最多的目數，你覺得哪一個才是“最佳”呢？ ——這麼說還挺有道理的，這兩個角度其實都可以認為是“最佳”。大橋拓文：剛剛我也提到了AI沒有“最佳”的概念，但是AI在選擇每一手棋的之後，都有著 “獲勝”的目標。然後如何設定“獲勝”的方式，就取決於各個AI的個性了。實際上這都是由設計程序的人類設計而反映出的結果。 ——這是什麼原因呢？大橋拓文：比如說，AlphaGo把最終的目標定在“贏棋”，然後選擇避開高風險的手段，選擇了贏半目的下法。所以就會選擇一些人類看上去可能會虧損的手段，但是AI依舊會選擇安全的下法。後來就出現了從“以更大的目數獲勝”的AI。這就和“哥倫布的雞蛋”一樣，因為追求更大的目數的AI比追求僅僅“贏”的AI更強大，但並不一定需要刻意去製作一個追求更大目數的AI。總之相較於AlphaGo時代的AI，現在的AI越來越傾向于選擇高風險高回報。 ——棋風和人類一樣很有意思。大橋拓文：進一步來說，現在還出現了在佈局階段，通過對手的手段來推測實力。一旦判斷“棋力較低”之後AI就會選擇比較保守手段的AI。當然這也是因為當初程序是這麼設計的，所以看上去才會那樣，實際上被下套的人就覺得自己就和漫畫《棋魂》中的棋會所的那個大叔一樣，感覺任何下法都被他看透了。 ——確實有這種感覺，就覺得AI是富有人格的。大橋拓文：我也有這種感覺，但是後來冷靜地告訴自己，這些都是通過計算得到的結果（笑）。 ——我們換一個話題，有的棋手說：“因為AI自己手段的範圍變廣了”，也有說“自己的手段變窄了”。而你又是怎麼感覺的呢？大橋拓文：從長遠角度出發是變廣了，但是目前處在過渡期，確實有些人會覺得範圍變窄了。 ——這是什麼原因呢？大橋拓文：AI會通過自我對局來提升自己的水平。比如我你和相同棋力、相同棋風的人一直下幾千或者幾萬盤，你覺得會不會漲棋呢？ ——難道不會變強嗎？大橋拓文：你覺得你和棋風一樣的人一直下棋，實力會變強嗎？ ——我明白了。確實如果和棋風相同的人一直對局，那只會反復下一樣的佈局。到後來只擅長某一個佈局，但是其他手段的話可能並非如此了。大橋拓文：就是這個道理。通過電腦進行自我對局，重複進行幾萬盤相同的事情。說實話我們也不知道他是不是聰明（笑）。不過像AlphaGo Zero那樣開發這一類AI的話，讓電腦自我進行自我對局的操作也非常重要。不過開發下圍棋很強的AI的話，現階段還是需要通過人類的設置，才能擴大研究的範圍。這些其實從KataGo的官方網站就能有所瞭解。實際上現在的圍棋AI的佈局套路也變得越來越多。 ——我看AI經常點三三，這或許可能不是因為這是好棋才這麼下，而是因為這手棋經常出現，所以AI也這麼下了。如果AI今後變得更強的話，今後的AI定式有可能會和現在完全不一樣，佈局也有可能變得多樣化。大橋拓文：就是這個道理，還有就是和現在相關的話題，那就是我想強調AI“不會像人類一樣有認知，也不會有理解能力”。你應該還記得，AlphaGo剛出現的時候，很不擅長征子和大頭鬼。 ——是的，明明這麼強，竟然不認識征子。大橋拓文：現在的AI通過人類的設置，把AI不擅長的棋型程序化了，所以現在他們也知道什麼是征子了，有的人可能會覺得，這麼簡單的事情還需要通過設置來解決挺不可思議的。為什麼會出現這種情況呢？那就是AI不知道征子，也不會理解什麼是征子。其實不僅是征子，其實連兩眼做活，AI也都是一知半解的。 ——詳細說說。大橋拓文：人類會通過倫理來考慮手段，通過棋型來識別征子的棋型。這樣理所當然的事情其實AI是做不到的。與其說做不到，AI在這方面的思維方式就不一樣。圍棋AI會把自己摸索的範圍作為自己的世界，但是自己摸索不到的地方它們是不知道的。簡單來說的話，比如說有一個手數很長的征子，人類的話只要知道征子的棋型，哪怕是100手的征子也是可以下完並且吃掉的。但是AI就沒有“重複做這個動作”的想法，每一手棋都需要摸索，所以在計算100手的征子時，他們計算到50手就有可能算不下去了。前段時間出現了只要找到AI的弱點，人類就能戰勝圍棋AI的事情成為了話題。實際上AI連死活的改變也沒有。為了讓AI產生錯覺，讓AI把自己的棋走成一個環，這樣的話AI就會覺得即便只有一隻眼也能活棋。以前AI就有只要不會被拔起來的棋，AI就有可能將其認為是活棋的錯覺。但是只要讓AI的棋圍成一圈，AI就完全被我們套路的事情。在這方面相較于棋手，很多職業遊戲玩家比我們更厲害（笑）。並且人類只要有10級左右的棋力，就能輕輕鬆松識破這個弱點。人類至少知道兩眼活棋或者雙活的概念，但是對AI來說，我覺得他們對兩眼活棋的概念應該還是一知半解的。 ——能輕輕鬆松戰勝頂尖棋手的圍棋AI，竟然沒有“認知”和“理解”的概念還是很意外的。大橋拓文：真的是這樣，問題是從AI獲得手段的人類，可能一直會覺得這是AI的認知或者是理解。對AI來說，他們學習的世界可能會比人類做得更好，但是在他們沒有學習到的世界，很多人類可以輕輕鬆松做到的事情，AI有時候可能就做不到。所以我們要理解AI的基礎上，如何和AI共同相處才是非常重要的。 ——不把AI一切當成絕對的結果是很重要的事情。最後還想問的一個問題是，我們今後如何和AI共同相處下去呢？大橋拓文：我們每天都和各種AI進行對局，現在圍棋AI的實力面對人類棋手是碾壓式的強大。我的話至少要受讓30目才行。在撲朔迷離的局面下，AI的形勢判斷也很準確，包括需要計算的中盤對攻，雖然在這種情況下可能比形勢判斷要稍微遜色一些，不過很多時候還是比人類棋手要強。利用AI進行學習是非常有用的事情，還有可能會擴大圍棋的可能性。不過很多時候覺得AI給出的手段很容易被認為是正解，其實很多手段有可能是錯誤的，即便是正確的，我們可能也很難下出最好的下法。也就是說AI給出的手段對我們來說是不是好棋，這是我們需要判斷也是需要我們好好學習的地方。 ——現在的AI技術，在圍棋以外的領域正逐步開始變得實用化。這一次提到的和圍棋AI的相處方式，今後在身邊可能會有更多的AI出現，在這種情況下我們該如何相處，這一次確實是學到了很多東西。今天非常感謝接受採訪。 https://www.foxwq.com/news/listid/id/14188.html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.240.141 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1680507980.A.882.html

推

pan0531

04/03 15:46, 1年前 , 1^F

04/03 15:46, 1^F

推

phoenix286

04/05 07:36, 1年前 , 2^F

04/05 07:36, 2^F

‣ 返回看板[ GO ] 棋類

‣ 更多 joanzkow 的文章

文章代碼(AID): #1aAeHCY2 (GO)