[新聞] 圍棋AI給出的手段,難道就是正解嗎?

看板GO作者 (星浪)時間1年前 (2023/04/03 15:46), 編輯推噓2(200)
留言2則, 2人參與, 1年前最新討論串1/1
【安靜】圍棋AI給出的手段,難道就是正解嗎? 騰訊圍棋 作者:找藉口安靜點擊:2472023-04-03 13:25 圖片 原址:https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html 原題:AIの手は正解なのか~大橋拓文七段と考えるAIとの付き合い方「つるりん式観る 碁のすすめ~こぼれ話」 摘自:日本棋院 作者:編輯K 翻譯和整理:找藉口安靜 這篇比較長就翻了 https://www.foxwq.com/Public/Uploads/image/20230403/t_16804987161.peg 這一次我們請了學術類鋼琴家,被譽為是太空人的大橋拓文七段。大橋拓文的鋼琴水平應 該是棋界第一人,對圍棋AI方面有著非常廣泛的知識,在經常下出一些AI手段的同時,還 研究AI是不是有極限,AI認為的最強手段是怎麼定義的,從科學和哲學領域對其進行研究 。 當今AI已經成為了觸手可及的工具,想到AI就想到能給我們準確的下法。將實力的基準提 升到了和AI的吻合度。但是AI真的是正確的嗎?難道提升和AI的吻合度才能是接近最好手 段的方式嗎? 在這個專欄中,我們直接把這些問題拋給大橋拓文,對AI的現狀進行探究。AI實力強勁, 並且能看到絕對的結論。而AI給我們顯示的手段,是不是我們想到的神之一手呢?我們借 此來瞭解一下深奧的AI世界的冰山一角。 ——大橋拓文七段今天請多關照。 大橋拓文:請多關照。 ——長話短說我們想針對AI進行採訪,AlphaGo出現至今已有7年多,AI現在已經成為了我 們觸手可及的東西。現在棋手們用AI進行研究已經是常態,在直播中用AI勝率值進行表示 ,還用AI顯示出當前局面的推薦手段。拿自己來說,我在看棋的時候也會下意識地把AI給 出的手段當作是“正解”,實際上你覺得AI給出的手段就真的是“正解”嗎? 大橋拓文:這個確實很複雜,首先我們要對“正解”進行定義。多數情況下,下出比人類 更加精准,並且能贏棋的手段,我覺得比較接近于“正解”的。 ——也就是說這不是“正解”,應該是屬於“最佳”。那你覺得AI給出的手段是“最佳” 手段嗎? 大橋拓文:我們先不談人類怎麼接受這些下法,首先AI是沒有“最佳”的概念的。在這種 情況下來評判“最佳”,是不是覺得是一件很困難的事情呢?比如說用最短的手數贏棋, 還是贏最多的目數,你覺得哪一個才是“最佳”呢? ——這麼說還挺有道理的,這兩個角度其實都可以認為是“最佳”。 大橋拓文:剛剛我也提到了AI沒有“最佳”的概念,但是AI在選擇每一手棋的之後,都有 著 “獲勝”的目標。然後如何設定“獲勝”的方式,就取決於各個AI的個性了。實際上這都 是由設計程序的人類設計而反映出的結果。 ——這是什麼原因呢? 大橋拓文:比如說,AlphaGo把最終的目標定在“贏棋”,然後選擇避開高風險的手段, 選擇了贏半目的下法。所以就會選擇一些人類看上去可能會虧損的手段,但是AI依舊會選 擇安全的下法。後來就出現了從“以更大的目數獲勝”的AI。這就和“哥倫布的雞蛋”一 樣,因為追求更大的目數的AI比追求僅僅“贏”的AI更強大,但並不一定需要刻意去製作 一個追求更大目數的AI。總之相較於AlphaGo時代的AI,現在的AI越來越傾向于選擇高風 險高回報。 ——棋風和人類一樣很有意思。 大橋拓文:進一步來說,現在還出現了在佈局階段,通過對手的手段來推測實力。一旦判 斷“棋力較低”之後AI就會選擇比較保守手段的AI。當然這也是因為當初程序是這麼設計 的,所以看上去才會那樣,實際上被下套的人就覺得自己就和漫畫《棋魂》中的棋會所的 那個大叔一樣,感覺任何下法都被他看透了。 ——確實有這種感覺,就覺得AI是富有人格的。 大橋拓文:我也有這種感覺,但是後來冷靜地告訴自己,這些都是通過計算得到的結果( 笑)。 ——我們換一個話題,有的棋手說:“因為AI自己手段的範圍變廣了”,也有說“自己的 手段變窄了”。而你又是怎麼感覺的呢? 大橋拓文:從長遠角度出發是變廣了,但是目前處在過渡期,確實有些人會覺得範圍變窄 了。 ——這是什麼原因呢? 大橋拓文:AI會通過自我對局來提升自己的水平。比如我你和相同棋力、相同棋風的人一 直下幾千或者幾萬盤,你覺得會不會漲棋呢? ——難道不會變強嗎? 大橋拓文:你覺得你和棋風一樣的人一直下棋,實力會變強嗎? ——我明白了。確實如果和棋風相同的人一直對局,那只會反復下一樣的佈局。到後來只 擅長某一個佈局,但是其他手段的話可能並非如此了。 大橋拓文:就是這個道理。通過電腦進行自我對局,重複進行幾萬盤相同的事情。說實話 我們也不知道他是不是聰明(笑)。不過像AlphaGo Zero那樣開發這一類AI的話,讓電腦 自我進行自我對局的操作也非常重要。不過開發下圍棋很強的AI的話,現階段還是需要通 過人類的設置,才能擴大研究的範圍。這些其實從KataGo的官方網站就能有所瞭解。實際 上現在的圍棋AI的佈局套路也變得越來越多。 ——我看AI經常點三三,這或許可能不是因為這是好棋才這麼下,而是因為這手棋經常出 現,所以AI也這麼下了。如果AI今後變得更強的話,今後的AI定式有可能會和現在完全不 一樣,佈局也有可能變得多樣化。 大橋拓文:就是這個道理,還有就是和現在相關的話題,那就是我想強調AI“不會像人類 一樣有認知,也不會有理解能力”。你應該還記得,AlphaGo剛出現的時候,很不擅長征 子和大頭鬼。 ——是的,明明這麼強,竟然不認識征子。 大橋拓文:現在的AI通過人類的設置,把AI不擅長的棋型程序化了,所以現在他們也知道 什麼是征子了,有的人可能會覺得,這麼簡單的事情還需要通過設置來解決挺不可思議的 。為什麼會出現這種情況呢?那就是AI不知道征子,也不會理解什麼是征子。其實不僅是 征子,其實連兩眼做活,AI也都是一知半解的。 ——詳細說說。 大橋拓文:人類會通過倫理來考慮手段,通過棋型來識別征子的棋型。這樣理所當然的事 情其實AI是做不到的。與其說做不到,AI在這方面的思維方式就不一樣。圍棋AI會把自己 摸索的範圍作為自己的世界,但是自己摸索不到的地方它們是不知道的。簡單來說的話, 比如說有一個手數很長的征子,人類的話只要知道征子的棋型,哪怕是100手的征子也是 可以下完並且吃掉的。但是AI就沒有“重複做這個動作”的想法,每一手棋都需要摸索, 所以在計算100手的征子時,他們計算到50手就有可能算不下去了。 前段時間出現了只要找到AI的弱點,人類就能戰勝圍棋AI的事情成為了話題。實際上AI連 死活的改變也沒有。為了讓AI產生錯覺,讓AI把自己的棋走成一個環,這樣的話AI就會覺 得即便只有一隻眼也能活棋。以前AI就有只要不會被拔起來的棋,AI就有可能將其認為是 活棋的錯覺。但是只要讓AI的棋圍成一圈,AI就完全被我們套路的事情。在這方面相較于 棋手,很多職業遊戲玩家比我們更厲害(笑)。並且人類只要有10級左右的棋力,就能輕 輕鬆松識破這個弱點。人類至少知道兩眼活棋或者雙活的概念,但是對AI來說,我覺得他 們對兩眼活棋的概念應該還是一知半解的。 ——能輕輕鬆松戰勝頂尖棋手的圍棋AI,竟然沒有“認知”和“理解”的概念還是很意外 的。 大橋拓文:真的是這樣,問題是從AI獲得手段的人類,可能一直會覺得這是AI的認知或者 是理解。對AI來說,他們學習的世界可能會比人類做得更好,但是在他們沒有學習到的世 界,很多人類可以輕輕鬆松做到的事情,AI有時候可能就做不到。所以我們要理解AI的基 礎上,如何和AI共同相處才是非常重要的。 ——不把AI一切當成絕對的結果是很重要的事情。最後還想問的一個問題是,我們今後如 何和AI共同相處下去呢? 大橋拓文:我們每天都和各種AI進行對局,現在圍棋AI的實力面對人類棋手是碾壓式的強 大。我的話至少要受讓30目才行。在撲朔迷離的局面下,AI的形勢判斷也很準確,包括需 要計算的中盤對攻,雖然在這種情況下可能比形勢判斷要稍微遜色一些,不過很多時候還 是比人類棋手要強。利用AI進行學習是非常有用的事情,還有可能會擴大圍棋的可能性。 不過很多時候覺得AI給出的手段很容易被認為是正解,其實很多手段有可能是錯誤的,即 便是正確的,我們可能也很難下出最好的下法。也就是說AI給出的手段對我們來說是不是 好棋,這是我們需要判斷也是需要我們好好學習的地方。 ——現在的AI技術,在圍棋以外的領域正逐步開始變得實用化。這一次提到的和圍棋AI的 相處方式,今後在身邊可能會有更多的AI出現,在這種情況下我們該如何相處,這一次確 實是學到了很多東西。今天非常感謝接受採訪。 https://www.foxwq.com/news/listid/id/14188.html -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.240.141 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1680507980.A.882.html

04/03 15:46, 1年前 , 1F
不一定啊
04/03 15:46, 1F

04/05 07:36, 1年前 , 2F
最佳的概念還滿有趣的 對圍棋來說怎麼樣算是最佳呢
04/05 07:36, 2F
文章代碼(AID): #1aAeHCY2 (GO)