Re: [討論] 黑不貼目,初手天元,能下嗎?

看板GO作者 (謊言接線生)時間4年前 (2020/06/26 00:34), 4年前編輯推噓2(201)
留言3則, 2人參與, 4年前最新討論串4/5 (看更多)
※ 引述《staristic (ANSI lover)》之銘言: : 有個問題,板上如果有賽局理論的專家的話還請解答一下 : 1、「明顯」有利和不有利的分界在哪? : 我記得AlphaGo當初有公佈內部的黑白勝率 : 在3.75子的貼點下白棋起始勝率是55%左右 : 開發團隊的評論是「兩方差不多,很公平」 : 代表有頂尖專家的Deepmind團隊都認為至少到55:45這個比例仍是可接受的 : 印象中人類的對局黑白勝率統計並沒有超過這個數字? : (一時不知去哪找,有請各位高手補充) : 是否有辦法用數學的理由說明 : 「現在的貼目對人類而言有沒有差別」? 我分項來說: 1. 數學上的話,我們不妨這樣思考:假設雙方實力穩定而勝率固定,那麼如果讓一 方永遠拿黑棋,另一方永遠拿白棋,到底要下多少盤,期望值才會出現有實質意義的 勝負差距? 詳細的推導我在這邊不提,總之: 在固定勝率r下,進行n局棋的勝局期望值 = n * r 也就是說,0.55勝率下一局棋,期望值就是贏下0.55局。下兩局,期望值就是贏 下1.1局。 那麼什麼叫做有實質意義的差距?這邊就沒辦法有100%絕對精確的定義了,但是 我提出兩個簡易而直覺的參考標準: ● 如果下n局後,雙方的期望值會差到1局以上,那表示就算雙方實力相當也足以影 響勝負結果了吧? ● 如果下n局後,雙方的期望值會差到0.5局以上,那似乎也表示勝率落後方要努力 發揮還多拿下一局才會更有機會勝出整個系列賽了吧? 那我們來看看七番棋,0.55 vs 0.45勝局期望值對比: 3.85 vs 3.15 差距是0.7局,直覺上已經是落後方需要付出更多一點努力的程度了,但好像又 沒有不可挽救到差整整一盤。 顯而易見0.5的門檻是落在五番棋上,而期望值直接多勝出一局則在十番棋大戰 「幾乎必然發生」了。也就是說在不交換黑白子持續下下去的情況下,這樣下十番棋 在期望值上等於直接多讓一盤出去。 然而只下一盤的話,就只差0.1,這個差距看起來就沒有像是無法挽回的情況。 我們看看73開下七番棋的情況: 4.9 vs 2.1 這就非常明顯了吧,光七番棋要直接多輸2.8盤,幾乎等於領先方直接聽牌才來 跟你公平下的感覺。 2. 然而,如果看單一棋局的話,評估方式又有所不同了。這個評估更不容易,我以 下講的是一個很直覺但並不精確的初步想法。如果能有大量對局的細部統計數據,其 實我們就有機會建立出更好的評估方式: 我們先做一點假設:假設平均一局棋會下100手(方便計算)。那麼一方平均會 下50手。也就是說,雙方輪流下一手,原本勝率落後方就必須把勝率追近: (高勝率 - 低勝率) / 50 要能平均追近這麼多,一百手以後才會成為一個均勢結束。拿0.55跟0.45來看, 這是0.002。以人類下棋目前的勝率震盪,好像沒有什麼感覺嘛? 不對,我們要考慮到一件事情,就是下到結束時,勝率一定是變成1跟0。而假設 勝率計算精確且全局沒有翻轉,則可以想成是勝率領先一方的勝率慢慢成長到終局的 1。也就是勝率領先方其實先天可能擁有一個平均勝率自動增長量: (1 - 高勝率) / 50 以0.55來說,他就得到一個0.009的平均來回一手之勝率自動增長。也就是說, 落後方其實要背負著0.002 + 0.009 = 0.011的勝率追趕速度。 每來回一手就必須要多追超過1%的勝率最後才真的會贏,是不是比較有感覺了一 些? 有人應該已經發現上面拆成兩塊來講是在唬爛廢話的,其實整合來說根本就是「 落後方到最後勝率要變1的平均勝率成長要求」: (1 - 低勝率) / 50 我們看看73開的情況,是落後方每一手就要提升1.4%的勝率。如果實際常常用AI 驗證自己棋局的棋友,應該會對這個要求的難度有更實際的體感。 然後我們就會發現,如果整局手數多,這個每來回一手平均勝率提升要求就會被 分攤得較少。這也可說符合棋理中落後方應該讓盤面複雜,領先方應該讓盤面簡明的 概念,甚至落後方藉由打劫來進一步增加總著手數也是一種手段。100手其實算很短 的估計,所以前述的範例其實都是高估難度的情況。 : 2、預期心理的影響有多大? : 是否相較於現在的環境,會出現更多那種雙方都覺得自己優勢/劣勢的對局? : 不止是圍棋,這類先天的樂觀或悲觀的心理是普遍的現象嗎? : 對於勝負的影響有多少? 這肯定有,另外包括時間運用也都包含在內。 但「有多少」我覺得非常難以評估,這方面比較偏棋手自己的風格與內心活動。 有人可能雖落後但差距不大就都只盡力下出想到的最佳著手穩定追逐,但有人可 能一落後就傾向下雙方都不容易算清的強手打亂局勢,導致的後續結果差距很大,所 以我不認為這部分可以有很公平的估計標準。 這方面可能可以做的研究是,個別分析不同棋手,去看特定棋手的勝率變化情況 ,可以看出該棋手對於當下勝率是否敏感,以及發現自己勝率高或低時是否會明顯出 現下法的變化等等。然後再整體統計所有棋手的情況,從而得出所有棋手有多少比例 會因為貼目數而下法明顯出現不同的波動,進一步估計心態影響的強度及普遍性。 -- 「傳說的最後,魔王總是被勇者封印。但勇者會逝去、封印會衰弱,魔王卻永遠 不滅。傳說呢?傳說持續著。只是,變質了。所以對於傳說而言,只有反覆無常的自 己是主角,而魔王只是配角。勇者?勇者不過是消耗品罷了,封印則什麼也不是。妳 好不容易有機會當上配角,怎麼走回頭路想成為消耗品?妳早晚會什麼也不是的。」 --星.幻.夢的傳說 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.172.144 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1593102843.A.F17.html ※ 編輯: ddavid (111.250.172.144 臺灣), 06/26/2020 00:35:44

06/26 00:47, 4年前 , 1F
人下的棋局 從來都不是勝率慢慢增漲到1的
06/26 00:47, 1F

06/26 00:48, 4年前 , 2F
也許可用人類棋局過程的勝率,計算開局勝率與勝負的相關性
06/26 00:48, 2F
是,所以我說這只是一個不精確的估計XD。畢竟這是個大問題,怎麼可能我在這 邊隨便寫寫就是一個完美解XD 真實情況是各種上下波動,所以其實可以把整條波動曲線丟進去分析評估。但要 怎麼做,這細節就多了。 ※ 編輯: ddavid (111.250.172.144 臺灣), 06/26/2020 02:26:23

06/26 19:33, 4年前 , 3F
從番棋的角度看這個真是個有趣的觀點XD
06/26 19:33, 3F
文章代碼(AID): #1UzD7xyN (GO)
討論串 (同標題文章)
文章代碼(AID): #1UzD7xyN (GO)