Re: [問題] AI勝率一邊倒,不可傳遞比較僅供參考

看板GO作者 (ANSI lover)時間6年前 (2017/12/18 20:50), 編輯推噓7(7020)
留言27則, 8人參與, 6年前最新討論串3/3 (看更多)
如果從上帝視角來看圍棋 棋盤上每一個點都可以標上一個大於或等於零的數字 那個數字表示這一手棋下完後,雙方照最佳下法下完會損幾目 零就是最佳解,1就是相較最佳虧一目的下法 雖然我們不知道盤面上的數字是多少 但是從這個觀點來看比較容易理解原文中「不可遞移」是什麼意思 (下面的數字只是比喻,請大家不要認真) 一個棋手下了很多盤之後 從上帝視角來看,他會有一個平均值,來表示他一手棋平均虧了幾目 業餘棋手可能是10+,職業棋手可能是2左右 數字越小就越強 但是就算是實力略輸一籌的棋手還是有可能贏實力較強的 所以我們將標準差的概念放進來,就用常態分佈就好,取兩個標準差 一個棋手的棋力用 x ± y 表示 x 表示平均棋力 y 表示約 95% 的棋步的虧損值會落在這個範圍 在這個模型下 A 是 10 ± 3 B 是 11 ± 2 雖然A強於B,但是B還是有一定的機率贏過A AI 和人類的差別在於 AI 的標準差非常小 強到一定程度的AI不會像人類一勺送N目,每一手的價值非常穩定 假設柯潔是 1 ± 0.1 那麼AlphaGo Master之後的版本可能是 0.8 ± 0.0001 標準差特小 原新聞中的不可遞移可以想像成這樣 絕藝最新的幾個版本的棋力 0.99 ± 0.001 0.98 ± 0.001 0.97 ± 0.001 0.96 ± 0.001 ........ 沒有成長很多,客觀而言絕不可能讓子,但是勝率逼近100% 如果每一手棋都是穩定的輸出,那麼將那微小的差距 * 100 100手棋後就會是巨大的數子 AI的穩定在這裡就變成了穩定的死亡 人類就不是這麼回事了,暴起暴落是常態 這也是為什麼棋賽之所以好看,而且機器互下無法取代職業棋手的原因 一局棋高潮迭起才有觀眾,名留棋史的不止是妙手,還有一堆勺子 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.185.153.145 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1513601404.A.3E9.html

12/18 21:22, 6年前 , 1F
簡潔 推一下
12/18 21:22, 1F

12/18 22:24, 6年前 , 2F
我錯 固我在
12/18 22:24, 2F

12/18 22:24, 6年前 , 3F
12/18 22:24, 3F

12/18 23:59, 6年前 , 4F
我勺,故好看
12/18 23:59, 4F

12/19 13:48, 6年前 , 5F
我同意分先下的話一個版本對一個版本99%的勝率不代表可以
12/19 13:48, 5F

12/19 13:49, 6年前 , 6F
讓子 但一個版本對另一個版本讓子下的話 如果還是99%的勝
12/19 13:49, 6F

12/19 13:50, 6年前 , 7F
率那參考價值就很高了 例如之前符合預期對絕藝指導的讓兩
12/19 13:50, 7F

12/19 13:51, 6年前 , 8F
子對局
12/19 13:51, 8F

12/19 13:54, 6年前 , 9F
嚴謹來看 讓兩子棋雖然前半局(例如前50手)被讓的AI可能會
12/19 13:54, 9F

12/19 13:56, 6年前 , 10F
全力以赴 但50手100手之後習慣性放一下水 讓子的AI就很有
12/19 13:56, 10F

12/19 13:56, 6年前 , 11F
機會一舉超前
12/19 13:56, 11F

12/19 13:58, 6年前 , 12F
人類到底跟AI差幾子(五成勝率)真的要實戰才能看出來
12/19 13:58, 12F

12/19 13:58, 6年前 , 13F
但偏偏頂尖棋士們因為面子都不下XDD
12/19 13:58, 13F

12/19 14:01, 6年前 , 14F
昨天棋王戰林棋王幾乎自停一手還能逆轉王元均老師
12/19 14:01, 14F

12/19 14:02, 6年前 , 15F
真的是打勺讓棋局更精彩XDDDDD
12/19 14:02, 15F

12/19 16:19, 6年前 , 16F
@你的推測未必成立就是了,那個習慣性放水基本上是建立在
12/19 16:19, 16F

12/19 16:20, 6年前 , 17F
計算幾乎勝定的狀態下了,即便AI水準有差距,在中後盤已經
12/19 16:20, 17F

12/19 16:21, 6年前 , 18F
被算到勝定的情況下,說要因為放水而能一舉超前我覺得機率
12/19 16:21, 18F

12/19 16:21, 6年前 , 19F
不太大XD
12/19 16:21, 19F

12/19 16:22, 6年前 , 20F
目前水準以上的AI如果出現領先緩手局面被逆轉,基本上應該
12/19 16:22, 20F

12/19 16:24, 6年前 , 21F
都是訓練出有特定很嚴重問題的模型了(大概就是李世石一勝
12/19 16:24, 21F

12/19 16:24, 6年前 , 22F
那種等級的問題)
12/19 16:24, 22F

12/19 16:26, 6年前 , 23F
不過你前半段說得倒是沒錯,如果AI之間能在不重新訓練的前
12/19 16:26, 23F

12/19 16:27, 6年前 , 24F
提下讓子有八成以上勝率,那實力上的差距確實就比較明顯了
12/19 16:27, 24F

12/19 20:22, 6年前 , 25F
A強於B也是本篇故意留的勺子嗎 笑
12/19 20:22, 25F

12/19 20:22, 6年前 , 26F
我錯 誤解數字的意義
12/19 20:22, 26F

12/19 20:44, 6年前 , 27F
勺子與誤判 是人生的醍醐味XD
12/19 20:44, 27F
文章代碼(AID): #1QDxbyFf (GO)
文章代碼(AID): #1QDxbyFf (GO)