Re: [問題] AI勝率一邊倒,不可傳遞比較僅供參考
如果從上帝視角來看圍棋
棋盤上每一個點都可以標上一個大於或等於零的數字
那個數字表示這一手棋下完後,雙方照最佳下法下完會損幾目
零就是最佳解,1就是相較最佳虧一目的下法
雖然我們不知道盤面上的數字是多少
但是從這個觀點來看比較容易理解原文中「不可遞移」是什麼意思
(下面的數字只是比喻,請大家不要認真)
一個棋手下了很多盤之後
從上帝視角來看,他會有一個平均值,來表示他一手棋平均虧了幾目
業餘棋手可能是10+,職業棋手可能是2左右
數字越小就越強
但是就算是實力略輸一籌的棋手還是有可能贏實力較強的
所以我們將標準差的概念放進來,就用常態分佈就好,取兩個標準差
一個棋手的棋力用 x ± y 表示
x 表示平均棋力 y 表示約 95% 的棋步的虧損值會落在這個範圍
在這個模型下
A 是 10 ± 3
B 是 11 ± 2
雖然A強於B,但是B還是有一定的機率贏過A
AI 和人類的差別在於 AI 的標準差非常小
強到一定程度的AI不會像人類一勺送N目,每一手的價值非常穩定
假設柯潔是 1 ± 0.1
那麼AlphaGo Master之後的版本可能是 0.8 ± 0.0001
標準差特小
原新聞中的不可遞移可以想像成這樣
絕藝最新的幾個版本的棋力
0.99 ± 0.001
0.98 ± 0.001
0.97 ± 0.001
0.96 ± 0.001
........
沒有成長很多,客觀而言絕不可能讓子,但是勝率逼近100%
如果每一手棋都是穩定的輸出,那麼將那微小的差距 * 100
100手棋後就會是巨大的數子
AI的穩定在這裡就變成了穩定的死亡
人類就不是這麼回事了,暴起暴落是常態
這也是為什麼棋賽之所以好看,而且機器互下無法取代職業棋手的原因
一局棋高潮迭起才有觀眾,名留棋史的不止是妙手,還有一堆勺子
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.185.153.145
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1513601404.A.3E9.html
推
12/18 21:22,
6年前
, 1F
12/18 21:22, 1F
推
12/18 22:24,
6年前
, 2F
12/18 22:24, 2F
→
12/18 22:24,
6年前
, 3F
12/18 22:24, 3F
推
12/18 23:59,
6年前
, 4F
12/18 23:59, 4F
推
12/19 13:48,
6年前
, 5F
12/19 13:48, 5F
→
12/19 13:49,
6年前
, 6F
12/19 13:49, 6F
→
12/19 13:50,
6年前
, 7F
12/19 13:50, 7F
→
12/19 13:51,
6年前
, 8F
12/19 13:51, 8F
→
12/19 13:54,
6年前
, 9F
12/19 13:54, 9F
→
12/19 13:56,
6年前
, 10F
12/19 13:56, 10F
→
12/19 13:56,
6年前
, 11F
12/19 13:56, 11F
→
12/19 13:58,
6年前
, 12F
12/19 13:58, 12F
→
12/19 13:58,
6年前
, 13F
12/19 13:58, 13F
推
12/19 14:01,
6年前
, 14F
12/19 14:01, 14F
→
12/19 14:02,
6年前
, 15F
12/19 14:02, 15F
→
12/19 16:19,
6年前
, 16F
12/19 16:19, 16F
→
12/19 16:20,
6年前
, 17F
12/19 16:20, 17F
→
12/19 16:21,
6年前
, 18F
12/19 16:21, 18F
→
12/19 16:21,
6年前
, 19F
12/19 16:21, 19F
→
12/19 16:22,
6年前
, 20F
12/19 16:22, 20F
→
12/19 16:24,
6年前
, 21F
12/19 16:24, 21F
→
12/19 16:24,
6年前
, 22F
12/19 16:24, 22F
→
12/19 16:26,
6年前
, 23F
12/19 16:26, 23F
→
12/19 16:27,
6年前
, 24F
12/19 16:27, 24F
推
12/19 20:22,
6年前
, 25F
12/19 20:22, 25F
→
12/19 20:22,
6年前
, 26F
12/19 20:22, 26F
推
12/19 20:44,
6年前
, 27F
12/19 20:44, 27F
討論串 (同標題文章)
完整討論串 (本文為第 3 之 3 篇):