Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎?已回收

看板C_Chat作者 (正義56)時間7年前 (2017/01/05 12:56), 7年前編輯推噓38(38065)
留言103則, 37人參與, 最新討論串4/4 (看更多)
※ 引述《a127 (毛蘿蔔)》之銘言: : ※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言: : 個人只是看過一些簡報介紹, : 但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。 : 以前西洋棋被電腦演算直接暴力破解, : 原因在於合法步少,對手的下一手反制只有2X步可能, : 圍棋的合法步多,前幾手對手的反制有200步以上的可能。 : 然後西洋棋的好步就是成功的殺死對手的棋子+國王, : 圍棋的好步眾說紛紜,就連佈局來說不同的棋手就有各自不同的審美觀。 : 雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地, : 但兩個不同的N相比起來,還是會很微妙的難以判斷哪方優劣。 : 所以圍棋比賽沒有足夠時間被暴力破解, : 於是就變成阿發狗利用評價網路來建立圍棋的審美觀, : 也就是把人類棋手應對的"好步"記起來, : 利用這些好步跟有限的計算來擊倒對手。 : 原本我在想既然餵養阿發狗的食物來源也是人類創造的, 這段你搞錯了 餵人類棋譜長大的是舊版的阿發狗 也就是去年跟李世石下的那隻 去年那隻在李世石第78步下出神之一手後整個錯亂導致輸棋 可能也是因為李那步超越了去年狗狗建立的理論 今年這隻阿發狗是純粹藉由自我對局學習的 差別在於今年這隻會在前期中棋下一些違反常理 甚至被認為是臭棋的棋步 但事後發現這些棋步都是神之一手 所以才很多職業棋士說新版阿發狗顛覆了傳統圍棋理論 : 那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢? : 我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多, : 相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已) : 會有這種猜測是這五十場勝利之中,其實有幾場是幾目的勝負, : 而且都是在前中期阿發狗被評論大幅領先,在後面被人類追上。 : 我認為會有這種異常狀況出現,可能在於一部分的賽局都以投子結束, : 等於在最後收官階段給阿發狗餵養的資料不夠多, : 因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。 這點你判斷也是有問題 阿發狗中期贏很多 後期贏面變小的理由 主要是來自於他所設定的目標 對阿發狗來講 贏半目跟贏100目都是贏 所以我不需要贏很多 只要保持一定贏就可以了 所以狗狗在穩定領先時會變得保守的理由就在這邊 反觀人類在獲得優勢時 常常想要擴大優勢 但這個行為往往得不償失 這就是電腦最強的地方 電腦完全沒有情緒 他只往最高勝率的方向走 所以不容易犯錯 -- BZ黑一到板,所有看板的人便都看著他笑,有的叫道:「BZ黑,鬥陣特攻拿年度最佳遊戲了 !」他不回答,對板裡說:「發兩篇廢文。」便排出九文批幣。他們又故意的高聲嚷道:「 鬥陣特攻還拿最佳電競跟最佳多人遊戲!」BZ黑睜大眼晴說:「鬥陣早過氣了…」「什麼過 氣?我前天親眼見鬥陣特攻包辦三個獎。」BZ黑便漲紅了臉,額上的青筋條條綻出,爭辯道 :「只拿一次GOTY不能算贏…競技遊戲,能算GOTY嗎?」接連便是難懂的話,什麼「對手太 弱」,什麼「陰屍路也拿過」之類,引得眾人都哄笑起來:板內外充滿了快活的空氣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.51.10 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1483592194.A.DD7.html

01/05 13:00, , 1F
我覺得不是變保守而是後期資訊量對人類來說終於夠了
01/05 13:00, 1F

01/05 13:01, , 2F
AlphaGo在後期會把一些還有變化的地方早早結束掉
01/05 13:01, 2F

01/05 13:02, , 3F
這就是我們學棋跟阿發狗最大的不同……
01/05 13:02, 3F

01/05 13:03, , 4F
我們會關注贏多少 他只會管有沒有贏
01/05 13:03, 4F

01/05 13:03, , 5F
機器沒有賭徒性格差很多
01/05 13:03, 5F

01/05 13:03, , 6F
和李世石打的那隻也有自我對奕了吧
01/05 13:03, 6F
那隻有自我對羿 但是他還是吃人類棋譜長大的 現在這隻完全不受人類棋譜污染 他是純粹自我對羿長大的

01/05 13:03, , 7F
人會犯錯啊 又不可能像AI那麼精準計算
01/05 13:03, 7F

01/05 13:04, , 8F
也不能說人的下法不對 因為我們怕失誤 所以會希望能盡量多
01/05 13:04, 8F

01/05 13:04, , 9F
不能說錯的 人也很難完整複製AI那套下法
01/05 13:04, 9F
重點是既往圍棋理論會跟你說 絕對不能這樣下的棋步 被狗狗證明是可以這樣下的 光這點就夠震撼了

01/05 13:04, , 10F
凹一點 但是機器不會失誤
01/05 13:04, 10F
※ 編輯: Justice5566 (114.34.51.10), 01/05/2017 13:05:40

01/05 13:10, , 11F
還有電腦的訓練量就算是最強的職業棋士都難望項背...
01/05 13:10, 11F

01/05 13:10, , 12F
職業棋士沒有辦法 24x7 都在下棋... |||
01/05 13:10, 12F

01/05 13:10, , 13F
AlphaGo能那樣下是因為它能發揮 人能不能發揮同樣效力?
01/05 13:10, 13F

01/05 13:11, , 14F
AlphaGO 的著棋思路可能沒有辦法從內部結構去理解
01/05 13:11, 14F

01/05 13:12, , 15F
人類跟ai在下圍棋的根本判斷方式有不同
01/05 13:12, 15F

01/05 13:13, , 16F
雖然結果都是為了最大勝率 但過程差很多
01/05 13:13, 16F

01/05 13:16, , 17F
現在看起來李世石真的是神之一手 可能是阿發狗最後一敗
01/05 13:16, 17F

01/05 13:17, , 18F
圍棋理論也是建立在大量棋局的收斂經驗談上吧?
01/05 13:17, 18F

01/05 13:18, , 19F
他前中期的下法.其實不是人類不懂..
01/05 13:18, 19F

01/05 13:18, , 20F
而是我們沒辦法判斷這麼宏觀
01/05 13:18, 20F

01/05 13:18, , 21F
這樣說好了.人類的觀點 都在局部.=而阿法狗下的 都是宏
01/05 13:18, 21F

01/05 13:18, , 22F
觀的勝利.其實人類也可以 只是...
01/05 13:18, 22F

01/05 13:19, , 23F
你無法像AI那樣.中收尾不出錯
01/05 13:19, 23F

01/05 13:20, , 24F
"士傑讀了Alpha狗萬局練蠱棋局後 竟也成一代武林奇俠"
01/05 13:20, 24F

01/05 13:21, , 25F
這種套路感覺好像武俠小說wwww
01/05 13:21, 25F

01/05 13:25, , 26F
其實看解說就能有這種感覺.有時候一個局部固定的定式
01/05 13:25, 26F

01/05 13:25, , 27F
解說就會說出這邊會怎樣下.但阿法狗就下一半 就不鳥了..
01/05 13:25, 27F

01/05 13:26, , 28F
跑出旁邊下.
01/05 13:26, 28F

01/05 13:26, , 29F
我覺得電腦預測的能力比人類高很多 所以判斷是否需要收
01/05 13:26, 29F

01/05 13:26, , 30F
手或進攻的時間會變得相當準確
01/05 13:26, 30F

01/05 13:27, , 31F
最大的優勢應該是不會有太大的失誤
01/05 13:27, 31F

01/05 13:32, , 32F
只是因為ai的目標單純只放在贏而已
01/05 13:32, 32F

01/05 13:33, , 33F
ai在確定當前局面基本贏定後 就是不會再擴大優勢
01/05 13:33, 33F

01/05 13:36, , 34F
這也是為什麼收宮會看到填自己目的情況XD
01/05 13:36, 34F

01/05 13:41, , 35F
專業推~
01/05 13:41, 35F

01/05 13:43, , 36F
目前這個發展階段能贏還是重點,不然AI目標要調整成盡可能
01/05 13:43, 36F
還有 27 則推文
01/05 14:49, , 64F
我看出人類對宇宙百害無一利,所以該毀滅人類
01/05 14:49, 64F

01/05 14:50, , 65F
所以新版的有出PAPER了嗎? 我上次看的那篇有用到
01/05 14:50, 65F

01/05 14:50, , 66F
兩個ai的差異蠻有趣的
01/05 14:50, 66F

01/05 14:51, , 67F
人類經驗做落點預測
01/05 14:51, 67F

01/05 14:57, , 68F
今天的Nature沒有 只有新聞快報看看下禮拜吧
01/05 14:57, 68F

01/05 15:10, , 69F
我的看法跟你不一樣
01/05 15:10, 69F

01/05 15:31, , 70F
有那個版面對這個議題有深入討論嗎 想拜見一下
01/05 15:31, 70F

01/05 15:37, , 71F
看起來目前的狗狗沒有針對對手個體行為做預測與調整
01/05 15:37, 71F

01/05 15:39, , 72F
也就是不管給他誰當對手他的思考方式都一樣
01/05 15:39, 72F

01/05 15:40, , 73F
如果未來要出專門玩猜拳的狗狗 應該就會發展出個體行為分析
01/05 15:40, 73F

01/05 15:40, , 74F
與預測的狗狗了
01/05 15:40, 74F

01/05 15:42, , 75F
換句話說,狗已經領悟圍棋本質,根本不在乎對手....
01/05 15:42, 75F

01/05 15:43, , 76F
好像更厲害...
01/05 15:43, 76F

01/05 15:46, , 77F
這要看人 有人覺得下棋重在兩個人之前的互相影響
01/05 15:46, 77F

01/05 15:46, , 78F
如何打亂對方的節奏 如何不被對方打亂節奏
01/05 15:46, 78F

01/05 15:47, , 79F
但是狗狗就只是在想怎麼放子可以贏
01/05 15:47, 79F

01/05 16:09, , 80F
究竟是從哪裡流出:這個AlphaGO是完全自我對弈出來的
01/05 16:09, 80F

01/05 16:09, , 81F
官方也只說新版 甚至沒講如何新版 怎麼腦補的?
01/05 16:09, 81F

01/05 16:10, , 82F
去年三月 AlphaGO就有過跳脫思維演出了 你也無法否定
01/05 16:10, 82F

01/05 16:11, , 83F
他在一年的時間內 透過自我對弈 又刪除了不少人類棋譜的
01/05 16:11, 83F

01/05 16:11, , 84F
可能性啊
01/05 16:11, 84F

01/05 16:12, , 85F
那AlphaGO2只要跟AlphaGO1對弈練習...
01/05 16:12, 85F

01/05 16:19, , 86F
從新版那個字眼聯想出來的,沒有正式說法
01/05 16:19, 86F

01/05 16:19, , 87F
可是自我對弈的棋譜也是從上一版的AlphaGo來的吧?
01/05 16:19, 87F

01/05 16:20, , 88F
所以多少還是需要採用人類棋手的智慧?
01/05 16:20, 88F

01/05 16:20, , 89F
不太相信他們可以從全部隨機開始train出這版alphaGo..
01/05 16:20, 89F

01/05 16:23, , 90F
訓練方式是go板看到的陸聞寫的 姑妄聽之吧
01/05 16:23, 90F

01/05 16:26, , 91F
因為去年Google有說下一版的將會是自我對奕出來的版本
01/05 16:26, 91F

01/05 16:26, , 92F
所以才會這樣說吧
01/05 16:26, 92F

01/05 16:27, , 93F
人類的棋譜也是上千年棋局累積出來的
01/05 16:27, 93F

01/05 16:27, , 94F
可是電腦自己下,可能幾個月就能累積出人類上千年的量
01/05 16:27, 94F

01/05 16:27, , 95F
從而形成自己的棋譜
01/05 16:27, 95F

01/05 17:29, , 96F
但是圍棋wiki上寫的歷史 最早圍棋跟現在好像布一樣
01/05 17:29, 96F

01/05 17:30, , 97F
不知道現代圍棋 大概算是幾年的歷史
01/05 17:30, 97F

01/05 18:00, , 98F
圍棋真的太奧妙,可惜相較之下西方不夠盛行,想看東西
01/05 18:00, 98F

01/05 18:00, , 99F
方各種天才的比拼
01/05 18:00, 99F

01/05 18:09, , 100F
樓上 不需要了.接下來讓ai帶著大家前進
01/05 18:09, 100F

01/05 18:57, , 101F
以後圍棋賽變成電腦拼電腦 人類會看熱鬧可是都看不懂XD
01/05 18:57, 101F

01/05 18:59, , 102F
西洋棋被征服之後還是有職業棋賽阿
01/05 18:59, 102F

01/05 23:49, , 103F
簽名檔我笑了
01/05 23:49, 103F
文章代碼(AID): #1ORT82tN (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1ORT82tN (C_Chat)