Re: [閒聊] 甲王進來一下

看板Marginalman作者Cprogramming (Ｃ語言編程)時間8年前 (2017/10/19 13:45)推噓0(1推 1噓 1→)

留言3則, 2人參與討論串11/16 (看更多)

※ 引述《wwndbk (黑人問號)》之銘言： : : → Cprogramming: 圍棋的規則很簡單的說 10/17 02:24 : 很簡單沒錯喇 : 就把棋子旁邊都圍起來就好 : 但會變強嗎ww : 現在的定石都是以前的人研究幾百年才出來的 : 研究>>溝通、學習>>想出最好的解 : 就算是知道棋子怎麼擺卻不知道下那步棋背後的涵義 : 也絕對只能成長到一葛地步 : 我猜喇 : 大概下了好幾年都還不能上段拔@@ 黃士傑博士開示現在最新的AlphaGo Zero已經可以做到完全不用人類棋譜自己跟自己對戰就能變強 https://www.facebook.com/aja.huang/posts/1705020576199173 大家好，我們很高興與大家分享AlphaGo的第2篇論文，非常榮幸AlphaGo團隊再次登上了世界頂尖的《自然》雜誌。 11月10日在人工智慧年會的演講，我也將介紹AlphaGo Zero的精彩故事。這篇論文介紹了AlphaGo Zero，也就是完全脫離人類知識的AlphaGo版本。主要成果如下： - AlphaGo Zero從零開始自我學習下圍棋。 - 僅僅36小時後，AlphaGo Zero靠著自我學習，就摸索出所有基本且重要的圍棋知識，達到了與李世石九段對戰的AlphaGo v18的相同水平。 - 3天後，AlphaGo Zero對戰AlphaGo v18達到100%的勝率。 - 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的 AlphaGo版本。 - 40天後，AlphaGo Zero對戰Master達到近90%勝率，成為有史以來AlphaGo棋力最強的版本。雖然AlphaGo Zero沒有公開下過棋，在論文中我們附上了AlphaGo Zero的80局棋 (選自不同階段的自我學習，供大家研究。從圍棋技術的角度來說，AlphaGo Zero自學所發現的圍棋觀念，例如打劫、征子、棋形、開局先下在角部，開局定式等等，絕大部分與人類的圍棋觀念是一致的，這也間接呼應了人類幾千年以來圍棋研究的價值。AlphaGo Zero的棋風特別好戰，並且也喜歡直接點33。從論文內容來說，這主要是一篇強化學習的論文，關鍵技術在於強化學習訓練pipeline的效能極大化。針對這篇論文或AlphaGo想要提問的朋友，請參加明天的AlphaGo AMA， AlphaGo團隊的David Silver與Julian Schrittwieser將在線以英文回答大家的問題。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100 ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1508391908.A.B28.html ※ 編輯: Cprogramming (140.112.25.100), 10/19/2017 13:46:34

噓

oz5566

10/19 13:47, 8年前 , 1^F

10/19 13:47, 1^F

推

chuchu000

10/19 13:48, 8年前 , 2^F

10/19 13:48, 2^F

→

chuchu000

10/19 13:48, 8年前 , 3^F

10/19 13:48, 3^F