Re: [閒聊] 甲王進來一下

看板Marginalman作者 (C語言編程)時間8年前 (2017/10/19 13:45), 8年前編輯推噓0(111)
留言3則, 2人參與, 8年前最新討論串11/16 (看更多)
※ 引述《wwndbk (黑人問號)》之銘言: : : → Cprogramming: 圍棋的規則很簡單的說 10/17 02:24 : 很簡單沒錯喇 : 就把棋子旁邊都圍起來就好 : 但會變強嗎ww : 現在的定石都是以前的人研究幾百年才出來的 : 研究>>溝通、學習>>想出最好的解 : 就算是知道棋子怎麼擺卻不知道下那步棋背後的涵義 : 也絕對只能成長到一葛地步 : 我猜喇 : 大概下了好幾年都還不能上段拔@@ 黃士傑博士開示 現在最新的AlphaGo Zero已經可以做到完全不用人類棋譜 自己跟自己對戰就能變強 https://www.facebook.com/aja.huang/posts/1705020576199173 大家好,我們很高興與大家分享AlphaGo的第2篇論文, 非常榮幸AlphaGo團隊再次登上了世界頂尖的《自然》雜誌。 11月10日在人工智慧年會的演講,我也將介紹AlphaGo Zero的精彩故事。 這篇論文介紹了AlphaGo Zero,也就是完全脫離人類知識的AlphaGo版本。主要成果如下: - AlphaGo Zero從零開始自我學習下圍棋。 - 僅僅36小時後,AlphaGo Zero靠著自我學習,就摸索出所有基本且重要的圍棋知識, 達到了與李世石九段對戰的AlphaGo v18的相同水平。 - 3天後,AlphaGo Zero對戰AlphaGo v18達到100%的勝率。 - 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的 AlphaGo版本。 - 40天後,AlphaGo Zero對戰Master達到近90%勝率,成為有史以來AlphaGo棋力最強的 版本。 雖然AlphaGo Zero沒有公開下過棋,在論文中我們附上了AlphaGo Zero的80局棋 (選自不同階段的自我學習,供大家研究。從圍棋技術的角度 來說,AlphaGo Zero自學所發現的圍棋觀念,例如打劫、征子、棋形、開局先下在角部, 開局定式等等,絕大部分與人類的圍棋觀念是一致的,這也間接呼應了人類 幾千年以來圍棋研究的價值。AlphaGo Zero的棋風特別好戰,並且也喜歡直接點33。 從論文內容來說,這主要是一篇強化學習的論文,關鍵技術在於強化學習訓練pipeline的 效能極大化。 針對這篇論文或AlphaGo想要提問的朋友,請參加明天的AlphaGo AMA, AlphaGo團隊的David Silver與Julian Schrittwieser將在線以英文回答大家的問題。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100 ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1508391908.A.B28.html ※ 編輯: Cprogramming (140.112.25.100), 10/19/2017 13:46:34

10/19 13:47, 8年前 , 1F
贏不了我
10/19 13:47, 1F

10/19 13:48, 8年前 , 2F
話說幹嘛一直讓阿法狗下棋 不讓他去寫個程式之類的 工
10/19 13:48, 2F

10/19 13:48, 8年前 , 3F
程師怕被搶工作ㄇ
10/19 13:48, 3F
文章代碼(AID): #1Pw3laie (Marginalman)
討論串 (同標題文章)
文章代碼(AID): #1Pw3laie (Marginalman)