Re: [閒聊] 甲王進來一下
※ 引述《wwndbk (黑人問號)》之銘言:
: : → Cprogramming: 圍棋的規則很簡單的說 10/17 02:24
: 很簡單沒錯喇
: 就把棋子旁邊都圍起來就好
: 但會變強嗎ww
: 現在的定石都是以前的人研究幾百年才出來的
: 研究>>溝通、學習>>想出最好的解
: 就算是知道棋子怎麼擺卻不知道下那步棋背後的涵義
: 也絕對只能成長到一葛地步
: 我猜喇
: 大概下了好幾年都還不能上段拔@@
黃士傑博士開示
現在最新的AlphaGo Zero已經可以做到完全不用人類棋譜
自己跟自己對戰就能變強
https://www.facebook.com/aja.huang/posts/1705020576199173
大家好,我們很高興與大家分享AlphaGo的第2篇論文,
非常榮幸AlphaGo團隊再次登上了世界頂尖的《自然》雜誌。
11月10日在人工智慧年會的演講,我也將介紹AlphaGo Zero的精彩故事。
這篇論文介紹了AlphaGo Zero,也就是完全脫離人類知識的AlphaGo版本。主要成果如下:
- AlphaGo Zero從零開始自我學習下圍棋。
- 僅僅36小時後,AlphaGo Zero靠著自我學習,就摸索出所有基本且重要的圍棋知識,
達到了與李世石九段對戰的AlphaGo v18的相同水平。
- 3天後,AlphaGo Zero對戰AlphaGo v18達到100%的勝率。
- 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的
AlphaGo版本。
- 40天後,AlphaGo Zero對戰Master達到近90%勝率,成為有史以來AlphaGo棋力最強的
版本。
雖然AlphaGo Zero沒有公開下過棋,在論文中我們附上了AlphaGo Zero的80局棋
(選自不同階段的自我學習,供大家研究。從圍棋技術的角度
來說,AlphaGo Zero自學所發現的圍棋觀念,例如打劫、征子、棋形、開局先下在角部,
開局定式等等,絕大部分與人類的圍棋觀念是一致的,這也間接呼應了人類
幾千年以來圍棋研究的價值。AlphaGo Zero的棋風特別好戰,並且也喜歡直接點33。
從論文內容來說,這主要是一篇強化學習的論文,關鍵技術在於強化學習訓練pipeline的
效能極大化。
針對這篇論文或AlphaGo想要提問的朋友,請參加明天的AlphaGo AMA,
AlphaGo團隊的David Silver與Julian Schrittwieser將在線以英文回答大家的問題。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100
※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1508391908.A.B28.html
※ 編輯: Cprogramming (140.112.25.100), 10/19/2017 13:46:34
噓
10/19 13:47,
8年前
, 1F
10/19 13:47, 1F
推
10/19 13:48,
8年前
, 2F
10/19 13:48, 2F
→
10/19 13:48,
8年前
, 3F
10/19 13:48, 3F
討論串 (同標題文章)
本文引述了以下文章的的內容:
閒聊
0
1
以下文章回應了本文:
閒聊
0
10
完整討論串 (本文為第 11 之 16 篇):
閒聊
0
5
閒聊
1
4
閒聊
2
12
閒聊
0
10
閒聊
0
3
閒聊
0
1
閒聊
2
7
閒聊
0
6
閒聊
2
13