Re: [新聞] 黃士傑返台分享AlphaGo Zero開發過程
※ 引述《qweewqq (風一樣的男子)》之銘言:
: DeepMind指出,他們不使用任何人類知識,AlphaGo Zero用上的是新的「強化學習」方法
對於 "不使用任何人類知識" 這句, 我心中始終有個大問號.
首先, 在一開始的 random play, AZ 根本不知何時要停.
必須人工設定去停它. 這用到了人類知道這樣的遊戲, 應該有限步要停.
雖然 AZ 的參數是經由自我對戰學的, 但整個架構呢?
要有幾層的的類神經網路? 每層有多少節點? 層跟層間的結構?
covolution 要用 5x5 還是怎樣的大小?
要怎樣配合 VN, PN? 要用 MCTS 來尋找?
這些都沒用到人類的圍棋知識嗎?
這整個大架構, 是在學人類棋譜時, 發現這樣的架構, 可以訓練出不錯的 AI.
這架構不是隨便設就行得通的吧?
經由人類棋譜訓練, 找到一個好的大架構, 這樣可以稱作不使用人類知識?
如果今天一個完全不懂圍棋的人, 只針對規則, 就去訂了大模型架構,
然後經由自我對戰去學參數. 這樣的結果, 那叫做不使用任何人類圍棋知識.
現在這樣算嗎? 我心中實在有很大的黑人問號.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.113
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1510143808.A.51B.html
推
11/08 20:29,
6年前
, 1F
11/08 20:29, 1F
→
11/08 20:29,
6年前
, 2F
11/08 20:29, 2F
→
11/08 20:30,
6年前
, 3F
11/08 20:30, 3F
→
11/08 20:31,
6年前
, 4F
11/08 20:31, 4F
→
11/08 20:31,
6年前
, 5F
11/08 20:31, 5F
→
11/08 20:31,
6年前
, 6F
11/08 20:31, 6F
→
11/08 20:32,
6年前
, 7F
11/08 20:32, 7F
→
11/08 20:32,
6年前
, 8F
11/08 20:32, 8F
→
11/08 20:33,
6年前
, 9F
11/08 20:33, 9F
→
11/08 20:33,
6年前
, 10F
11/08 20:33, 10F
→
11/08 20:33,
6年前
, 11F
11/08 20:33, 11F
→
11/08 20:34,
6年前
, 12F
11/08 20:34, 12F
→
11/08 20:40,
6年前
, 13F
11/08 20:40, 13F
推
11/08 20:40,
6年前
, 14F
11/08 20:40, 14F
→
11/08 20:41,
6年前
, 15F
11/08 20:41, 15F
推
11/08 20:41,
6年前
, 16F
11/08 20:41, 16F
→
11/08 20:42,
6年前
, 17F
11/08 20:42, 17F
推
11/08 20:42,
6年前
, 18F
11/08 20:42, 18F
→
11/08 20:42,
6年前
, 19F
11/08 20:42, 19F
→
11/08 20:42,
6年前
, 20F
11/08 20:42, 20F
→
11/08 20:42,
6年前
, 21F
11/08 20:42, 21F
→
11/08 20:43,
6年前
, 22F
11/08 20:43, 22F
→
11/08 20:43,
6年前
, 23F
11/08 20:43, 23F
→
11/08 20:44,
6年前
, 24F
11/08 20:44, 24F
推
11/08 20:44,
6年前
, 25F
11/08 20:44, 25F
→
11/08 20:45,
6年前
, 26F
11/08 20:45, 26F
→
11/08 20:45,
6年前
, 27F
11/08 20:45, 27F
→
11/08 20:45,
6年前
, 28F
11/08 20:45, 28F
→
11/08 20:48,
6年前
, 29F
11/08 20:48, 29F
推
11/08 20:48,
6年前
, 30F
11/08 20:48, 30F
→
11/08 20:50,
6年前
, 31F
11/08 20:50, 31F
推
11/08 20:50,
6年前
, 32F
11/08 20:50, 32F
→
11/08 20:50,
6年前
, 33F
11/08 20:50, 33F
→
11/08 20:51,
6年前
, 34F
11/08 20:51, 34F
→
11/08 20:52,
6年前
, 35F
11/08 20:52, 35F
推
11/08 20:52,
6年前
, 36F
11/08 20:52, 36F
→
11/08 20:52,
6年前
, 37F
11/08 20:52, 37F
→
11/08 20:52,
6年前
, 38F
11/08 20:52, 38F
→
11/08 20:53,
6年前
, 39F
11/08 20:53, 39F
還有 152 則推文
推
11/10 00:18,
6年前
, 192F
11/10 00:18, 192F
→
11/10 00:19,
6年前
, 193F
11/10 00:19, 193F
→
11/10 00:21,
6年前
, 194F
11/10 00:21, 194F
噓
11/10 00:54,
6年前
, 195F
11/10 00:54, 195F
→
11/10 00:55,
6年前
, 196F
11/10 00:55, 196F
推
11/10 03:19,
6年前
, 197F
11/10 03:19, 197F
→
11/10 03:20,
6年前
, 198F
11/10 03:20, 198F
推
11/10 03:24,
6年前
, 199F
11/10 03:24, 199F
→
11/10 03:25,
6年前
, 200F
11/10 03:25, 200F
→
11/10 03:26,
6年前
, 201F
11/10 03:26, 201F
→
11/10 03:27,
6年前
, 202F
11/10 03:27, 202F
→
11/10 03:28,
6年前
, 203F
11/10 03:28, 203F
→
11/10 03:29,
6年前
, 204F
11/10 03:29, 204F
推
11/10 10:18,
6年前
, 205F
11/10 10:18, 205F
→
11/10 10:18,
6年前
, 206F
11/10 10:18, 206F
推
11/10 11:04,
6年前
, 207F
11/10 11:04, 207F
→
11/10 11:07,
6年前
, 208F
11/10 11:07, 208F
→
11/10 11:08,
6年前
, 209F
11/10 11:08, 209F
推
11/10 11:31,
6年前
, 210F
11/10 11:31, 210F
噓
11/10 11:37,
6年前
, 211F
11/10 11:37, 211F
推
11/10 11:39,
6年前
, 212F
11/10 11:39, 212F
→
11/10 11:39,
6年前
, 213F
11/10 11:39, 213F
→
11/10 11:39,
6年前
, 214F
11/10 11:39, 214F
→
11/10 11:39,
6年前
, 215F
11/10 11:39, 215F
推
11/10 11:46,
6年前
, 216F
11/10 11:46, 216F
→
11/10 11:46,
6年前
, 217F
11/10 11:46, 217F
→
11/10 11:47,
6年前
, 218F
11/10 11:47, 218F
→
11/10 11:48,
6年前
, 219F
11/10 11:48, 219F
→
11/10 11:48,
6年前
, 220F
11/10 11:48, 220F
→
11/10 11:49,
6年前
, 221F
11/10 11:49, 221F
→
11/10 11:49,
6年前
, 222F
11/10 11:49, 222F
→
11/10 11:49,
6年前
, 223F
11/10 11:49, 223F
→
11/10 11:50,
6年前
, 224F
11/10 11:50, 224F
→
11/10 11:50,
6年前
, 225F
11/10 11:50, 225F
→
11/10 11:50,
6年前
, 226F
11/10 11:50, 226F
→
11/10 11:50,
6年前
, 227F
11/10 11:50, 227F
→
11/10 11:51,
6年前
, 228F
11/10 11:51, 228F
→
11/10 11:51,
6年前
, 229F
11/10 11:51, 229F
→
11/10 11:51,
6年前
, 230F
11/10 11:51, 230F
噓
12/30 05:54,
6年前
, 231F
12/30 05:54, 231F
討論串 (同標題文章)