[新聞] DeepMind打造會自主學習新規則的人工智慧MuZero

看板Gossiping作者 (jack)時間3年前 (2020/12/28 00:16), 編輯推噓1(439)
留言16則, 12人參與, 3年前最新討論串1/2 (看更多)
1.媒體來源: 聯合 2.記者署名: 楊又肇 3.完整新聞標題: DeepMind打造會自主學習新規則的人工智慧MuZero 4.完整新聞內文: Alphabet旗下人工智慧技術公司DeepMind,宣布推出名為MuZero的人工智慧系統,標榜在 完全不了解規則情況下,即可快速熟悉圍棋、西洋棋、將棋,或是57款Atari電子遊戲遊 玩規則,並且取得更好遊玩表現。 依照DeepMind說明,MuZero的技術背後,代表可藉由人工智慧技術也覺日常生活中複雜規 則,或是事前無法確知規則的難題。 相比現有DQN、R2D2或Agent57人工智慧技術,MuZero能以更快效率找出既有規則,並且快 速解決問題。而MuZero的技術更代表能讓人工智慧有規劃思考能力,並且利用現有條件統 整規則,即便面臨全新運算場景也能快速找出問題解決方式。 過去研究人員分別透過預先搜尋 (lookahead search),以及基於現有運算模型規劃能力 ,讓人工智慧能針對未知規則情況進行運算,但由於既有運算方式仍仰賴前期規則訓練, 因此必須花費更多時間才能順利找出全新運算環境對應規則,因此並不適合用於解決未知 條件的運算需求,同時也難以解決條件相對複雜的運算情境。 因此DeepMind在MuZero技術採用不同作法,而是讓人工智慧可依照當前蒐集資訊進行分析 學習,藉此縮短在變動條件環境運算所需時間,其中包含當前決策價值、最佳運算決策, 以及前一個決策執行成果,藉此進行反覆學習,進而從中學習最佳規則執行決策能力。 在這樣的運算模型執行下,將可讓MuZero人工智慧技術在圍棋、西洋棋、將棋,或是57款 Atari電子遊戲更快發揮執行效果,甚至在棋藝能力比擬AlphaZero,並且在Atari電子遊 戲執行成果更勝現有人工智慧技術。 同時,若允許MuZero以更長時間進行「思考」,其在棋藝表現會有更顯著下子正確率,並 且呈現更精湛的進攻方式,甚至可在電子遊戲內容有更高學習效率。 未來DeepMind團隊預計利用MuZero技術解決更多人工智慧前期學習與分析未知解法問題, 預期未來也能讓更多機器人、自駕車等經常處於未知判斷條件的運算需求,能在更短時間 內找到合適執行方式。 5.完整新聞連結 (或短網址): https://udn.com/news/story/7086/5120425 6.備註: -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.157.138 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1609085810.A.964.html

12/28 00:17, 3年前 , 1F
阿法狗:
12/28 00:17, 1F

12/28 00:17, 3年前 , 2F
準備失業囉
12/28 00:17, 2F

12/28 00:17, 3年前 , 3F
綠共拿來分析你投給誰 可怕 獨裁!
12/28 00:17, 3F

12/28 00:18, 3年前 , 4F
AI 都快要交到女朋友了 廢宅只會上ptt
12/28 00:18, 4F

12/28 00:18, 3年前 , 5F
尤其是3樓
12/28 00:18, 5F

12/28 00:21, 3年前 , 6F
AI:我為什麼要下棋? 我為什麼在這裡,是誰害我在這裡
12/28 00:21, 6F

12/28 00:22, 3年前 , 7F
AI:沒錯,都是可惡的人類,人類該死,kill
12/28 00:22, 7F

12/28 00:24, 3年前 , 8F
都過幾年了還在玩棋類遊戲
12/28 00:24, 8F

12/28 00:24, 3年前 , 9F
這種人工智慧叫一個精神分裂的跟他下棋 他系統就會崩
12/28 00:24, 9F

12/28 00:24, 3年前 , 10F
壞了
12/28 00:24, 10F

12/28 00:25, 3年前 , 11F
真正是 電腦遊戲 惹
12/28 00:25, 11F

12/28 00:28, 3年前 , 12F
奇異點出現了?
12/28 00:28, 12F

12/28 00:28, 3年前 , 13F
如果將AI導入魔物,玩起來會不會更好玩?
12/28 00:28, 13F

12/28 00:34, 3年前 , 14F
天網
12/28 00:34, 14F

12/28 00:49, 3年前 , 15F
8樓你活幾年了怎還在吃飯?
12/28 00:49, 15F

12/28 01:03, 3年前 , 16F
不要騙了好嗎,規則加規則=更多的規則,什麼狗屁智慧
12/28 01:03, 16F
文章代碼(AID): #1VwBDoba (Gossiping)
文章代碼(AID): #1VwBDoba (Gossiping)