Re: [爆卦] AlphaGo終極版:AlphaGo Zero消失

看板Gossiping作者時間6年前 (2017/10/19 09:25), 6年前編輯推噓-5(192425)
留言68則, 45人參與, 最新討論串6/9 (看更多)
這真是太強了 強的地方在哪裡? 在於現在 alpha go 不需讀人類棋譜 簡單講就是一個新的 alpha go 從甚麼都不知道, 到最強 你不必告訴他規則 (傳統的程式就是如果A ,你去判斷一些東西,計算一些東西,敵我優略勢 一堆規則後,決定下在哪) 現在一個新生的 alpha go 他一開始甚麼都不知道 你不必告訴他圍棋則,不必告訴他怎樣叫做贏 不必告訴他一堆專有名詞,例如脫先......... 他甚麼都不知道,然後開始跟你下 第一盤它輸了,搞不好他不知道為什麼這叫做輸,他什麼都不知道 下到第100盤後,他可能還是輸,但是他會自己學習 漸漸的,他甚麼規則都不知道,就變最強的 ------------------------------------------- 想像一下,如果沒人告訴你任何規則, 你沒辦法學一些套路,你對圍棋都不董 而且你沒任何資源可以去搜尋任何關於圍棋的東西 你就去下圍棋 (甚至於你根本不知道把對方圍起來的規則) 反正簡單講就是你一無所知任何關於圍棋的東西,連要圍起來這件事都不知道 然後你一直跟人下棋 你一直輸,沒人告訴你為什麼這樣叫做輸 你可能下到最後會抓狂 因為你完全不知道在下甚麼? 這就是 alpha go 強的地方 不需要棋譜,不需要知道規則 一直下,自我學習,最後變最強 有人說如果兩個alpha go 一直自我學習的互下會怎樣? 簡單講除非雙方每一步都是最佳解 否則一定還是有優略 現在 Alpga go 差不多 5000分,應該還不到每步都最佳解 現在怕的是雙方每一步都是最佳解 那可能要回歸最初的規則 倒底黑棋要貼幾目? ================================= 另外 deepmind 要用 AI玩 星海爭霸 很多人說 電腦控兵很強,根本無延遲,一定會贏 但AI玩遊戲重點不在這裡 重點在於 AI 甚麼都不知道 你丟它下去玩星海爭霸 它不知道玩法 它不知道每個種族的差異 它不知道每各兵種的優略 它不知道甚麼叫做贏 它甚麼都不知道 然後一直玩一直學習 最後把你打敗 AI玩遊戲重點在這裡 看看 AI 怎麼訓練玩遊戲? https://www.youtube.com/watch?v=5iZlrBqDYPM
https://www.youtube.com/watch?v=6L448yg0Sm0
https://www.youtube.com/watch?v=St5lxIxYGkI
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.215.5 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1508376318.A.8DC.html

10/19 09:26, , 1F
根本蟻王
10/19 09:26, 1F

10/19 09:27, , 2F
圍棋規則還是需要啦
10/19 09:27, 2F

10/19 09:28, , 3F
這是增強式學習 要告訴AI怎樣叫贏
10/19 09:28, 3F

10/19 09:28, , 4F
怎麼可能什麼規則都不要 開玩笑嗎
10/19 09:28, 4F

10/19 09:28, , 5F
不知道規則不管怎麼下都說我贏會怎樣
10/19 09:28, 5F
不知道規則不代表沒規則,只是你不知道

10/19 09:30, , 6F
最好是不跟他講什麼叫贏……你變魔術嗎
10/19 09:30, 6F

10/19 09:30, , 7F
AlphaGo Zero 簡直中二爆了
10/19 09:30, 7F

10/19 09:31, , 8F
應該說要跟他說 輸贏的分數
10/19 09:31, 8F

10/19 09:31, , 9F
這個理解有很大的問題 XD
10/19 09:31, 9F

10/19 09:32, , 10F
為什麼不說規則?
10/19 09:32, 10F

10/19 09:32, , 11F
否則AI還以為圍棋是擺花紋漂亮會贏 藝術有分數嗎?
10/19 09:32, 11F

10/19 09:32, , 12F
如果 AI 真的能進步到理解人類的 藝術美學 那真的很神
10/19 09:32, 12F
※ 編輯: SangoDragon (111.241.215.5), 10/19/2017 09:33:35

10/19 09:34, , 13F
因為人類會受文化信仰影響 看到的東西也是感光受器影響
10/19 09:34, 13F

10/19 09:35, , 14F
不用說規則跟不說輸贏是兩回事
10/19 09:35, 14F

10/19 09:35, , 15F
人類覺得顏色繽紛 其他生物眼中可不是這樣
10/19 09:35, 15F

10/19 09:35, , 16F
加強式學習沒給他獎懲條件 要怎麼加強? 你誤解大了喔
10/19 09:35, 16F

10/19 09:40, , 17F
打磚塊也要告訴它可以做的動作是左右移,這就是規則
10/19 09:40, 17F

10/19 09:43, , 18F
你這樣完全沒有目標,是能訓練什麼鬼東西
10/19 09:43, 18F

10/19 09:43, , 19F
應該是讓他亂搞但是最後會告訴他結果吧
10/19 09:43, 19F

10/19 09:48, , 20F
不給回饋要怎麼收斂行為
10/19 09:48, 20F

10/19 09:50, , 21F
沒有懲罰下在棋盤外面的行為,AI永遠第一步下棋盤外
10/19 09:50, 21F

10/19 09:53, , 22F
所以叫 zero! 太極最高境界 什麼招式都不記得 就是會贏
10/19 09:53, 22F

10/19 09:59, , 23F
就文組想法… 先找一本機器學習基礎再來吧
10/19 09:59, 23F

10/19 10:02, , 24F
不要做夢還寫一大篇了..
10/19 10:02, 24F

10/19 10:02, , 25F
原論文沒有提到不必告訴他怎樣叫做贏,盤面、下子方法也是
10/19 10:02, 25F

10/19 10:03, , 26F
固定的,只是下一步該下哪是從一個隨機值開始
10/19 10:03, 26F

10/19 10:03, , 27F
輸贏算是外界幫它判定啦 人類沒有教它的是怎樣下比較好
10/19 10:03, 27F

10/19 10:05, , 28F
原始版本訓練是用人類棋譜開始, 等於在模仿人類的決策
10/19 10:05, 28F

10/19 10:07, , 29F
規則最好不用告訴他,給他棋盤黑白子不告訴他規則,你確定
10/19 10:07, 29F

10/19 10:07, , 30F
不會下成五子棋,黑白棋?
10/19 10:07, 30F

10/19 10:07, , 31F
是不參考人類棋譜 最好是沒規則啦 不懂裝懂 笑死我了
10/19 10:07, 31F

10/19 10:08, , 32F
或自己發明別種玩法?
10/19 10:08, 32F

10/19 10:08, , 33F
論文第22頁就有寫到有哪些是訓練前已知的Domain Knowledge
10/19 10:08, 33F

10/19 10:09, , 34F
1. perfect knowledge of the game rules
10/19 10:09, 34F

10/19 10:09, , 35F
你根本不懂吧...
10/19 10:09, 35F

10/19 10:16, , 36F
我知道你很興奮 但查清楚再發文
10/19 10:16, 36F

10/19 10:20, , 37F
。。。。。。。。。。。。
10/19 10:20, 37F

10/19 10:22, , 38F
說的好 這樣以後統治者嘴出來嘴哲學等 大概就要跟AI辯論了吧?
10/19 10:22, 38F

10/19 10:24, , 39F
這樣要光是前三天就下幾萬局了吧
10/19 10:24, 39F

10/19 10:26, , 40F
雖然原PO根本搞不懂狀況 至少顏色上的不錯
10/19 10:26, 40F

10/19 10:30, , 41F
它知道規則啦!它也是一直往獲勝目標前進
10/19 10:30, 41F

10/19 10:32, , 42F
你改成不需要定石這篇就不會被噓了
10/19 10:32, 42F

10/19 10:34, , 43F
應該說它是從隨機亂下開始 最後學到天下無敵
10/19 10:34, 43F

10/19 10:34, , 44F
一開始什麼資料也沒有 所以就像小孩在棋盤上亂擺
10/19 10:34, 44F

10/19 10:38, , 45F
裡面有講啊 訓練三小時後 開始認知佔愈多實地的贏
10/19 10:38, 45F

10/19 10:39, , 46F
其實比亂擺還好一點,至少是合法的亂擺
10/19 10:39, 46F

10/19 10:40, , 47F
19 小時後開始會考慮生死和厚勢... 70 小時已經變成超人
10/19 10:40, 47F

10/19 10:42, , 48F
廢文
10/19 10:42, 48F

10/19 10:51, , 49F
你到底懂不懂啊...沒有規則 是要怎樣有結果?
10/19 10:51, 49F

10/19 11:12, , 50F
廢文Zero
10/19 11:12, 50F

10/19 11:14, , 51F
圍棋沒有規則就不叫圍棋 孩子
10/19 11:14, 51F

10/19 11:15, , 52F
文組
10/19 11:15, 52F

10/19 11:17, , 53F
文組
10/19 11:17, 53F

10/19 11:22, , 54F
文組
10/19 11:22, 54F

10/19 11:36, , 55F
你這不如叫猴子打一篇莎士比亞出來
10/19 11:36, 55F

10/19 11:48, , 56F
完全誤解 ai還是要知道規則
10/19 11:48, 56F

10/19 11:49, , 57F
不知道叫輸贏 怎麼最佳化取勝?
10/19 11:49, 57F

10/19 11:55, , 58F
文組不要出來秀下限好嗎
10/19 11:55, 58F

10/19 11:59, , 59F
完全沒有規則棋子可以下在棋盤外嗎?
10/19 11:59, 59F

10/19 12:03, , 60F
....神理解
10/19 12:03, 60F

10/19 12:03, , 61F
圍棋沒有規則還不下成五子棋?
10/19 12:03, 61F

10/19 12:14, , 62F
懂還是不懂啊
10/19 12:14, 62F

10/19 12:24, , 63F
不知道規則的不會一直贏
10/19 12:24, 63F

10/19 13:39, , 64F
通篇胡說八道
10/19 13:39, 64F

10/19 14:01, , 65F
打這麼多字還全錯,文組吧?
10/19 14:01, 65F

10/19 17:40, , 66F
第五句就告訴你這是廢文可以噓了
10/19 17:40, 66F

10/21 22:29, , 67F
文組
10/21 22:29, 67F

10/25 15:46, , 68F
你這就標準的"一本正經的胡說八道"
10/25 15:46, 68F
文章代碼(AID): #1Pv_x-ZS (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1Pv_x-ZS (Gossiping)