Re: [心得] AI對戰人類心得(已補影片)

看板StarCraft作者時間6年前 (2017/11/04 08:03), 編輯推噓21(23266)
留言91則, 14人參與, 6年前最新討論串2/2 (看更多)
想說的有點多 如果版主覺得不適合發在本版可以刪除 沒意見 每次有AI相關的東西 就會發現很多人的觀念還停留在上個世紀 以為AI就是寫好寫死的固定程式 這次比賽的AI 前兩個應該是屬於上面這種 第三個AI很明顯有點類似AlphaGo 有一些比較"非人類"的動作 10年前跟你說AI可以打贏圍棋世界冠軍 99%的人都會笑著說怎麼可能 現在? 目前最好的AI 所做的各種判斷/應對 都不是由人類設計/輸入/寫好的 而是由AI自己不斷"演化"的結果 所以會有一些"非人類"操作是非常正常的事情 不懂的可以看看這影片 我下面會說明 只要幾分鐘你就能大概理解這種AI https://www.youtube.com/watch?v=NHtsUls3AnY
這是一個超級簡單到不行的AI模擬 首先 所有AI都擁有一樣的 "身體" 但每個AI都有自己的移動方式 這個方法最一開始是隨機設定的 所以會有很多根本不知道在幹三小的AI 很正常 再來是這種AI的關鍵 演化的條件 要設定甚麼條件才能演化出更"好"的AI 在這個模擬中 要的是能夠盡可能的快速吃到 "食物"(紅點) 的AI 當一個AI能夠吃到食物就能產生基於自己的 "後代" 一直吃不到/搶不贏的...就是死亡/淘汰 "後代" 雖然大部分的移動方式和 "前代" 一樣 但會有一些小部分可以產生隨機的變化 (想成DNA複製錯誤產生的突變就懂了) 這個變化可能有好有壞 能更快的吃到食物→ 這個AI就能產生更多的"後代" 反而動作變慢→ 這不好的演化結果會慢慢被前者淘汰 最後 你會得到一群搶食物快得嚇人的AI 這跟大自然的物競天擇有87%像 "自然演化" 就是一個非常強大的演算法 可以想成類似暴力破解 嘗試近乎無數的可能性後找出好的解法 但 "演化" 和 "暴力破解" 最大的不同在於 演化並不需要每一次嘗試都 "從0開始" 而是建立在"前代"的成功之上逐漸改進 最後的結果可能不是真正最好的解決方法 但至少非常非常非常接近 這種AI的特性是 裡面到底發生了啥 就算是設計的人都得研究一下才能知道 而且也只是"當下"的情況 多跑幾次模擬後可能又不一樣了 對外界來說就是個 "黑箱" 就像電腦自己教會自己一樣 (基本上 真的是) https://www.youtube.com/watch?v=op0bhZNUJFE
這個內部運作的程式 應該也是模擬出來的AI 四隻腳=同時協調大量元件運作 受到外力能自行恢復平衡 加上負載後重心變化後要怎麼應對 人寫的出來你敢信? 隨便一個動作就要花很多時間 而且87%無法動的和AI一樣完美 AI模擬連實機都不需要 直接在電腦上一次模擬數十數百個 不需要人介入(其實還是要 調整各種條件等等) 就能自己演化出來 參數設的好 → AlphaGo 參數設的不好 → 垃圾/改參數重來 只會4D的AI 很可能是因為天梯環境 天梯在幹嘛? 不就是以最高勝率的戰術獲得最多勝場? 當AI發現4D勝率很高然後只以這個戰術為基準的時候 整個訓練方向就錯了 如果訓練AI時用的是職業選手 那結果應該會很不一樣 https://www.youtube.com/watch?v=hx_bgoTF7bs
這個也是 初期看起來真的很好笑 (有如這次表演的AI) 但理論上演化夠多次後 AI會比 "你" 還懂得如何 "正確的" 走路... 純粹分享一些業餘的知識 如有錯誤歡迎討論 -- We live in a society exquisitely dependent on science and technology, in which hardly anyone knows anything about science and technology. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.35.143.39 ※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1509753780.A.2A5.html

11/04 08:24, 6年前 , 1F
這算是類神經的概念嗎 好奇問一下而已
11/04 08:24, 1F

11/04 08:26, 6年前 , 2F
演化計算是ai的一種沒錯,但是不是每種ai都是演化計算吧
11/04 08:26, 2F

11/04 08:29, 6年前 , 3F
1樓是的 現在大部分AI都有類神經網路在裡面 也就是常
11/04 08:29, 3F

11/04 08:29, 6年前 , 4F
聽到的neural network
11/04 08:29, 4F

11/04 08:30, 6年前 , 5F
其實對AI來說 所謂的學習 是去逼近
11/04 08:30, 5F

11/04 08:31, 6年前 , 6F
如果你願意相信 則其實世界上所有的事物都可以轉化對
11/04 08:31, 6F

11/04 08:31, 6年前 , 7F
應成一個數學函數 可能很複雜 可能很簡單y=ax+b
11/04 08:31, 7F

11/04 08:33, 6年前 , 8F
AI的概念就是我不知道a,b但是我從一堆資料裡面去逼近
11/04 08:33, 8F

11/04 08:33, 6年前 , 9F
出a,b是什麼 學到這個f(x)
11/04 08:33, 9F

11/04 08:33, 6年前 , 10F
然後接下來你給我x我一定可以預測出y
11/04 08:33, 10F

11/04 08:35, 6年前 , 11F
所以才說訓練資料很重要 如果你的訓練資料有偏頗 或
11/04 08:35, 11F

11/04 08:35, 6年前 , 12F
是太少 他根本無法逼近出真正的那個f(x) 就會變成預
11/04 08:35, 12F

11/04 08:35, 6年前 , 13F
測很爛 很不准 或是打很爛 但這就是他從資料中學到的
11/04 08:35, 13F

11/04 08:37, 6年前 , 14F
類神經也就是neural network 做的就是我用一堆神經元
11/04 08:37, 14F

11/04 08:37, 6年前 , 15F
來讓AI可以逼近超複雜 不只是a b兩個參數 而是上萬
11/04 08:37, 15F

11/04 08:37, 6年前 , 16F
個參數的函數
11/04 08:37, 16F

11/04 08:40, 6年前 , 17F
Festo這是什麼公司阿?也太可怕,默默開放出這些可怕玩意
11/04 08:40, 17F

11/04 09:02, 6年前 , 18F
如果是這樣 圍棋跟星海對他們來說資料量差太大了吧
11/04 09:02, 18F

11/04 09:03, 6年前 , 19F
幾乎多個參數就多好幾倍的變化
11/04 09:03, 19F

11/04 09:10, 6年前 , 20F
星海跟AlphaGo用的呢是neural mdtwork的一個分支 叫
11/04 09:10, 20F

11/04 09:10, 6年前 , 21F
做reinforcement learning 強化學習
11/04 09:10, 21F

11/04 09:16, 6年前 , 22F
一樣是逼近找出數學函數 但是這個數學函數表示的是一
11/04 09:16, 22F

11/04 09:16, 6年前 , 23F
個叫做「決策」的條件機率 也就是AI「觀察」到現在這
11/04 09:16, 23F

11/04 09:16, 6年前 , 24F
個「狀態」 然後決定要做什麼「動作」
11/04 09:16, 24F

11/04 09:17, 6年前 , 25F
每一個「動作」會得到「獎勵」 目標是使得整局比賽獎
11/04 09:17, 25F

11/04 09:17, 6年前 , 26F
勵最大
11/04 09:17, 26F

11/04 09:19, 6年前 , 27F
對啊 這參數量真的很大 因此要在學習過程懂得刪減掉
11/04 09:19, 27F

11/04 09:19, 6年前 , 28F
機率太小的決策以減少計算 而且訓練過程需要的電腦數
11/04 09:19, 28F

11/04 09:19, 6年前 , 29F
量至少幾千幾萬台 時間也要四、五個月
11/04 09:19, 29F

11/04 10:17, 6年前 , 30F
學習能力啦~ 還有邏輯判斷 能不能用現有的資訊預測其他狀況
11/04 10:17, 30F

11/04 10:33, 6年前 , 31F
參數量超超超超大 所以之前的年代這不是主流作法
11/04 10:33, 31F

11/04 10:34, 6年前 , 32F
現在因為GPU強到翻 大家發現它足以撐起這麼誇張的計算
11/04 10:34, 32F

11/04 10:34, 6年前 , 33F
量所以才一窩蜂開始發展
11/04 10:34, 33F

11/04 10:38, 6年前 , 34F
現在的這種作法 是真的相當於在開發一顆大腦出來
11/04 10:38, 34F

11/04 10:38, 6年前 , 35F
但這顆大腦確實只會做一種事情(然而也可以幹爆人類)
11/04 10:38, 35F

11/04 10:39, 6年前 , 36F
所以要說這是弱人工智慧並非真的智慧 也是有其道理
11/04 10:39, 36F

11/04 10:41, 6年前 , 37F
推文提到的ax+b就是類神經網路的 但十幾年前的技術
11/04 10:41, 37F

11/04 10:42, 6年前 , 38F
大概只會使用1024/2048這種量級的ax+b所以被當成玩具
11/04 10:42, 38F

11/04 10:43, 6年前 , 39F
現在則是約100x100x1000+4096+4096這種程度的數量
11/04 10:43, 39F

11/04 10:47, 6年前 , 40F
另外如果考慮AI競賽或人機大戰 沒人規定你不能用腳本
11/04 10:47, 40F

11/04 10:47, 6年前 , 41F
你有本事就用 只是現在用了會被業餘玩家幹爆而已
11/04 10:47, 41F

11/04 10:48, 6年前 , 42F
(遊戲內腳本強是因為他作弊)
11/04 10:48, 42F

11/04 18:55, 6年前 , 43F
然而 依然一堆原始人在小看Ai
11/04 18:55, 43F

11/04 19:54, 6年前 , 44F
樓上最好說清楚點,Sen應該不算原始人,AI行為搞笑自然會被
11/04 19:54, 44F

11/04 19:55, 6年前 , 45F
放大檢視甚至輕視,現在輕視也不代表會一直輕視
11/04 19:55, 45F

11/04 20:33, 6年前 , 46F
現在明明就還有很多問題待克服
11/04 20:33, 46F

11/04 20:34, 6年前 , 47F
我不覺得把將來的可能性拿到現在來反對其他人對當前成果
11/04 20:34, 47F

11/04 20:34, 6年前 , 48F
的批判 是什麼有意義的事
11/04 20:34, 48F

11/04 20:44, 6年前 , 49F
這一版AI被笑是完全合情合理的 4D+2這種戰術以玩家的
11/04 20:44, 49F

11/04 20:45, 6年前 , 50F
角度來看本來就該笑 當然會長成這種戰術確實有研究上
11/04 20:45, 50F

11/04 20:45, 6年前 , 51F
的原因和討論價值 不過SEN他播報是播給遊戲玩家看的
11/04 20:45, 51F

11/04 20:46, 6年前 , 52F
那當然要站在玩家的立場來解說 沒什麼好批評的
11/04 20:46, 52F

11/04 20:48, 6年前 , 53F
白痴 在講的是小看ai的可能性跟強大好爆zzz
11/04 20:48, 53F

11/04 20:49, 6年前 , 54F
嘩 不服氣就砲白癡 這點真的比AI強太多了
11/04 20:49, 54F

11/04 20:54, 6年前 , 55F
我們已經進入網路時代,資訊交流是以秒為單位傳遞
11/04 20:54, 55F

11/04 20:55, 6年前 , 56F
今天嘲笑AI的人 在AI蛻變後 往往也是最早讚揚AI的人
11/04 20:55, 56F

11/04 20:57, 6年前 , 57F
再說 雖然在很多篇已經說過了
11/04 20:57, 57F

11/04 20:57, 6年前 , 58F
DeepMind最近發表的研究狀況是他們卡關了
11/04 20:57, 58F

11/04 20:57, 6年前 , 59F
為什麼還是看到很多人講的好像 演算法問題都已經解決
11/04 20:57, 59F

11/04 20:58, 6年前 , 60F
只需要給AI時間學習一樣
11/04 20:58, 60F

11/04 20:58, 6年前 , 61F
無需以先知者的態度來諷刺,這個時代沒有先知,人人都是先知
11/04 20:58, 61F

11/04 21:01, 6年前 , 62F
好像以前摸過的基因演算法
11/04 21:01, 62F

11/04 21:03, 6年前 , 63F
不過那時候休課只是入門 沒接觸複雜度 設定好進化條件
11/04 21:03, 63F

11/04 21:04, 6年前 , 64F
和突變種類之類的東西 讓程式演化n代自動找出某種棋盤
11/04 21:04, 64F

11/04 21:05, 6年前 , 65F
排列 人很難排出的東西 電腦只要兩三秒
11/04 21:05, 65F

11/04 23:13, 6年前 , 66F
其實笑是正常的 如果身為懂AI的人更該高興 因為你正
11/04 23:13, 66F

11/04 23:13, 6年前 , 67F
在目睹市場被教育
11/04 23:13, 67F

11/04 23:15, 6年前 , 68F
Google DeepMind比起征服圍棋有另一個更大的重點跟使
11/04 23:15, 68F

11/04 23:15, 6年前 , 69F
命-教育市場 為未來的AI產業開拓市場 越多人瞭解AI本
11/04 23:15, 69F

11/04 23:15, 6年前 , 70F
質 就越能接受他 使用他 為他付費
11/04 23:15, 70F

11/04 23:16, 6年前 , 71F
Google更是在大家都不懂AI是什麼時 透過征服圍棋 讓
11/04 23:16, 71F

11/04 23:16, 6年前 , 72F
大家有了Google是AI產業領導品牌的形象
11/04 23:16, 72F

11/04 23:16, 6年前 , 73F
比起下圍棋 這是更大的一步棋
11/04 23:16, 73F

11/04 23:17, 6年前 , 74F
所以何必笑或是生氣外人看不懂AI 當你是第一個教育市
11/04 23:17, 74F

11/04 23:17, 6年前 , 75F
場的人 你就賺錢了 這也許是台灣產業和專家、工程師
11/04 23:17, 75F

11/04 23:17, 6年前 , 76F
該學的
11/04 23:17, 76F

11/05 00:13, 6年前 , 77F
很簡單 因為說的人往往非產業中人 酸民很少是深度涉入者
11/05 00:13, 77F

11/05 00:15, 6年前 , 78F
ai是否被接受 這些酸民都只能旁觀 選擇當先知酸人相對實際
11/05 00:15, 78F

11/05 06:12, 6年前 , 79F
不小看這次AI的 叫做對AI有太多幻想
11/05 06:12, 79F

11/05 06:12, 6年前 , 80F
好久沒看到白癡這兩個字了 好猛
11/05 06:12, 80F

11/05 06:15, 6年前 , 81F
3b1b 這幾天把AI的視頻也都給丟上youtube了 有興趣了解的
11/05 06:15, 81F

11/05 06:25, 6年前 , 82F
這些AI天梯勝率有達到70%嗎 天梯有前十嗎 沒有嘛
11/05 06:25, 82F

11/05 06:26, 6年前 , 83F
還有連單位都不用圈選的 根本作弊 就搞笑來的
11/05 06:26, 83F

11/05 06:26, 6年前 , 84F
還請到司令出征wwwww
11/05 06:26, 84F

11/05 11:29, 6年前 , 85F
連新手都打不贏的採礦AI到底能幹嘛zzz
11/05 11:29, 85F

11/05 12:32, 6年前 , 86F
我覺得先弄懂MDP和POMDP的limit在哪裡再說吧
11/05 12:32, 86F

11/05 15:59, 6年前 , 87F
這ai打一人般勝率很高 4d戰術很強 一般人不會對應
11/05 15:59, 87F

11/05 15:59, 6年前 , 88F
打職業就吃屎吧
11/05 15:59, 88F

11/05 16:00, 6年前 , 89F
靠硬操作贏的那種也不叫AI
11/05 16:00, 89F

11/05 16:01, 6年前 , 90F
還有AI演算法很早就有了 這幾年強是硬體進步了
11/05 16:01, 90F

11/05 16:02, 6年前 , 91F
但是星海是動態 跟圍旗是靜態完全不一樣
11/05 16:02, 91F
文章代碼(AID): #1P_GEqAb (StarCraft)
文章代碼(AID): #1P_GEqAb (StarCraft)