Re: [閒聊] 人機大戰觀後雜感

看板GO作者 (蜜蜜)時間7年前 (2017/05/28 15:09), 7年前編輯推噓7(14746)
留言67則, 19人參與, 最新討論串5/8 (看更多)
※ 引述《Maybetrue (電子黑手)》之銘言: : ※ 引述《hdjj (hdjj)》之銘言: : 是一個災難。比如說我們拿AG管理雙北市的紅綠燈,我們希望AG管理的紅綠燈讓交通更 : 順利,結果一個突如其來的災難,讓AG耍憨了起來,搞得全雙北市的紅綠燈通通在亂閃 : 。這是絕對不可以的。以上週團體賽的結果來說,古力那一邊的Alphago 就是在耍憨, : 而且Alphago 不是軟體工程師key 出來的函數庫,它是自我學習的整體。我猜目前 : deepmind並沒有能力修改AG讓他能在逆境採取積極對策。因為如果去年AG被李世石挖到 : 發瘋,今年重新再次自我學習應該也要把這一點改掉,但是結果並沒有,只是用強大的 : 能力掩蓋這個弱點而已。只要有個人類 (豬隊友?)在旁邊作亂,AG個體能力再強也要發 : 瘋。但是,AG發瘋是不被允許的。事實證明,AG如果傻掉,能力比常人還差。套用到更 : 大的系統面上去的話將會造成毀滅性災難。 簡單說一下原PO所說的問題點 目前deepmind的AG,在正常運作下沒有問題 但發生意外,或突發狀況時,AI並不會讓損失減到最小,而是開始錯亂... 沒人可以保證完全不出任何意外, 但如果AI只有正常運作下沒有問題 當有外力介入,產生意外時,AI並不能讓損失控制到最小,並且產生錯亂... 這是AG要解決的下一步問題.. ---- 以自動駕駛為例,當AI判斷需要立刻停止(投降), 但人類強制繼續運行並且依靠AI進行後續判斷(古力不同意,但又不能全面接管) 此時AI開始產生錯亂(亂下),導致後續應減少損失的局面,反而擴大 這是目前AG的不穩定因素之一 雖然在不同場合,可能不會發生,但現實生活中就因為這萬分之一的意外情況, 產生重大傷害 跟目前寫好的程式一樣,一但發生程式預期以外的情況是無法處理的. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 119.77.194.227 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495955363.A.1AB.html ※ 編輯: devidevi (119.77.194.227), 05/28/2017 15:10:44

05/28 15:11, , 1F
不曉得虛竹那種自殺招能不能讓AlphaGO錯亂XD
05/28 15:11, 1F

05/28 15:13, , 2F
我覺得控制權切來切去,現在的飛機自動駕駛可能也會有問題吧
05/28 15:13, 2F

05/28 15:13, , 3F
但不代表這東西不能用,只代表你不能頻繁的切來切去而已
05/28 15:13, 3F
除非AI寫成當量產後,就不具備學習功能,但這樣跟目前寫好的AI差異不大.. 當AI量產後,同時具備學習功能,哪天出意外時情況有可能不受控制

05/28 15:14, , 4F
要控制損失就訓練時給他其他條件就好阿,比方說放棄點勝率
05/28 15:14, 4F

05/28 15:14, , 5F
可是要求輸的時候要輸最少
05/28 15:14, 5F

05/28 15:16, , 6F
你要AI符合你想的去做,你給他的條件目標就要明確
05/28 15:16, 6F

05/28 15:17, , 7F
現在是條件太單純:勝率極大+贏 他一切行為當然就照這個
05/28 15:17, 7F
優勢時沒問題,但勝率低於一定程度時,下法沒辦法減少損失... 也就是正常情況下沒問題,發生意外時(勝率降低),AI反而會亂操作... 當然這只是目前看得到的問題點,不代表以後不能解決... ※ 編輯: devidevi (119.77.194.227), 05/28/2017 15:25:46

05/28 15:28, , 8F
如果賭錢,一目一千,AG大概都是把把都贏一點點那種是吧
05/28 15:28, 8F

05/28 15:31, , 9F
AI量產之後的確不會具備學習功能 AG也沒有邊下邊更新
05/28 15:31, 9F

05/28 15:32, , 10F
不受控制的學習是很危險的,應該是廠商統一處理
05/28 15:32, 10F

05/28 15:34, , 11F
勝率低會那樣就是你給的條件問題啊,你要他特殊情況符合你
05/28 15:34, 11F

05/28 15:35, , 12F
期待你就得給他其他條件阿,這不是基本邏輯嗎?
05/28 15:35, 12F

05/28 15:35, , 13F
他是機器不是神,他還是照你給的腳本去學的阿:D
05/28 15:35, 13F

05/28 15:35, , 14F
這是目標函數的問題,勝率就代表不管輸得多慘就是一敗
05/28 15:35, 14F

05/28 15:36, , 15F
其實人類世界也有,比如說棒球比分差太多就派野手上去投
05/28 15:36, 15F

05/28 15:37, , 16F
這時就只求結束比賽,不會想再去縮小分差了. 俗稱垃圾時間
05/28 15:37, 16F

05/28 15:42, , 17F
總之,你想要怎樣的行為,就採用相應的目標函數,並且把各種
05/28 15:42, 17F

05/28 15:43, , 18F
極端狀況該如何處理放入訓練資料,練出來的才會是你想要的
05/28 15:43, 18F

05/28 15:45, , 19F
現在就是他的訓練目標是A,你說他B的時候不行,改變的方法
05/28 15:45, 19F

05/28 15:47, , 20F
是把訓練目標改成f(A,B), 一個綜合考慮A跟B的函數
05/28 15:47, 20F
目前的條件應該只有贏,但不去教AI如何贏,讓AI自行學習 先確定這個條件能正常發揮,才能增加後續條件吧 畢竟增加一個條件,學習複雜度可能就會加倍...

05/28 15:47, , 21F
如果能自始至終,完全鬥狠,不下緩著的阿法狗,會精彩
05/28 15:47, 21F

05/28 15:47, , 22F
許多!
05/28 15:47, 22F
※ 編輯: devidevi (119.77.194.227), 05/28/2017 15:53:23

05/28 15:58, , 23F
AI互下的譜很多都很狠,互相殺龍XD
05/28 15:58, 23F

05/28 15:59, , 24F
你怎麼不懂...人家目標就是贏,你又要人家少輸
05/28 15:59, 24F

05/28 16:00, , 25F
減少損失又不等於創造贏的機會
05/28 16:00, 25F
如果現在自動駕駛AI,正常運作時沒問題, 但是有突發狀況發生時(旁邊有路人衝過來),不會踩煞車, 反而踩油門,你認為這AI是好AI嗎??? ※ 編輯: devidevi (119.77.194.227), 05/28/2017 16:04:04

05/28 16:06, , 26F
那樣代表你程式沒寫好,回去重寫,AI沒有好壞XD
05/28 16:06, 26F

05/28 16:12, , 27F
為啥跳到討論自動駕駛拉= = 到時候AI學習又是別的方法拉
05/28 16:12, 27F

05/28 16:13, , 28F
事實就是AI圍棋已經無敵 以後開發出的自動駕駛也會比人
05/28 16:13, 28F

05/28 16:13, , 29F
自己開安全
05/28 16:13, 29F

05/28 16:19, , 30F
歹稍微瞭解一點深度學習是什麼…
05/28 16:19, 30F

05/28 16:20, , 31F
自動駕駛來說你在訓練階段就要加入突發事件讓他學啊
05/28 16:20, 31F

05/28 16:29, , 32F
感覺一直在鬼打牆,又沒人說AG要去開車,AG也不是唯一的AI
05/28 16:29, 32F

05/28 16:32, , 33F
把目標函數換一換行為就會差很多,一直拿AG的行為去推演幹嘛?
05/28 16:32, 33F

05/28 16:46, , 34F
等著看阿爾法AI學打星海,那才是自駕這樣不完全訊息的類比
05/28 16:46, 34F

05/28 16:47, , 35F
至於拿圍棋訓練的AI比自駕根本不能類比
05/28 16:47, 35F

05/28 16:59, , 36F
用想像的你要不要去看一下網頁
05/28 16:59, 36F

05/28 17:00, , 37F

05/28 17:00, , 38F
實際上路測試就是在train. 理論上只要樣本數夠
05/28 17:00, 38F

05/28 17:01, , 39F
你想像得到的狀況都會在裡面
05/28 17:01, 39F

05/28 17:03, , 40F
另外還有一些其他的專利goo.gl/5xQrxX
05/28 17:03, 40F

05/28 17:04, , 41F
真實上路前鐵定train了一般人一輩子都達不到的里程數
05/28 17:04, 41F

05/28 17:04, , 42F
如果還有發生無法處理的情況(飛機掉下來之類的)
05/28 17:04, 42F

05/28 17:05, , 43F
我跟你說AI處理不來的人只會更差....
05/28 17:05, 43F

05/28 17:05, , 44F
反正你要比出事率的話, 自動駕駛的出事率絕對比人低的
05/28 17:05, 44F

05/28 17:06, , 45F
多, 你來矽谷待久一點, 就可以看到無人車開來開去
05/28 17:06, 45F

05/28 17:07, , 46F
看到無人車比看到美國三寶開車令人安心多了
05/28 17:07, 46F

05/28 17:09, , 47F
你知道AG要拿去作什麼了?
05/28 17:09, 47F

05/28 17:18, , 48F
自動駕駛就是目標函數的複雜度更高啊,你一直拿圍棋的目標
05/28 17:18, 48F

05/28 17:18, , 49F
函數訓練出來的結果談自動駕駛根本就錯置
05/28 17:18, 49F

05/28 17:19, , 50F
圍棋的目標函數本來就不包括意外處理的部分,當然不會有意
05/28 17:19, 50F

05/28 17:20, , 51F
外處理的表現
05/28 17:20, 51F

05/28 17:21, , 52F
AlphaGo表現好確實不能表示100%轉為自動駕駛的目標函數後
05/28 17:21, 52F

05/28 17:22, , 53F
一定也可以訓練到同等級好,但反之在AlphaGo上出現的缺點
05/28 17:22, 53F

05/28 17:22, , 54F
(事實上在圍棋來說甚至不算缺點)也同樣並不會保證在改變
05/28 17:22, 54F

05/28 17:23, , 55F
為自動駕駛的目標函數後還會出現
05/28 17:23, 55F

05/28 17:28, , 56F
自動駕駛比圍棋....
05/28 17:28, 56F

05/28 17:29, , 57F
圍棋能開圖,自動駕駛能嗎?
05/28 17:29, 57F

05/28 17:31, , 58F
deepmind目前想走的是醫療和星海爭霸哦
05/28 17:31, 58F

05/28 17:37, , 59F
Starcraft 2那個也只是過程而已,跟圍棋一樣是驗證學習能
05/28 17:37, 59F

05/28 17:37, , 60F
力以及宣傳居多
05/28 17:37, 60F

05/28 18:37, , 61F
沒錯阿 AG的確有這個缺陷 所以人工智慧還可以進步很多
05/28 18:37, 61F

05/28 21:47, , 62F
噓 勝負分類問題 跟 輸贏目數回歸問題 完全不一樣 懂?
05/28 21:47, 62F

05/28 23:40, , 63F
SC2 之所以值得試是因為不完全公開資訊遊戲在電腦看起來難
05/28 23:40, 63F

05/28 23:41, , 64F
度很高 我們覺得SC2比圍棋簡單是我們的「設計」理念跟電腦
05/28 23:41, 64F

05/28 23:41, , 65F
不同...
05/28 23:41, 65F

05/29 03:01, , 66F
輸得少但絕對不會贏的步為啥要去下,就事論事
05/29 03:01, 66F

05/29 12:27, , 67F
輸了就直接認輸了吧,盤面差很多還繼續下??
05/29 12:27, 67F
文章代碼(AID): #1PAdUZ6h (GO)
討論串 (同標題文章)
文章代碼(AID): #1PAdUZ6h (GO)