Re: [問題] alphago已經超越樹狀圖設者?已回收

看板C_Chat作者 (名無乚)時間9年前 (2016/03/11 11:46), 編輯推噓19(19030)
留言49則, 22人參與, 最新討論串3/5 (看更多)
在討論這個問題之前,我們先來看一段溫馨感人又熱血的動畫 https://www.youtube.com/watch?feature=player_embedded&v=Q4gTV4r0zRs
現在回到討論「樹狀圖設計者 vs AlphaGO」這個問題 我們先來重新定義「樹狀圖設計者」的能力 假設是以「小說中,對樹狀圖設計者的描速,來判斷出的處理的能力」 那「樹狀圖設計者」絕對大勝 因為樹狀圖設計者能做到的許多事情 真實世界的電腦做不到 但如果是以「小說中對樹狀圖設計者的描述」 「實際上使用暴力法解決問題。」 這就是一個很大的設計疏失。 即使是量子電腦,只用窮舉法也會變成垃圾的 說不定下個五子棋還會輸無敵CD67,因為窮舉運算超時敗 (沒限縮棋步的話,五子棋的計算量跟圍棋一樣是 (19*19)! 的層級) 在思考前,我們得先在腦袋中清楚的想好 我們思考的規則,倒底是該使用「和馬的邏輯」或是使用「真實世界的邏輯」 看來和馬在想「樹狀圖設計者」的時候 想的是「一台只靠演算能力,就能解決世界上所有問題的電腦」 但現實中的狀況是 人類是靠演算法解決問題,而不是依賴電腦的計算能力 電腦科學上,遇到的最大的問題是 「有些問題,我們沒辦法想出問題的計算法」 「有些來源資料,我們無法取得、整理、化簡為可使用的輸入資料」 「有些問題,被證明無解。」 在沒辦法想出更好的解決方法前,只能依賴最笨的列舉法去計算 這種狀況下,才會對演算能力有很誇張的需求 像是破解現代的密碼之類的,那種只能靠窮舉法解決,才會希望量子電腦出現 所以以現實下去做考慮的話 「一台只靠演算能力,就能解決世界上所有問題的樹狀圖設計者」 是不存在的 像天氣問題,即使電腦有足夠的運算能力,能對地球上所有空氣分子做模擬 請問:「該怎麼獲得地球上所有的空氣分子的動態?」 沒有可靠的輸入資料,電腦的計算能力再強,算出來的也只是垃圾 這就是來源資料的問題 所以「樹狀圖設計者能模擬所有空氣分子的動態」要成立 地球上得先要有「偵測所有空氣分子動態」的技術 想一想這是多可怕的技術,都能偵測所有空氣分子的狀態了 要偵測什麼其他的東西都不會太困難的 現在回到圍棋問題上 圍棋對電腦來說很難的原因是 AI下棋,大多是採用窮舉法加上評價公式的方式 去推斷最佳棋步 舉例來講,就是寫程式時,先寫個判斷現在上棋盤的形式好壞的公式 接著就是用暴力的方式,走個幾回合,再套用評價公式去計算好壞 這樣就能預估走下一步時,局勢的變化 當然,也可以直接把棋局走到玩,然後看誰輸誰贏 只是一般不會這樣做,因為即使是象棋之類的 要把棋局接下來的變化數量走玩,都是很驚人的運算量 玩家會等到抓狂 所以一般寫AI的程式,都會想辦法限縮思考的棋步 像是,人類在思考象棋棋步,不會去想第一步走帥的步數 但是沒限縮AI棋步的話,AI會去算 同樣的方式對圍棋行不通 圍棋的合法、有意義的步數太多 評價公式也不好寫 問對弈者為什麼下某步,很有可能回答你「直覺啊」之類的 有時候得到比較具體的答案,也是 「左邊有厚勢,所以我可以在這邊打入。」 「這邊覺得可能被切斷,所以我補那邊,順便威脅一下白棋角上的地」 這種模糊的東西 圍棋不應該是用運算量解決的問題 人在下圍棋時,其實是把棋盤上的棋切分成一個一個區塊 識別出特徵,然後用特徵去尋找相似的區塊 這跟人類的大腦的運作很有關係 人在接受外界的資訊時,會省略很多不重要的細節,挑出有意義的特徵 然後用特徵去做識別,再去思考 現在AlphaGO在做的就是這種事情 他會用特徵去從下過的棋做比對 這個在展現演算法的意味大於展現硬體能力的意味 _ 討論完這個問題之後 我們再回想一下一開始的動畫 硬體能力強,對運算速度很有幫助沒錯 假設有個計算要花一億年 如果硬體能力提昇一萬倍 那可以讓需要計算一億年的東西變成一萬年 節省了9999萬年 但演算法的影響力 是可能把需要計算一億年的東西,變成固定幾秒內就可算完的公式解 -- 我... 我一點都不糟糕啦!>///< -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.227.87.115 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1457668015.A.2F4.html

03/11 11:55, , 1F
算一億年後結果算出來的結果是42
03/11 11:55, 1F

03/11 11:57, , 2F
人腦並不能去用暴力破解法去下
03/11 11:57, 2F

03/11 11:57, , 3F
所以阿法狗用了不同的方式 >>> 哪種下法最好?
03/11 11:57, 3F

03/11 11:58, , 4F
這跟人腦思考是很像的 而且比人腦思考更快更不會被情緒干擾
03/11 11:58, 4F

03/11 12:00, , 5F
現在AlphaGO用的就是類似人類的思考方式沒錯
03/11 12:00, 5F

03/11 12:02, , 6F
實際上人在下棋時,也會從個可能的棋路下去思考變化,所以
03/11 12:02, 6F

03/11 12:03, , 7F
人本質上也會使用暴力法,只是,人多了「排除無意義棋路」
03/11 12:03, 7F

03/11 12:04, , 8F
的能力,以前AI做不到,現在AI做到了
03/11 12:04, 8F

03/11 12:12, , 9F
這個動畫6
03/11 12:12, 9F

03/11 12:18, , 10F
我只覺得把超級電腦射上去 還不能維修 實在有點微妙
03/11 12:18, 10F

03/11 12:19, , 11F
您資訊系?
03/11 12:19, 11F

03/11 12:22, , 12F
很多電腦都是開好幾年沒在管的
03/11 12:22, 12F

03/11 12:25, , 13F
那麼強的運算能力,隨便丟給它簡單一點的演算法就贏
03/11 12:25, 13F

03/11 12:25, , 14F
alphago了
03/11 12:25, 14F

03/11 12:35, , 15F
只好再婊一次和馬理科不及格又愛寫了
03/11 12:35, 15F

03/11 12:38, , 16F
因為和馬上課都在寫小說
03/11 12:38, 16F

03/11 12:42, , 17F
圍棋可不是簡單的演算法就能解決的...
03/11 12:42, 17F

03/11 12:48, , 18F
很多演算法不行是因為建立在我們沒有那麼強的演算能力
03/11 12:48, 18F

03/11 13:00, , 19F
兩台電腦放不同的演算法還是有差,因為演算法可以決
03/11 13:00, 19F

03/11 13:01, , 20F
定計算量。很多問題的計算量隨著問題的規模階乘式成
03/11 13:01, 20F

03/11 13:03, , 21F
長,問題夠大的時候,好壞計算法造成的鴻溝可能就沒
03/11 13:03, 21F

03/11 13:04, , 22F
有辦法用計算速度的大小差異來彌補。
03/11 13:04, 22F

03/11 13:06, , 23F
棋盤的格子越少,演算法相對於計算速度的重要就會越
03/11 13:06, 23F

03/11 13:06, , 24F
不明顯吧?
03/11 13:06, 24F

03/11 13:07, , 25F
河馬的科技、科學知識本來就很差
03/11 13:07, 25F

03/11 13:11, , 26F
我會這樣說,主要是建立在格子固定下拉
03/11 13:11, 26F

03/11 13:20, , 27F
目前AlphaGO大致用了三招 : 卷積神經網路、蒙地卡羅搜尋樹、
03/11 13:20, 27F

03/11 13:20, , 28F
、自我互搏(練蠱)
03/11 13:20, 28F

03/11 13:21, , 29F
根本來說這種討論是條條大道通往死巷。因為樹狀圖的
03/11 13:21, 29F

03/11 13:21, , 30F
計算能力可以隨便喊,要多大有多大。
03/11 13:21, 30F

03/11 13:21, , 31F
卷機神經網路是透過輸入天然樣本,訓練出類似人類高手的策略
03/11 13:21, 31F

03/11 13:22, , 32F
函數P_human
03/11 13:22, 32F

03/11 13:22, , 33F
這招大概只有業餘六段水準
03/11 13:22, 33F

03/11 13:23, , 34F
首先秀出100單位。出問題的時候再說其實有1000單位。
03/11 13:23, 34F

03/11 13:24, , 35F
把圍棋棋盤縮小可以看出AG甚麼端倪嗎?
03/11 13:24, 35F

03/11 13:24, , 36F
MCTS(蒙地)則是透過窮舉推演走到完,想像10萬盤棋後才走一步
03/11 13:24, 36F

03/11 13:25, , 37F
討論的過程也許比原本的問題有沒有答案更重要...
03/11 13:25, 37F

03/11 13:28, , 38F
最後一招練蠱則是找出每一個棋局時每一下法的評價函數
03/11 13:28, 38F

03/11 13:28, , 39F
這是靠自我對弈進化,一天有三千萬盤棋局
03/11 13:28, 39F

03/11 13:29, , 40F
結合P_human()、MCTS、評價函數v()才誕生AlphaGO
03/11 13:29, 40F

03/11 13:35, , 41F
おねーさーーーーーーーーーーーん!!!
03/11 13:35, 41F

03/11 13:58, , 42F
講了一堆其實甚麼都沒說的典範...
03/11 13:58, 42F

03/11 14:44, , 43F
叫樹狀圖算算圓周率 它可能就鎖死在那邊沒辦法做其他事了
03/11 14:44, 43F

03/11 14:45, , 44F
說實在話 有能力精準預測天氣 也代表可以操縱天氣
03/11 14:45, 44F

03/11 16:19, , 45F
請問一下,業餘和職業的段數大概怎麼比較?
03/11 16:19, 45F

03/11 17:23, , 46F
業餘的4段大約是職業1段這樣,但這非常不一定。
03/11 17:23, 46F

03/11 17:47, , 47F
這邊有人有整理阿法狗論文 https://goo.gl/S635W8
03/11 17:47, 47F

03/12 03:20, , 48F
暴力法:總共有<n=19>n^2(n^2-1)(n^2-2)毽毽毽毽(n^
03/12 03:20, 48F

03/13 09:41, , 49F
樓樓樓上,你要不要查一下...
03/13 09:41, 49F
文章代碼(AID): #1MuZ-lBq (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1MuZ-lBq (C_Chat)