[請益] 關於圍棋
抱歉,本來想發在演算法版,但是那邊人實在太少了
關於圍棋
在第二盤結束的新聞稿中與盤中賽評講解一樣,都認為AlphaGo在中段下得很奇怪
柯潔認為,今天李世石輸棋是因為他下的不太好:AlphaGo下的很多棋都不是常理下的棋
,李世石也下的不是常理,很多我都看不懂
所以我猜想
人在圍棋的博奕過程中,假設新手是嬰兒,透過不斷的博奕與閱讀經典的棋譜,其神經元
突觸自然而然的產生了每一個落子後的最佳解(演算法)
所以高手們的落子的行為,即便因為策略不同,但是建立她們神經元突觸的社會是一致的
,所以他們的演算法應該不至於有太大的落差
柯潔之所以看不懂AlphaGo的棋路,正是因為它不是尋著一般情境成長的棋士
因此,我們假定AlphaGo的演算法不是聖杯,我只需等待其模型收斂,我在來求得它的
worst-case
在這樣的情形之下,我只需要背譜即可
可是真的這麼簡單嗎?想知道有什麼地方漏想了
--
「不需要讓青少年有判斷力和批判力。只要給他們汽車、摩托車、美麗的明星、刺激的音
樂、流行的服飾,以及對同伴的競爭意識就行了。剝奪青少年的思考力,根植他們服從指
導者命令的服從心才是上策。讓他們對批判國家、社會和指導者保持著一種動物般原始的
憎惡。讓他們深信那是少數派和異端者的罪惡。讓他們都有同樣的想法。讓他們認為想法
和大家不同的人就是國家的敵人……」
by 阿道夫·希特勒
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.29.27
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1457786427.A.2AC.html
→
03/12 20:45, , 1F
03/12 20:45, 1F
→
03/12 20:47, , 2F
03/12 20:47, 2F
→
03/12 20:48, , 3F
03/12 20:48, 3F
我在想的是19*19的棋面,必定會收斂,所以我如果用另一台電腦來求出對抗這樣棋路的最佳解呢?
就像當初IBM的深藍一樣,wiki中有記載到
"深藍在棋局之間曾被修改以符合卡斯巴羅夫的下棋風格,令電腦避免再陷入其曾兩次跌入
的陷阱"
→
03/12 20:50, , 4F
03/12 20:50, 4F
→
03/12 20:51, , 5F
03/12 20:51, 5F
→
03/12 20:52, , 6F
03/12 20:52, 6F
※ 編輯: e12518166339 (180.177.29.27), 03/12/2016 20:55:23
→
03/12 20:52, , 7F
03/12 20:52, 7F
→
03/12 20:53, , 8F
03/12 20:53, 8F
→
03/12 20:53, , 9F
03/12 20:53, 9F
→
03/12 20:55, , 10F
03/12 20:55, 10F
→
03/12 21:06, , 11F
03/12 21:06, 11F
→
03/12 21:06, , 12F
03/12 21:06, 12F
→
03/12 21:08, , 13F
03/12 21:08, 13F
→
03/12 21:26, , 14F
03/12 21:26, 14F
→
03/12 21:26, , 15F
03/12 21:26, 15F
推
03/12 22:12, , 16F
03/12 22:12, 16F
→
03/13 00:22, , 17F
03/13 00:22, 17F