Re: [討論] 對電腦戰勝人類的看法

看板GO作者 (joy)時間7年前 (2016/10/29 23:21), 7年前編輯推噓10(11141)
留言53則, 13人參與, 最新討論串2/5 (看更多)
: 所有變化都被算完了 : 還會有棋士想研究圍棋嗎? - 雖然人類輸了電腦 但不代表圍棋的變化被算盡 算盡的話 每一手都會是固定的 - 人類輸在對電腦的未知 但電腦在職業顧問的幫助下 基本上對於人類算某種程度的已知 - 人機大戰過後 太少棋手去研究第四局電腦的失誤原因(root cause) 只知道google修正了這項錯誤 要擊敗電腦 就要從這個失誤開始研究 - 目前只知道電腦以獲勝為優先考量下出每一步 我比較想知道 若是電腦的每一步的判斷條件從獲勝改成贏最多 到底結果會變成怎樣 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.113.41 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1477754482.A.2DA.html

10/29 23:25, , 1F
獲勝跟贏最多應該是一樣的,圍棋不是每次用強就好
10/29 23:25, 1F

10/29 23:25, , 2F
而電腦是選擇自己計算中勝率最高的一手
10/29 23:25, 2F

10/29 23:26, , 3F
畢竟不可能全部算盡,因此當下贏最多是沒錯的
10/29 23:26, 3F
我的意思就是電腦要贏到最多目數 不去想獲勝 ※ 編輯: joy830 (118.233.113.41), 10/29/2016 23:30:31

10/30 00:08, , 4F
贏最多很難定義吧 30%贏20目 vs 80%贏10目 難道要選第一個
10/30 00:08, 4F

10/30 00:09, , 5F
對電腦來說這目標太不明確了,但你可以一開始目標15目
10/30 00:09, 5F

10/30 00:13, , 6F
為何棋手要去研究失誤的真正原因?他又不是RD
10/30 00:13, 6F

10/30 00:16, , 7F
另外,請問為何算盡,每一手就會固定?
10/30 00:16, 7F

10/30 00:23, , 8F
最後,如何說明人類是輸在對電腦的未知,而不是因為電腦的
10/30 00:23, 8F

10/30 00:23, , 9F
算路本來就更廣更準?
10/30 00:23, 9F

10/30 00:33, , 10F
問題是狗不敢出來下了 只有五盤人機棋譜 怎麼研究
10/30 00:33, 10F

10/30 00:42, , 11F
電腦下的每一手就是當下最多目的
10/30 00:42, 11F

10/30 00:43, , 12F
人類會覺得為什麼不下更強些,但電腦不懂
10/30 00:43, 12F

10/30 00:44, , 13F
我是怕有一天真的被電腦暴力破解算進路數的話,雖然大家
10/30 00:44, 13F

10/30 00:44, , 14F
贏到最多目本來就是電腦的目標吧
10/30 00:44, 14F

10/30 00:44, , 15F
會說不可能,甚麼圍棋的變化是10的多少次方之類的話,但
10/30 00:44, 15F

10/30 00:45, , 16F
換個角度想,對手的實力只能讓電腦盤面10目
10/30 00:45, 16F

10/30 00:45, , 17F
在幾年前,也沒有人相信電腦能贏人類吧?甚至還有人說要1
10/30 00:45, 17F

10/30 00:46, , 18F
所以贏最多這概念只在於人類,不在電腦
10/30 00:46, 18F

10/30 00:46, , 19F
要100年,科技進步太快,說不定我們會看到棋被破解的那天
10/30 00:46, 19F

10/30 01:40, , 20F
棋手沒辦法研究那個失誤吧...更何況連演算法都沒有
10/30 01:40, 20F

10/30 01:41, , 21F
根本無從探討那一手失誤是怎麼來的
10/30 01:41, 21F

10/30 01:58, , 22F
電腦下的不是當下最多目的啊 是以該棋步往下期望值最高
10/30 01:58, 22F

10/30 01:59, , 23F
但這期望值高的結果 來源有可能是因為這手棋很穩 以此為
10/30 01:59, 23F

10/30 01:59, , 24F
基礎往下幾乎都是贏棋 所以期望值高 但要贏到最多目的棋
10/30 01:59, 24F

10/30 02:00, , 25F
步其實不一定會在以這手棋為基礎的集合裡
10/30 02:00, 25F

10/30 04:47, , 26F
贏到最多和勝率最高(風險最低)絕對是兩回事
10/30 04:47, 26F

10/30 07:54, , 27F
而且圍棋規則裡又沒有“要贏到最多目”、“要窮盡所有變化
10/30 07:54, 27F

10/30 07:54, , 28F
”,為何電腦來下,就要被關切有沒有做到這兩點?前者明顯
10/30 07:54, 28F

10/30 07:54, , 29F
違背圍棋十訣裡的想法,後者如果有那種計算資源存在,程式
10/30 07:54, 29F

10/30 07:54, , 30F
寫起來根本小菜一碟,問題是有那種資源的話,圍棋一定不是
10/30 07:54, 30F

10/30 07:55, , 31F
第一個被拿來應用的領域,如同深度學習也是至少四年後才被
10/30 07:55, 31F

10/30 07:55, , 32F
電腦圍棋利用,那時你不如先擔心你的ptt帳號密碼被破解
10/30 07:55, 32F

10/30 14:39, , 33F
中國古棋就有贏最多和窮盡變化的觀念,雖然現在圍棋規
10/30 14:39, 33F

10/30 14:39, , 34F
則和理論不同了,我覺得還算是個有趣的方向
10/30 14:39, 34F

10/30 15:24, , 35F
那古人的結論具體來說是怎樣?還是所謂道可道非常道,不方
10/30 15:24, 35F

10/30 15:24, , 36F
便說得太清楚
10/30 15:24, 36F

10/30 16:04, , 37F
中國古棋怎樣窮盡變化的概念?我也很想聽具體的解說
10/30 16:04, 37F

10/30 16:06, , 38F
開賭盤啦我All in不了了之
10/30 16:06, 38F

10/30 16:44, , 39F
周東侯:局中義理之所在 務須推移盡變 若稍有餘蘊 必不能
10/30 16:44, 39F

10/30 16:45, , 40F
酣暢淋漓 高手以勝負泥於胸中 故往往中止
10/30 16:45, 40F

10/30 17:38, , 41F
翻譯米糕:對局中務必盡量細算,高手往往太拘泥於勝負,無
10/30 17:38, 41F

10/30 17:38, , 42F
關勝負處就不算,這樣很不舒服捏。
10/30 17:38, 42F

10/31 04:37, , 43F
其實「贏最多」真的跟「獲勝」不一樣喔。
10/31 04:37, 43F

10/31 04:40, , 44F
比如說某一手90%贏兩目半,另一手60%贏三目半,20%贏半目
10/31 04:40, 44F

10/31 04:42, , 45F
(或你也可以調成都是90%勝但目數分布不一樣就好),那麼
10/31 04:42, 45F

10/31 04:42, , 46F
應該選擇哪一手呢?
10/31 04:42, 46F

10/31 04:44, , 47F
這其中會微妙地牽扯到「值不值得為了多贏一目放棄1%勝率」
10/31 04:44, 47F

10/31 04:44, , 48F
或甚至「要不要因為有多贏一目的機會,但導致少贏一目的機
10/31 04:44, 48F

10/31 04:45, , 49F
率也上升了」,這都會造成評估函數有所變化,算出來的當前
10/31 04:45, 49F

10/31 04:45, , 50F
最佳解會因而改變,一點點的小變化就可能導致模型整體差異
10/31 04:45, 50F

10/31 04:45, , 51F
很大。
10/31 04:45, 51F

10/31 08:45, , 52F
t同意。當「獲勝」為目標,一旦勝率超過50%,就會導向儘
10/31 08:45, 52F

10/31 08:47, , 53F
快定型收束,把棋盤變小。如果想「贏最多」,會持續亂戰。
10/31 08:47, 53F
文章代碼(AID): #1O5BvoBQ (GO)
討論串 (同標題文章)
文章代碼(AID): #1O5BvoBQ (GO)