[新聞] 人工智慧戰勝四位頂級德州撲克選手

看板Tech_Job作者 (平凡是幸福)時間7年前 (2017/01/31 20:19), 編輯推噓10(1004)
留言14則, 14人參與, 最新討論串1/1
激戰二十天!人工智慧 Libratus 戰勝四位頂級德州撲克選手 https://www.inside.com.tw/2017/01/31/libratus 在賓州匹茲堡的 Rivers 賭場,卡耐基梅隆大學(CMU)開發的人工智慧系統 Libratus 戰勝四位德州撲克頂級選手,獲得最終勝利。 據官網介紹,此次由 4 名人類職業玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 對戰人工智慧程式 Libratus,賽程為 20 天,一共進行了 12 萬手牌的比賽 。 2015 年,CMU 曾組織了首場「大腦對抗人工智慧」賽事。在當時的賽事中,代表 CMU 出 戰的是另外一款人工智慧系統「Claudico」,同樣也有 4 名職業撲克玩家參加了比賽, 然而,Claudico 並未獲得最終勝利。 不過 CMU 認為,當時撲克職業玩家與 Claudico 僅進行了 8 萬手牌的比賽,就統計學角 度來講並無法證明人類職業撲克玩家或人工智慧具有優勢。這也是本輪巡迴賽中比賽的牌 局數量增加 50% 的原因。 德州撲克的玩法:每個玩家有 2 張牌作為「底牌」,同時還有 5 張公共牌。玩家選擇 5 張公共牌裡的 3 張,與手裡的 2 張底牌組合,最後以期得到最好的 5 張牌的組合。按 照「Card Ranking」決定最後的勝者。 由於對方的「底牌」是隱藏資訊,對於電腦來說,就是在處理一種「非完整資訊博弈」。 而圍棋對弈雙方的資訊是完整的、對稱的,並沒有隱藏的資訊。Libratus 此次戰勝頂級 人類德州撲克選手,具有非常重要的意義。 電腦正確決定,依賴於對方「底牌資訊」情況下的機率分佈,這種「底牌資訊」可以通過 對手過去的行為顯露出來。比如有時玩家採取「虛張聲勢」(Bluffing)的策略,對手有 時手裡並沒有強牌,但還是作出全額下注、志在必得的行為,電腦這時要根據對方過去的 博弈表現,來判斷對手有強牌的機率。 相應的,對手也會推斷我方的底牌資訊,所以這裡就是一個「遞歸推理」(recursive reasoning),一個玩家無法輕易推理博弈狀況。 繼圍棋和德州撲克之後,人工智慧的下一站會是哪個遊戲呢? ------ 開發者是不是已經在線上賭場賺飽了 所以才公開比賽??? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 182.234.133.46 ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1485865175.A.818.html

01/31 20:27, , 1F
所以是靠Bluffing嗎? 電腦不會Bluffing但是玩家會?
01/31 20:27, 1F

01/31 20:31, , 2F
這樣會不會搞到線上賭場沒人敢玩
01/31 20:31, 2F

01/31 20:35, , 3F
如果遊戲越簡單 電腦的優勢會不會越不明顯?
01/31 20:35, 3F

01/31 20:40, , 4F
例如井字遊戲嗎? 有把握不會輸給電腦XD
01/31 20:40, 4F
paulluopaull:轉錄至看板 Poker 01/31 20:46

01/31 20:46, , 5F
一開始拼機率 再來拼記憶力 最後拼耐久性 會輸很正常
01/31 20:46, 5F

01/31 20:53, , 6F
電腦不會吹牛沒錯 但電腦也不會被吹牛的人類騙啊
01/31 20:53, 6F

01/31 21:07, , 7F
我請我師父出來!各位觀眾!歡迎賭神!!!!!
01/31 21:07, 7F

01/31 21:52, , 8F
賭神變出一張三,AI算牌無法理解受刺激就自我毀滅了。
01/31 21:52, 8F

01/31 22:12, , 9F
這個小習慣是在過去2萬次牌局加上去的
01/31 22:12, 9F

01/31 22:42, , 10F
電腦分析 55%是2 38%是Q 7%是9
01/31 22:42, 10F

01/31 22:44, , 11F
沒有使用西德的最新液晶顯影隱形眼鏡?
01/31 22:44, 11F

02/01 11:34, , 12F
開一張2給他,讓他贏莊家 100塊。
02/01 11:34, 12F

02/01 11:37, , 13F
中國醫藥大學也會開發人工智慧哦
02/01 11:37, 13F

02/01 12:32, , 14F
德撲的複雜度相對於圍棋,差不多是螞蟻腦之於人類腦
02/01 12:32, 14F
文章代碼(AID): #1Oa83NWO (Tech_Job)