[閒聊] ⓝ爆打——到底強在哪裡?(上)
ⓝ爆打,是一隻長居於特上的天鳳AI,
是由日本東京大學鶴岡實驗室所研發出來的日本麻雀機器人。
現役七段,最高曾經到達九段,
有著十分耀眼的成績,也無疑是現役最強的日麻AI。
天鳳官方曾經舉辦了爆打與鳳桌民的對決,甚至被說是【AIの黒船到来】
https://t.co/M8Y5AaRMj0
由於ⓝ爆打的每一份牌譜都會由官方推特公開給大眾,
https://twitter.com/ai_mahjong
並且隨著牌譜公佈一個.csv檔(比較早期是.txt檔)
可以讓我們可以從人類的角度,一窺AI背後的「思路」。
這個粉絲專頁會一些篇幅,以人類的角度來解析ⓝ爆打是怎麼打牌的,
更精確的說ⓝ爆打背後的原理 。
(畢竟我想大部分版眾對它「物理上」怎麼打牌應該沒太大興趣)
ⓝ爆打打牌時,總共有兩種模式。
首先先來介紹第一種模式,個人命名為「一般mode」
「一般mode」有兩個功能:
第一個功能是依照牌效率及打點,對捨出每一張手牌後牌姿評分[1]
並且決定分數最高的牌打出。
http://imgur.com/a/FLinN
比如說這個配牌,在ⓝ爆打開啟「一般mode」時是長這樣:
http://imgur.com/a/Hubdw
因此依照分數ⓝ爆打決定打出【南】
第二個功能是判斷他家聽牌的機率[2],如果他家聽牌的機率超過某個門檻,
或是到達某些條件,它就會開啟第二個模式。
至於第二個模式的內容,那就容我賣個關子,留到下一篇跟大家說明
無論是牌效判斷或是讀取他家聽牌的氣息,ⓝ爆打有十分接近鳳桌玩家的實力。
[1] 這個是利用 感知器,並使用鳳桌的公開牌譜訓練做到的。
[2] 這個是利用羅吉斯回歸,並使用鳳桌的公開牌譜訓練做到的。
--
本文同步發布於
料料的日麻非日常工作坊
https://www.facebook.com/RyaoJMJWorkshop/
歡迎參觀~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.43.170.195
※ 文章網址: https://www.ptt.cc/bbs/MJ_JP/M.1502262181.A.270.html
推
08/09 15:38, , 1F
08/09 15:38, 1F
推
08/09 17:26, , 2F
08/09 17:26, 2F
推
08/09 18:14, , 3F
08/09 18:14, 3F
先給個懶人的答案:是的,餵牌譜以羅吉斯回歸建模。
以下是複雜的答案:
計算他家聽牌的機率,基本上可以以二分類問題解決(聽牌/沒聽)
而二分類問題已經是機器學習中十分成熟、並且應用在許多領域
ex: 垃圾信/非垃圾信; 銀行決定是否放貸;
爆打的製作團隊,將鳳凰桌每一個半莊中的每一局
、每一個玩家打出的每一手 作為一個訓練樣本
並且抓取每一個樣本的各種特徵 作為變數向量。
以下面這張表來舉個例子:
副露數 是否切ドラ 手切次數 是否聽牌
3 N 6 Y
2 Y 2 Y
0 N 13 N
3 Y 7 Y
1 Y 10 N
爆打就可以利用這張大表來進行訓練,來找出一定的準則。
只是這張表沒我列的這麼小,依照爆打的原始論文
判斷是否聽牌的變數總共有6,888個,而且樣本數高達1.77 x10^7個。
至於預測結果好不好嘛..
プレイヤ AUC (<-ROC曲線下面積 越高越好的標準就是了)
上級者(鳳民) 0.778
分類器 0.777
是十分的接近鳳桌居民
(至於羅吉斯回歸是什麼,wiki有寫,我就不寫了XD)
希望這些回答有回應到你,順帶一提
影響是否聽牌的最關鍵因素之一是「如果某家立直了,則必然聽牌」
※ 編輯: weijer0905 (115.43.170.195), 08/10/2017 01:37:02
推
08/10 11:43, , 4F
08/10 11:43, 4F
推
08/10 12:39, , 5F
08/10 12:39, 5F
推
08/13 17:11, , 6F
08/13 17:11, 6F