[閒聊] ⓝ爆打——到底強在哪裡?(上)

看板MJ_JP作者 ( )時間6年前 (2017/08/09 15:03), 6年前編輯推噓6(600)
留言6則, 5人參與, 最新討論串1/1
ⓝ爆打,是一隻長居於特上的天鳳AI, 是由日本東京大學鶴岡實驗室所研發出來的日本麻雀機器人。 現役七段,最高曾經到達九段, 有著十分耀眼的成績,也無疑是現役最強的日麻AI。 天鳳官方曾經舉辦了爆打與鳳桌民的對決,甚至被說是【AIの黒船到来】 https://t.co/M8Y5AaRMj0 由於ⓝ爆打的每一份牌譜都會由官方推特公開給大眾, https://twitter.com/ai_mahjong 並且隨著牌譜公佈一個.csv檔(比較早期是.txt檔) 可以讓我們可以從人類的角度,一窺AI背後的「思路」。 這個粉絲專頁會一些篇幅,以人類的角度來解析ⓝ爆打是怎麼打牌的, 更精確的說ⓝ爆打背後的原理 。 (畢竟我想大部分版眾對它「物理上」怎麼打牌應該沒太大興趣) ⓝ爆打打牌時,總共有兩種模式。 首先先來介紹第一種模式,個人命名為「一般mode」 「一般mode」有兩個功能: 第一個功能是依照牌效率及打點,對捨出每一張手牌後牌姿評分[1] 並且決定分數最高的牌打出。 http://imgur.com/a/FLinN 比如說這個配牌,在ⓝ爆打開啟「一般mode」時是長這樣: http://imgur.com/a/Hubdw 因此依照分數ⓝ爆打決定打出【南】 第二個功能是判斷他家聽牌的機率[2],如果他家聽牌的機率超過某個門檻, 或是到達某些條件,它就會開啟第二個模式。 至於第二個模式的內容,那就容我賣個關子,留到下一篇跟大家說明 無論是牌效判斷或是讀取他家聽牌的氣息,ⓝ爆打有十分接近鳳桌玩家的實力。 [1] 這個是利用 感知器,並使用鳳桌的公開牌譜訓練做到的。 [2] 這個是利用羅吉斯回歸,並使用鳳桌的公開牌譜訓練做到的。 -- 本文同步發布於 料料的日麻非日常工作坊 https://www.facebook.com/RyaoJMJWorkshop/ 歡迎參觀~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.43.170.195 ※ 文章網址: https://www.ptt.cc/bbs/MJ_JP/M.1502262181.A.270.html

08/09 15:38, , 1F
推推
08/09 15:38, 1F

08/09 17:26, , 2F
08/09 17:26, 2F

08/09 18:14, , 3F
好奇"讀取他家聽牌的氣息"是怎麼做到的 也是餵牌譜嗎?
08/09 18:14, 3F
先給個懶人的答案:是的,餵牌譜以羅吉斯回歸建模。 以下是複雜的答案: 計算他家聽牌的機率,基本上可以以二分類問題解決(聽牌/沒聽) 而二分類問題已經是機器學習中十分成熟、並且應用在許多領域 ex: 垃圾信/非垃圾信; 銀行決定是否放貸; 爆打的製作團隊,將鳳凰桌每一個半莊中的每一局 、每一個玩家打出的每一手 作為一個訓練樣本 並且抓取每一個樣本的各種特徵 作為變數向量。 以下面這張表來舉個例子: 副露數 是否切ドラ 手切次數 是否聽牌 3     N    6     Y 2     Y      2 Y  0     N     13    N  3     Y      7    Y 1     Y     10    N   爆打就可以利用這張大表來進行訓練,來找出一定的準則。 只是這張表沒我列的這麼小,依照爆打的原始論文 判斷是否聽牌的變數總共有6,888個,而且樣本數高達1.77 x10^7個。 至於預測結果好不好嘛.. プレイヤ AUC (<-ROC曲線下面積 越高越好的標準就是了) 上級者(鳳民) 0.778 分類器 0.777 是十分的接近鳳桌居民 (至於羅吉斯回歸是什麼,wiki有寫,我就不寫了XD) 希望這些回答有回應到你,順帶一提 影響是否聽牌的最關鍵因素之一是「如果某家立直了,則必然聽牌」 ※ 編輯: weijer0905 (115.43.170.195), 08/10/2017 01:37:02

08/10 11:43, , 4F
感謝 變數的數量真是驚人 期待下集
08/10 11:43, 4F

08/10 12:39, , 5F
專業用心文大推~感覺會是很好的學習材料,期待後續XD
08/10 12:39, 5F

08/13 17:11, , 6F
接近7K個維度 應該不是人工列的吧? 太驚人了
08/13 17:11, 6F
文章代碼(AID): #1PYhEb9m (MJ_JP)