Re: [問題] 遊戲的運氣成份
※ 引述《nahsnib (悟)》之銘言:
: 關於猜拳到底是不是運氣問題,我想可以引用賽局理論(雖然我也沒修過)
: 舉例而言:
: 現在A與B都有攻擊與防禦兩種選擇,我們畫個表格來表示其結果:
: A\B 攻 防
: 攻 A得2分 B得1分
: 防 B得1分 A得1分
: 我們可以很簡單的分析,對A而言攻擊的效果大於防禦的效果。
: 如果這是個比較分數差距的狀況,那麼我們可以稍微改寫一下表格:
: A\B 攻 防
: 攻 A得3分 XX
: 防 XX A得2分
: 這麼看來,對A來說應該要以3/5的機率選擇攻擊,2/5的機率選擇防禦比較恰當,
: (上面這段不太確定,還請實際有學過賽局的人表示一下)
這邊是錯的!
納許平衡是一個保守的策略,他的核心是:
我使用這個策略,不論對手使用什麼策略來應對,"對手的收益"都是一樣的
A\B 攻 守
攻 2\0 0\1
守 0\1 1\0
這個表格表示雙分策略組合的得分
我們先用直覺想一下,如果你是B,你知道A有較大的機率選攻擊(3/5),你會怎麼做?
一般正常人都知道應該要選防守,來讓自己得分的機會變大
你有3/5的機會得1分,2/5的機會得0分,顯然A這樣的策略是行不通的
如果A總是選擇防守,顯然B也應該要總是選擇攻擊,所以A的策略不能總是選擇防守
因此A要選擇防守和攻擊都有可能的"混合策略",讓B不會有"比較好"的決定
----------------------------------------------------------------------
A\B 攻 守
攻 2\0 0\1
守 0\1 1\0
以上大概念,以下實際的計算:
A的策略應該是要讓B無論選擇什麼策略,期望值都一樣。
假設A選擇攻擊的機率為x,防守的機率為1-x
則:
B選擇攻擊的期望值=B選擇防守的期望值
A攻B攻+A守B攻=A攻B守+A守B守
x*0+(1-x)*1=x*1+(1-x)*0
x=1/2
A應該要選擇1/2攻擊、1/2防守,此時無論B選擇什麼策略都會得到1/2的期望值
相對的也可以分析B的策略,如果B也採用納許平衡的策略
假設B選擇攻擊的機率為y,防守的機率為1-y
則:
A選擇攻擊的期望值=A選擇防守的期望值
A攻B攻+A攻B守=A守B攻+A守B守
y*2+(1-y)*0=y*0+(1-y)*1
y=1/3
B應該要選擇1/3攻擊、2/3防守,此時無論A選擇什麼策略都會得到2/3的期望值
因此實際上,雙方都採用奈許的策略時:
16.7% A得2分
50% B得1分
33.3% A得1分
--------------------------------------------------------------------
這個賽局表格也可能會長下面的樣子,算起來完全不一樣:
A\B 攻 守
攻 2\-2 -1\1
守 -1\1 1\-1
這是個零和賽局
A應該選擇2/5攻擊、3/5防守,給予B -1/5的期望值,不論B做什麼決定
B應該選擇2/5攻擊、3/5防守,給予A 1/5的期望值,不論A做什麼決定
因此實際上,雙方都採用最保守的奈許的策略時,我們預測:
16% A得 2分,B得-2分
48% A得-1分,B得 1分
36% A得 1分,B得-1分
大家可以自己試著算算看
記住奈許均衡的策略核心是:
不論對手做什麼樣的策略決定,他的受益都是一樣的,即使他完完全全了解你的策略
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.214.35
※ 文章網址: http://www.ptt.cc/bbs/BoardGame/M.1405950718.A.1B5.html
※ 編輯: itisonlyform (140.114.214.35), 07/21/2014 21:54:06
推
07/21 21:55, , 1F
07/21 21:55, 1F
推
07/21 22:20, , 2F
07/21 22:20, 2F
推
07/21 22:53, , 3F
07/21 22:53, 3F
推
07/22 00:34, , 4F
07/22 00:34, 4F
推
07/22 14:30, , 5F
07/22 14:30, 5F
討論串 (同標題文章)
本文引述了以下文章的的內容:
問題
3
13
完整討論串 (本文為第 5 之 8 篇):
問題
0
7
問題
0
8
問題
4
8
問題
5
5
問題
3
13
問題
3
5
問題
2
3
問題
12
17