Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
完全ベイズ均衡
チェーンストア・パラドックス
1 から n の待ちに店を持つチェーンストアがある
各町 i には潜在的競争者いて,参入の機会をうかがっている
参入は i=1 から始まり,その結果を見て i=2,その結果を見て i=3,・・・と続く
どの参入者もチェーンストアの反応を考慮する
チェーンストアのオーナーはそれらの参入を阻止したいと思っている
n=2のケース
I11
IC1
I21
IC2
I22
IC3
I23
IC4
1, 2, C
(-1, -1, 2)
(-1, 1, 0)
(-1, -3, -1)
(1, -1, 0)
(1, 1, -2)
(1, -3, -3)
(-3, -1, -1)
(-3, 1, -3)
(-3, -3, -4)
参入容認
参入
参入
参入
対抗容認
容認
容認
対抗
対抗
対抗
参入しない
参入しない
サブゲーム完全均衡
どの参入者も参入し,オーナーは常に容認する
n が大きいとき,これは合理的な行動ではない
参入を阻止したいオーナーは,初期の段階ではあえて参入に抵抗し続け,手強い相手であることを後の参入者に知らしめるのが合理的
名声効果・デモンストレーション効果
ある程度の不確実性が必要
ローゼンタールのムカデ
左端プレイヤー1の手番がゲームの始点
各プレイヤーは下または右を選ぶ
一番最後では,プレーヤー2は下を選ぶ
その前の手番でプレイヤー1は下を選ぶ
1
(0, 0)
2
(-1, 3)
1
(8, 8)
2
(7, 11)
1
(6, 6)
2
(5, 9)
1
(4, 4)
2
(3, 7)
1
(2, 2)
2
(1, 5)
(10, 10)
サブゲーム完全均衡
どの手番に到達したとしても,そこでゲームをストップさせる
ゲームをストップさせずにある手番に到達したプレーヤーたちが,どのような理由でそこでストップさせることを思いつくか
不完備情報の完備化
チェーンストアの利得は共有知識ではない
情報の不完備をモデルに取り込む
チェーンストアのタイプ
強いチェーンストア(SC),弱いチェーンストア(WC)
それぞれに対する参入阻止ゲーム
参入者はある確率πで相手はSC,残りの1-π
の確率でWCであるという先見的予想を持つ
(-1, 1)
(1, -2)
(-3, -1)
参入しない
参入
容認
対抗
強いチェーンストアSC
SC
Ii1
(-1, 1)
(1, -1)
(-3, -2)
参入しない
参入
容認
対抗
弱いチェーンストアWC
WC
Ii1
完全ベイズ均衡
サラ金ゲーム
サラ金業者と客の間のゲーム
契約どおりに借金を返す良い客GC
借金を踏み倒す悪い客BC
ゲームの進行
自然が確率分布[π;1-π]でGCかBCかを決定
業者Dの信念[θ;1-θ]
Dは客について確率θでGC,1-θでBCと考える
0≦x≦2
(1, 1)
(0, 0)
(1-x, -2+x)
自然
(-1, -1)
GC
BC
π
アウト
1-π
貸す
イン1-θ
θ
β
αイン
貸す
貸さない
貸さない
アウト
D
(-1, 1)
(0, 0)
C D
サラ金ゲーム:基本形
事前(先験)確率と事後確率
客の行動戦略
《GCならばイン;BCならばアウト》
→ 業者Dは店に来た客が確実にGCであることを知っている
→ 店に来たという条件の下で,その客がGCである確率は1
Dの信念は,客のこの戦略の下ではθ=1を満たす(事後確率,条件付確率)
自然がGCを選ぶ確率=事前(先験)確率
客の行動戦略
《GCならば確率pでイン,1-pでアウト;BCならば確率qでイン,1-qでアウト》
→ 業者Dの信念
ベイズ・ルール
条件付確率を求める算法
qp
p
D -
)1(
に到達する確率
にいる確率
完全ベイズ均衡の定義
信念μとは,各情報集合 I に対して,その上の確率分布μ(I) を割り当てる関数
μ(I)(1)+・・・+μ(I)(kI)=1
μ(I)(1)≧0,・・・,μ(I)(kI)≧0
s:各プレイヤーの戦略の組
完全ベイズ均衡 (s;μ)
① sはμから計算されるナッシュ均衡である
② μは s の下で到達する手番ではベイズ・ルールを満たす
サラ金ゲームの均衡分析(分離均衡)
x=2
客の行動戦略: 《GCならばイン;BCならばアウト》
業者Dの最適反応 手番Dでは,μ(D)(α)=θ=1より期待利得は
《貸す》: 1×1+0×0=1
《貸さない》: 1×(-1)+0×1=-1
よって,Dの最適反応は《貸す》
Dが《貸す》を選ぶとき,GCにとってインが最適反応,BCにとってアウトが最適反応
信念μはベイズ・ルールでμ(D)(α)=1と求められる
(《GCならばイン;BCならばアウト》,《貸す》;μ)は完全ベイズ均衡
(1, 1)
(0, 0)
(-1, 0)
自然
(-1, -1)
GC
BC
π
アウト
1-π
貸す
イン
θ=1
β
αイン
貸す
貸さない
貸さない
アウト
D
(-1, 1)
(0, 0)
C D
サラ金ゲーム:分離均衡(x=2)
一括均衡(客が来ない) x=0
客の行動戦略: 《GCならばアウト;BCならばアウト》 業者Dの最適反応
手番Dでは,μ(D)(α)=θ<3/5 より期待利得は《貸す》: θ×1+(1-θ)×(-2)=3θ-2<-1/5
《貸さない》:θ×(-1)+(1-θ)×1=1-2θ>-1/5
よって,Dの最適反応は《貸さない》
Dが《貸さない》を選ぶとき,GCにとってアウトが最適反応,BCにとってアウトが最適反応
このとき手番Dには到達しないので何でも最適反応 信念μはベイズ・ルールでμ(D)(α)<3/5
(《GCならばアウト;BCならばアウト》,《貸さない》;μ)は完全ベイズ均衡,ただしμ(D)(α)<3/5
(1, 1)
(0, 0)
(1, -2)
自然
(-1, -1)
GC
BC
π
アウト
1-π
貸す
イン β
αイン
貸す
貸さない
貸さない
アウト
D
(-1, 1)
(0, 0)
C D
サラ金ゲーム:一括均衡(x=0)
5
3
一括均衡(客が来る) x=0
客の行動戦略: 《GCならばイン;BCならばイン》
業者Dの最適反応 手番Dでは,μ(D)(α)=θ>3/5 とする.期待利得は
《貸す》: θ×1+(1-θ)×(-2)=3θ-2>-1/5
《貸さない》:θ×(-1)+(1-θ)×1=1-2θ<-1/5
よって,Dの最適反応は《貸す》
Dが《貸す》を選ぶとき,GC,BCにとってインが最適反応
このとき手番Dに到達する
信念μはベイズ・ルールでμ(D)(α)= θ=π>3/5
(《GCならばイン;BCならばイン》,《貸す》;μ)は完全ベイズ均衡,ただしμ(D)(α)=π
(1, 1)
(0, 0)
(1, -2)
自然
(-1, -1)
GC
BC
アウト
貸す
インβ
αイン
貸す
貸さない
貸さない
アウト
D
(-1, 1)
(0, 0)
C D
サラ金ゲーム:一括均衡(x=0)
5
3
5
21 -
ベイズ・ルール(条件付確率)
しばしば信念は相手の行動を受けて事後的に更新されることがある
初期信念(initial belief)と事後的信念(posterior
belief)
事前確率と事後確率
信念の更新はベイズ・ルールに従う
ベイズ・ルールって何?
ベイズ・ルール(条件付確率)
Pr(A|X)
Pr(A) Pr(X|A)
=
Pr(A) Pr(X|A)+Pr(~A) Pr(X|~A)
Pr(A|X)・・・事象Xが起きた場合に状態Aが生じる確率
~A・・・A以外の状態(B,C,D,…)
ベイズ・ルール(条件付確率)
例えば・・・
ある薬物検査は90%の確率で成功するが、10%の確率で失敗する(ex. 薬物を使用していないにもかかわらず陽性反応)
選手の10%が薬物を使用している
このとき、陽性反応がでた選手のうち、実際に薬物を使用している確率はどれだけか?
つまり、Pr(薬物使用|陽性反応)は?
ベイズ・ルール(条件付確率)
Pr(使用|陽性)
Pr(使用) Pr(陽性|使用)
=
Pr(使用) Pr(陽性|使用)+Pr(非使用) Pr(陽性|非使用)
(0.1)(0.9)
= =0.5
(0.1)(0.9)+(0.9)(0.1)
陽性反応がでても、50%しか薬物を使用していない(検査の結果を安易に信用してはならない)
方法論(夏期集中)セミナー参加者の皆さんへ
8月4日~6日(2時限~4時限+α)
参加予定者はメールして下さい
2回の報告を義務づけます
各自の研究テーマに沿った論文の報告
それを発展させたオリジナルなモデルの報告
研究領域は問いません
報告論文を7月28日までにPDFファイルで送って下さい
(-2, 1)
(1, -2)
(1, -1)
y1
I11
I21
x1
x2
y2
(-1, 1)
(1, -2)
(-3, -1)
y1
I11
I21
x1
x2
y2
サブゲーム完全均衡:練習問題
次のようなゲームツリーが与えられたとき,サブゲーム完全均衡を求めなさい
(1) (2)
(-2, 1)
(1, -2)
(1, -1)
y1
I11
I21
x1
x2
y2
(-1, 1)
(1, -2)
(-3, -1)
y1
I11
I21
x1
x2
y2
サブゲーム完全均衡:練習問題
次のようなゲームツリーが与えられたとき,サブゲーム完全均衡を求めなさい
(1) (2)
(2, 1)
(1, -2)
(-3, -1)
y1
I11
I21
x1
x2
y2
(-1, 2)
(1, 1)
(3, -1)
y1
I11
I21
x1
x2
y2
(3) (4)
(2, 1)
(1, -2)
(-3, -1)
y1
I11
I21
x1
x2
y2
(-1, 2)
(1, 1)
(3, -1)
y1
I11
I21
x1
x2
y2
(3) (4)
(-1, 1)
(1, -2)
(3, -1)
I11
(1, 2)I21
I22
x1
x21
y1
y21
y22
x22
(-1, 1)
(2, -2)
(-3, -1)
I11
(1, -2)I21
I22
x1
x21
y1
y21
y22
x22
(5) (6)
(-1, 1)
(1, -2)
(3, -1)
I11
(1, 2)I21
I22
x1
x21
y1
y21
y22
x22
(-1, 1)
(2, -2)
(-3, -1)
I11
(1, -2)I21
I22
x1
x21
y1
y21
y22
x22
(5) (6)
(-1, 1)
(3, 2)
(-3, 1)
I11
(1, -2)I21
I22
x1
x21
y1
y21
y22
x22
(-1, 1)
(0, -1)
(2, -3)
I11
(1, 2)I21
I22
x1
x21
y1
y21
y22
x22
(7) (8)
(-1, 1)
(3, 2)
(-3, 1)
I11
(1, -2)I21
I22
x1
x21
y1
y21
y22
x22
(-1, 1)
(0, -1)
(2, -3)
I11
(1, 2)I21
I22
x1
x21
y1
y21
y22
x22
(7) (8)
(0, 0)
(1, 3)
(2, 2)
I1
(3, 1)
I2
x1
x2
y1
y2
y2
x2
(0, 0)
(-1, 3)
(2, 2)
I1
(3, -1)
I2
x1
x2
y1
y2
y2
x2
(9) (10)
(0, 0)
(1, 3)
(2, 2)
I1
(3, 1)
I2
x1
x2
y1
y2
y2
x2
(0, 0)
(-1, 3)
(2, 2)
I1
(3, -1)
I2
x1
x2
y1
y2
y2
x2
(9) (10)
(4, 4)
(3, 1)
(2, 2)
I1
(1, 3)
I2
x1
x2
y1
y2
y2
x2
(0, 0)
(1, 2)
(0, 0)
I1
(2, 1)
I2
x1
x2
y1
y2
y2
x2
(11) (12)
(4, 4)
(3, 1)
(2, 2)
I1
(1, 3)
I2
x1
x2
y1
y2
y2
x2
(0, 0)
(1, 2)
(0, 0)
I1
(2, 1)
I2
x1
x2
y1
y2
y2
x2
(11) (12)
(2, 2)
(1, 3)
(5, 4)
I12
(6, 1)I21
I22
x12
x21
y12
y21
y22
x22
(3, 0)
I11
x11
y11
(13)
(2, 2)
(1, 3)
(5, 4)
I12
(6, 1)I21
I22
x12
x21
y12
y21
y22
x22
(3, 0)
I11
x11
y11
(13)
(2, 2)
(1, 3)
(5, 4)
I12
(6, 1)
I21
x12
x2
y12
y2
y2
x2
(3, 0)
I11
x11
y11
(14)
(2, 2)
(1, 3)
(5, 4)
I12
(6, 1)
I21
x12
x2
y12
y2
y2
x2
(3, 0)
I11
x11
y11
(14)
(3, 3)
(2, 7)
(3, 4)
I12
(4, 0)
I21
x12
x2
y12
y2
y2
x2
(4, 0)
I11
x11
y11
(15)
(7, 2)
(6, 9)
z2
z2
(3, 3)
(2, 7)
(3, 4)
I12
(4, 0)
I21
x12
x2
y12
y2
y2
x2
(4, 0)
I11
x11
y11
(15)
(7, 2)
(6, 9)
z2
z2
(-1, 0)
(0, 1)
(1, 0)
I12
(0, 4)
I22
z1
z2
w1
w2
w2
z2
I11
(16)
(1, 3)
(-1, -1)
(2, 2)
I21
x1
x2
y1
y2
y2
x2
(-1, 0)
(0, 1)
(1, 0)
I12
(0, 4)
I22
z1
z2
w1
w2
w2
z2
I11
(16)
(1, 3)
(-1, -1)
(2, 2)
I21
x1
x2
y1
y2
y2
x2
(2, 2)
(1, 3)
(6, 4)
I12
(8, 1)
I22
z1
z2
w1
w2
w2
z2
I11
(17) (12, 1)
(3, 5)I21
x1
x2
y1
y2
(2, 2)
(1, 3)
(6, 4)
I12
(8, 1)
I22
z1
z2
w1
w2
w2
z2
I11
(17) (12, 1)
(3, 5)I21
x1
x2
y1
y2
(1, 8)
(1, 0)
(1, 2)
I11
(7, 1)
I21
x1
x2
y1
y2
y2
x2
(2,
2)I12
z1
w1
(18)
(6, 0)
(5, 4)
z2
z2
(1, 8)
(1, 0)
(1, 2)
I11
(7, 1)
I21
x1
x2
y1
y2
y2
x2
(2, 2)
I12
z1
w1
(18)
(6, 0)
(5, 4)
z2
z2
(5, -5)
(-1, 1)
(3, -3)
I12
(-1, 1)
I21
x12
x2
y12
y2
y2
x2
(3, 2)
I11
x11
y11
(19)
(5, -5)
(-1, 1)
(3, -3)
I12
(-1, 1)
I21
x12
x2
y12
y2
y2
x2
(3, 2)
I11
x11
y11
(19)
(2, 2)
(1, 3)
(5, 4)
I11
(6, 1)
I21
x1
x2
y1
y2
y2
x2
(3, 0)z11
w11
(20)
(2, 2)
z12
w12
I12
I13
(2, 2)
(1, 3)
(5, 4)
I11
(6, 1)
I21
x1
x2
y1
y2
y2
x2
(3, 0)z11
w11
(20)
(2, 2)
z12
w12
I12
I13
完全ベイズ均衡:練習問題
次のようなゲームツリーが与えられたとき,完全ベイズ均衡を求めなさい
(1)
(1, 1)
(0, 0)
(-1, 0)
自然
(-1, -1)π
x1
1-π
x2
1-θ
θ
β
αy1
x2
y2
y2
(-1, 1)
(0, 0)I11
I12
I2
y1
x1
信念は,αの確率がθ,βの確率が1-θとなるものであるとする.
プレイヤー2の期待ペイオフを計算する.
x2: 1×θ+0×(1-θ)=θ
y2: (-1)×θ+1×(1-θ)=1-θ
(1) Eu2(x2)≧Eu2(y2) のケース
θ≧1-2θ ∴θ≧1/3
この場合,プレイヤー2はx2 をとる.
x2 に対するプレイヤー1の最適反応は(y1, x1), ただし(I11,I12) における戦略を表す.
(y1,x1) に整合的な信念はθ=1.θ≧1/3 と整合的
完全ベイズ均衡は((y1,x1),x2), θ=1
(2) Eu2(x2)<Eu2(y2) のケース
θ<1-2θ ∴θ<1/3
この場合,プレイヤー2はy2 をとる.
y2 に対するプレイヤー1の最適反応は(x1, x1), ただし(I11,I12) における戦略を表す.
情報集合I2 には到達しないので,(x1, x1) に整合的
な信念は0≦θ≦1 の任意のもの.すべての信念が矛盾しない.
よって,完全ベイズ均衡は
((x1, x1), y2), 0≦θ<1/3
注:ベイズ・ルールを満たす
θ[π×0+π×0]=π×0
(1, 1)
(0, 0)
(1, -2)
(-1, -1)
(-1, 1)
(0, 0)
1 2
(2)
自然
π
x1
1-π
x2
1-θ
θ
β
αy1
x2
y2
y2
I11
I12
I2
y1
x1
信念は,αの確率がθ,βの確率が1-θとなるものであるとする.
プレイヤー2の期待ペイオフを計算する.
x2: 1×θ+(-2)×(1-θ)=3θ-2
y2: (-1)×θ+1×(1-θ)=1-2θ
(1) Eu2(x2)≧Eu2(y2) のケース
3θ-2≧1-2θ ∴θ≧3/5
この場合,プレイヤー2はx2 をとる.
x2 に対するプレイヤー1の最適反応は(y1, y1), ただし(I11,I12) における戦略を表す.
(y1,y1) に整合的な信念はθ=π.
完全ベイズ均衡は((y1,y1),x2), θ=π≧3/5
(2) Eu2(x2)<Eu2(y2) のケース
1-2θ>3θ-2 ∴θ<3/5
この場合,プレイヤー2はy2 をとる.
y2 に対するプレイヤー1の最適反応は(x1, x1), ただし(I11,I12) における戦略を表す.
情報集合I2 には到達しないので,(x1, x1) に整合的な信念は0≦θ≦1 の任意のもの.すべての信念が矛盾しない.
よって,完全ベイズ均衡は
((x1, x1), y2), 0≦θ<3/5
注:ベイズ・ルールを満たす
θ[π×0+(1ーπ)×0]=π×0
(4, 2)
(4, 0)
(0, 10)
(0, 4)
(2, 0)
(2, 0)
1 2
(3)
自然
1/2
x1
1/2
x2
1-θ
θ
β
αy1
x2
y2
y2
I11
I12
I2
y1
x1
信念は,αの確率がθ,βの確率が1-θとなるものであるとする.
プレイヤー2の期待ペイオフを計算する.
x2: 2×θ+10×(1-θ)=10-8θ
y2: 4×θ+0×(1-θ)=4θ
(1) Eu2(x2)≧Eu2(y2) のケース
10-8θ≧4θ ∴θ≦5/6
この場合,プレイヤー2はx2 をとる.
x2 に対するプレイヤー1の最適反応は(y1, x1), ただし(I11,I12) における戦略を表す.
(y1,x1) に整合的な信念はθ=1.
これはθ≦5/6 に矛盾.よって,均衡ではない.
(2) Eu2(x2)≦Eu2(y2) のケース
10-8θ<4θ ∴θ>5/6
この場合,プレイヤー2はy2 をとる.
y2 に対するプレイヤー1の最適反応は(x1, x1), ただし(I11,I12) における戦略を表す.
情報集合I2 には到達しないので,(x1, x1) に整合的な信念は0≦θ≦1 の任意のもの.すべての信念が矛盾しない.
よって,完全ベイズ均衡は
((x1, x1), y2), 5/6<θ≦1
注:ベイズ・ルールを満たす
θ[(1/2)×0+(1/2)×0]=(1/2)×0