完全ベイズ均衡 - Waseda University · チェーンストア・パラドックス 1 からn の待ちに店を持つチェーンストアがある各町i には潜在的競争者いて，参入の機会をう

完全ベイズ均衡

チェーンストア・パラドックス

1 から n の待ちに店を持つチェーンストアがある

各町 i には潜在的競争者いて，参入の機会をうかがっている

参入は i=1 から始まり，その結果を見て i=2，その結果を見て i=3，・・・と続く

どの参入者もチェーンストアの反応を考慮する

チェーンストアのオーナーはそれらの参入を阻止したいと思っている

n=2のケース

I11

IC1

I21

IC2

I22

IC3

I23

IC4

1, 2, C

(-1, -1, 2)

(-1, 1, 0)

(-1, -3, -1)

(1, -1, 0)

(1, 1, -2)

(1, -3, -3)

(-3, -1, -1)

(-3, 1, -3)

(-3, -3, -4)

参入容認

参入

参入

参入

対抗容認

容認

容認

対抗

対抗

対抗

参入しない

参入しない

サブゲーム完全均衡

どの参入者も参入し，オーナーは常に容認する

n が大きいとき，これは合理的な行動ではない

参入を阻止したいオーナーは，初期の段階ではあえて参入に抵抗し続け，手強い相手であることを後の参入者に知らしめるのが合理的

名声効果・デモンストレーション効果

ある程度の不確実性が必要

ローゼンタールのムカデ

左端プレイヤー1の手番がゲームの始点

各プレイヤーは下または右を選ぶ

一番最後では，プレーヤー2は下を選ぶ

その前の手番でプレイヤー1は下を選ぶ

1

(0, 0)

2

(-1, 3)

1

(8, 8)

2

(7, 11)

1

(6, 6)

2

(5, 9)

1

(4, 4)

2

(3, 7)

1

(2, 2)

2

(1, 5)

(10, 10)

サブゲーム完全均衡

どの手番に到達したとしても，そこでゲームをストップさせる

ゲームをストップさせずにある手番に到達したプレーヤーたちが，どのような理由でそこでストップさせることを思いつくか

不完備情報の完備化

チェーンストアの利得は共有知識ではない

情報の不完備をモデルに取り込む

チェーンストアのタイプ

強いチェーンストア(SC)，弱いチェーンストア(WC)

それぞれに対する参入阻止ゲーム

参入者はある確率πで相手はSC，残りの1－π

の確率でWCであるという先見的予想を持つ

(-1, 1)

(1, -2)

(-3, -1)

参入しない

参入

容認

対抗

強いチェーンストアSC

SC

Ii1

(-1, 1)

(1, -1)

(-3, -2)

参入しない

参入

容認

対抗

弱いチェーンストアWC

WC

Ii1

完全ベイズ均衡

サラ金ゲーム

サラ金業者と客の間のゲーム

契約どおりに借金を返す良い客GC

借金を踏み倒す悪い客BC

ゲームの進行

自然が確率分布[π;1-π]でGCかBCかを決定

業者Dの信念[θ;1-θ]

Dは客について確率θでGC，1-θでBCと考える

0≦x≦2

(1, 1)

(0, 0)

(1-x, -2+x)

自然

(-1, -1)

GC

BC

π

アウト

1-π

貸す

イン1-θ

θ

β

αイン

貸す

貸さない

貸さない

アウト

D

(-1, 1)

(0, 0)

C D

サラ金ゲーム：基本形

事前（先験）確率と事後確率

客の行動戦略

《GCならばイン；BCならばアウト》

→ 業者Dは店に来た客が確実にGCであることを知っている

→ 店に来たという条件の下で，その客がGCである確率は1

Dの信念は，客のこの戦略の下ではθ=1を満たす（事後確率，条件付確率）

自然がGCを選ぶ確率＝事前（先験）確率

客の行動戦略

《GCならば確率pでイン，1-pでアウト；BCならば確率qでイン，1-qでアウト》

→ 業者Dの信念

ベイズ・ルール

条件付確率を求める算法

qp

p

D -

)1(

に到達する確率

にいる確率　

完全ベイズ均衡の定義

信念μとは，各情報集合 I に対して，その上の確率分布μ(I) を割り当てる関数

μ(I)(1)+･･･+μ(I)(kI)=1

μ(I)(1)≧0，･･･，μ(I)(kI)≧0

s:各プレイヤーの戦略の組

完全ベイズ均衡 (s;μ)

① sはμから計算されるナッシュ均衡である

② μは s の下で到達する手番ではベイズ･ルールを満たす

サラ金ゲームの均衡分析（分離均衡）

x=2

客の行動戦略：《GCならばイン；BCならばアウト》

業者Dの最適反応手番Dでは，μ(D)(α)=θ=1より期待利得は

《貸す》： 1×1+0×0=1

《貸さない》： 1×(-1)+0×1=-1

よって，Dの最適反応は《貸す》

Dが《貸す》を選ぶとき，GCにとってインが最適反応，BCにとってアウトが最適反応

信念μはベイズ･ルールでμ(D)(α)=1と求められる

(《GCならばイン；BCならばアウト》，《貸す》；μ)は完全ベイズ均衡

(1, 1)

(0, 0)

(-1, 0)

自然

(-1, -1)

GC

BC

π

アウト

1-π

貸す

イン

θ=1

β

αイン

貸す

貸さない

貸さない

アウト

D

(-1, 1)

(0, 0)

C D

サラ金ゲーム：分離均衡(x=2)

一括均衡（客が来ない） x=0

客の行動戦略：《GCならばアウト；BCならばアウト》業者Dの最適反応

手番Dでは，μ(D)(α)=θ<3/5 より期待利得は《貸す》： θ×1+(1-θ)×(-2)=3θ-2<-1/5

《貸さない》：θ×(-1)+(1-θ)×1=1-2θ>-1/5

よって，Dの最適反応は《貸さない》

Dが《貸さない》を選ぶとき，GCにとってアウトが最適反応，BCにとってアウトが最適反応

このとき手番Dには到達しないので何でも最適反応信念μはベイズ･ルールでμ(D)(α)<3/5

(《GCならばアウト；BCならばアウト》，《貸さない》；μ)は完全ベイズ均衡，ただしμ(D)(α)<3/5

(1, 1)

(0, 0)

(1, -2)

自然

(-1, -1)

GC

BC

π

アウト

1-π

貸す

イン β

αイン

貸す

貸さない

貸さない

アウト

D

(-1, 1)

(0, 0)

C D

サラ金ゲーム：一括均衡(x=0)

5

3

一括均衡（客が来る） x=0

客の行動戦略：《GCならばイン；BCならばイン》

業者Dの最適反応手番Dでは，μ(D)(α)=θ>3/5 とする．期待利得は

《貸す》： θ×1+(1-θ)×(-2)=3θ-2>-1/5

《貸さない》：θ×(-1)+(1-θ)×1=1-2θ<-1/5

よって，Dの最適反応は《貸す》

Dが《貸す》を選ぶとき，GC，BCにとってインが最適反応

このとき手番Dに到達する

信念μはベイズ･ルールでμ(D)(α)＝ θ＝π>3/5

(《GCならばイン；BCならばイン》，《貸す》；μ)は完全ベイズ均衡，ただしμ(D)(α)=π

(1, 1)

(0, 0)

(1, -2)

自然

(-1, -1)

GC

BC

アウト

貸す

インβ

αイン

貸す

貸さない

貸さない

アウト

D

(-1, 1)

(0, 0)

C D

サラ金ゲーム：一括均衡(x=0)

5

3

5

21 -

ベイズ・ルール（条件付確率）

しばしば信念は相手の行動を受けて事後的に更新されることがある

初期信念(initial belief)と事後的信念(posterior

belief)

事前確率と事後確率

信念の更新はベイズ・ルールに従う

ベイズ・ルールって何？


Pr(A|X)

Pr(A) Pr(X|A)

=

Pr(A) Pr(X|A)+Pr(~A) Pr(X|~A)

Pr(A|X)・・・事象Xが起きた場合に状態Aが生じる確率

～A・・・A以外の状態（B,C,D,…)


例えば・・・

ある薬物検査は９０％の確率で成功するが、１０％の確率で失敗する（ex. 薬物を使用していないにもかかわらず陽性反応）

選手の１０％が薬物を使用している

このとき、陽性反応がでた選手のうち、実際に薬物を使用している確率はどれだけか？

つまり、Pr(薬物使用|陽性反応）は？


Pr(使用|陽性)

Pr(使用) Pr(陽性|使用)

=

Pr(使用) Pr(陽性|使用)+Pr(非使用) Pr(陽性|非使用)

(0.1)(0.9)

= =0.5

(0.1)(0.9)+(0.9)(0.1)

陽性反応がでても、５０％しか薬物を使用していない（検査の結果を安易に信用してはならない）

方法論（夏期集中）セミナー参加者の皆さんへ

8月4日～6日（2時限～4時限＋α）

参加予定者はメールして下さい

2回の報告を義務づけます

各自の研究テーマに沿った論文の報告

それを発展させたオリジナルなモデルの報告

研究領域は問いません

報告論文を7月28日までにPDFファイルで送って下さい

(-2, 1)

(1, -2)

(1, -1)

y1

I11

I21

x1

x2

y2

(-1, 1)

(1, -2)

(-3, -1)

y1

I11

I21

x1

x2

y2

サブゲーム完全均衡：練習問題

次のようなゲームツリーが与えられたとき，サブゲーム完全均衡を求めなさい

(1) (2)

(-2, 1)

(1, -2)

(1, -1)

y1

I11

I21

x1

x2

y2

(-1, 1)

(1, -2)

(-3, -1)

y1

I11

I21

x1

x2

y2

サブゲーム完全均衡：練習問題

次のようなゲームツリーが与えられたとき，サブゲーム完全均衡を求めなさい

(1) (2)

(2, 1)

(1, -2)

(-3, -1)

y1

I11

I21

x1

x2

y2

(-1, 2)

(1, 1)

(3, -1)

y1

I11

I21

x1

x2

y2

(3) (4)

(2, 1)

(1, -2)

(-3, -1)

y1

I11

I21

x1

x2

y2

(-1, 2)

(1, 1)

(3, -1)

y1

I11

I21

x1

x2

y2

(3) (4)

(-1, 1)

(1, -2)

(3, -1)

I11

(1, 2)I21

I22

x1

x21

y1

y21

y22

x22

(-1, 1)

(2, -2)

(-3, -1)

I11

(1, -2)I21

I22

x1

x21

y1

y21

y22

x22

(5) (6)

(-1, 1)

(1, -2)

(3, -1)

I11

(1, 2)I21

I22

x1

x21

y1

y21

y22

x22

(-1, 1)

(2, -2)

(-3, -1)

I11

(1, -2)I21

I22

x1

x21

y1

y21

y22

x22

(5) (6)

(-1, 1)

(3, 2)

(-3, 1)

I11

(1, -2)I21

I22

x1

x21

y1

y21

y22

x22

(-1, 1)

(0, -1)

(2, -3)

I11

(1, 2)I21

I22

x1

x21

y1

y21

y22

x22

(7) (8)

(-1, 1)

(3, 2)

(-3, 1)

I11

(1, -2)I21

I22

x1

x21

y1

y21

y22

x22

(-1, 1)

(0, -1)

(2, -3)

I11

(1, 2)I21

I22

x1

x21

y1

y21

y22

x22

(7) (8)

(0, 0)

(1, 3)

(2, 2)

I1

(3, 1)

I2

x1

x2

y1

y2

y2

x2

(0, 0)

(-1, 3)

(2, 2)

I1

(3, -1)

I2

x1

x2

y1

y2

y2

x2

(9) (10)

(0, 0)

(1, 3)

(2, 2)

I1

(3, 1)

I2

x1

x2

y1

y2

y2

x2

(0, 0)

(-1, 3)

(2, 2)

I1

(3, -1)

I2

x1

x2

y1

y2

y2

x2

(9) (10)

(4, 4)

(3, 1)

(2, 2)

I1

(1, 3)

I2

x1

x2

y1

y2

y2

x2

(0, 0)

(1, 2)

(0, 0)

I1

(2, 1)

I2

x1

x2

y1

y2

y2

x2

(11) (12)

(4, 4)

(3, 1)

(2, 2)

I1

(1, 3)

I2

x1

x2

y1

y2

y2

x2

(0, 0)

(1, 2)

(0, 0)

I1

(2, 1)

I2

x1

x2

y1

y2

y2

x2

(11) (12)

(2, 2)

(1, 3)

(5, 4)

I12

(6, 1)I21

I22

x12

x21

y12

y21

y22

x22

(3, 0)

I11

x11

y11

(13)

(2, 2)

(1, 3)

(5, 4)

I12

(6, 1)I21

I22

x12

x21

y12

y21

y22

x22

(3, 0)

I11

x11

y11

(13)

(2, 2)

(1, 3)

(5, 4)

I12

(6, 1)

I21

x12

x2

y12

y2

y2

x2

(3, 0)

I11

x11

y11

(14)

(2, 2)

(1, 3)

(5, 4)

I12

(6, 1)

I21

x12

x2

y12

y2

y2

x2

(3, 0)

I11

x11

y11

(14)

(3, 3)

(2, 7)

(3, 4)

I12

(4, 0)

I21

x12

x2

y12

y2

y2

x2

(4, 0)

I11

x11

y11

(15)

(7, 2)

(6, 9)

z2

z2

(3, 3)

(2, 7)

(3, 4)

I12

(4, 0)

I21

x12

x2

y12

y2

y2

x2

(4, 0)

I11

x11

y11

(15)

(7, 2)

(6, 9)

z2

z2

(-1, 0)

(0, 1)

(1, 0)

I12

(0, 4)

I22

z1

z2

w1

w2

w2

z2

I11

(16)

(1, 3)

(-1, -1)

(2, 2)

I21

x1

x2

y1

y2

y2

x2

(-1, 0)

(0, 1)

(1, 0)

I12

(0, 4)

I22

z1

z2

w1

w2

w2

z2

I11

(16)

(1, 3)

(-1, -1)

(2, 2)

I21

x1

x2

y1

y2

y2

x2

(2, 2)

(1, 3)

(6, 4)

I12

(8, 1)

I22

z1

z2

w1

w2

w2

z2

I11

(17) (12, 1)

(3, 5)I21

x1

x2

y1

y2

(2, 2)

(1, 3)

(6, 4)

I12

(8, 1)

I22

z1

z2

w1

w2

w2

z2

I11

(17) (12, 1)

(3, 5)I21

x1

x2

y1

y2

(1, 8)

(1, 0)

(1, 2)

I11

(7, 1)

I21

x1

x2

y1

y2

y2

x2

(2,

2)I12

z1

w1

(18)

(6, 0)

(5, 4)

z2

z2

(1, 8)

(1, 0)

(1, 2)

I11

(7, 1)

I21

x1

x2

y1

y2

y2

x2

(2, 2)

I12

z1

w1

(18)

(6, 0)

(5, 4)

z2

z2

(5, -5)

(-1, 1)

(3, -3)

I12

(-1, 1)

I21

x12

x2

y12

y2

y2

x2

(3, 2)

I11

x11

y11

(19)

(5, -5)

(-1, 1)

(3, -3)

I12

(-1, 1)

I21

x12

x2

y12

y2

y2

x2

(3, 2)

I11

x11

y11

(19)

(2, 2)

(1, 3)

(5, 4)

I11

(6, 1)

I21

x1

x2

y1

y2

y2

x2

(3, 0)z11

w11

(20)

(2, 2)

z12

w12

I12

I13

(2, 2)

(1, 3)

(5, 4)

I11

(6, 1)

I21

x1

x2

y1

y2

y2

x2

(3, 0)z11

w11

(20)

(2, 2)

z12

w12

I12

I13

完全ベイズ均衡：練習問題

次のようなゲームツリーが与えられたとき，完全ベイズ均衡を求めなさい

(1)

(1, 1)

(0, 0)

(-1, 0)

自然

(-1, -1)π

x1

1-π

x2

1-θ

θ

β

αy1

x2

y2

y2

(-1, 1)

(0, 0)I11

I12

I2

y1

x1

信念は，αの確率がθ，βの確率が1-θとなるものであるとする．

プレイヤー2の期待ペイオフを計算する．

x2： 1×θ+0×(1-θ)=θ

y2： (-1)×θ+1×(1-θ)=1-θ

(1) Eu2(x2)≧Eu2(y2) のケース

θ≧1-2θ ∴θ≧1/3

この場合，プレイヤー2はx2 をとる．

x2 に対するプレイヤー1の最適反応は(y1, x1), ただし(I11,I12) における戦略を表す．

(y1,x1) に整合的な信念はθ=1．θ≧1/3 と整合的

完全ベイズ均衡は((y1,x1),x2), θ=1

(2) Eu2(x2)<Eu2(y2) のケース

θ<1-2θ ∴θ<1/3

この場合，プレイヤー2はy2 をとる．

y2 に対するプレイヤー1の最適反応は(x1, x1), ただし(I11,I12) における戦略を表す．

情報集合I2 には到達しないので，(x1, x1) に整合的

な信念は0≦θ≦1 の任意のもの．すべての信念が矛盾しない．

よって，完全ベイズ均衡は

((x1, x1), y2), 0≦θ<1/3

注：ベイズ・ルールを満たす

θ[π×0+π×0]=π×0

(1, 1)

(0, 0)

(1, -2)

(-1, -1)

(-1, 1)

(0, 0)

1 2

(2)

自然

π

x1

1-π

x2

1-θ

θ

β

αy1

x2

y2

y2

I11

I12

I2

y1

x1



x2： 1×θ+(-2)×(1-θ)=3θ-2

y2： (-1)×θ+1×(1-θ)=1-2θ


3θ-2≧1-2θ ∴θ≧3/5


x2 に対するプレイヤー1の最適反応は(y1, y1), ただし(I11,I12) における戦略を表す．

(y1,y1) に整合的な信念はθ=π．

完全ベイズ均衡は((y1,y1),x2), θ=π≧3/5

(2) Eu2(x2)<Eu2(y2) のケース

1-2θ>3θ-2 ∴θ<3/5



情報集合I2 には到達しないので，(x1, x1) に整合的な信念は0≦θ≦1 の任意のもの．すべての信念が矛盾しない．


((x1, x1), y2), 0≦θ<3/5


θ[π×0+(1ｰπ)×0]=π×0

(4, 2)

(4, 0)

(0, 10)

(0, 4)

(2, 0)

(2, 0)

1 2

(3)

自然

1/2

x1

1/2

x2

1-θ

θ

β

αy1

x2

y2

y2

I11

I12

I2

y1

x1



x2： 2×θ+10×(1-θ)=10-8θ

y2： 4×θ+0×(1-θ)=4θ


10-8θ≧4θ ∴θ≦5/6


x2 に対するプレイヤー1の最適反応は(y1, x1), ただし(I11,I12) における戦略を表す．

(y1,x1) に整合的な信念はθ=1．

これはθ≦5/6 に矛盾．よって，均衡ではない．

(2) Eu2(x2)≦Eu2(y2) のケース

10-8θ<4θ ∴θ>5/6



情報集合I2 には到達しないので，(x1, x1) に整合的な信念は0≦θ≦1 の任意のもの．すべての信念が矛盾しない．


((x1, x1), y2), 5/6<θ≦1


θ[(1/2)×0+(1/2)×0]=(1/2)×0

Documents

完全ベイズ均衡 - Waseda University · チェーンストア・パラドックス 1 からn の待ちに店を持つチェーンストアがある 各町i には潜在的競争者いて，参入の機会をう

完全ベイズ均衡 - Waseda University · チェーンストア・パラドックス 1 からn の待ちに店を持つチェーンストアがある各町i には潜在的競争者いて，参入の機会をう