98
ゲーム理論の数学的基礎 ― 批判的再検討 ― 河野 敬雄 (京都大学名誉教授)

ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ゲーム理論の数学的基礎

― 批判的再検討 ―

河野 敬雄(京都大学名誉教授)

Page 2: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

―序にかえて―

思えば長い道のりであった.前回の講義録 (河野 2011, [32])では,2005年ノーベル経済学賞受賞者のR.J.Aumannを俎上に乗せたが,今回は図らずもゲーム理論の功績が認められた最初のノーベル経済学賞 (1994年)の受賞者 3名の中のふたり,J.C.Harsanyi

とR.Seltenを同様に俎上に乗せる羽目になった 1.ゲーム理論の数学的基礎は何か,何であるべきかを私なりに模索して来た結果の必然的結論だと自分では信じている.研究は権威主義とは無縁であるべきだろう 2.著者が初めてゲーム理論に興味を持ち始めたのはいつ頃からであったろうか.この

シリーズに最初のゲーム理論についての講義録を書かせて貰ったときの序 (河野 2003,

[26]) をみると,私がゲーム理論についての集中講義を行える程度の知識を身につけたのは 1996年 (平成 8年)あたりのようだ.より強く興味を持ち始めたきっかけは院生とともに進化ゲーム理論の本 ( Weibull 1995, [80])を読み始めて以来ではなかったろうか.彼はその後進化ゲームを社会学方面に応用して立派な入門書を上梓している (2008, [62]).なお,本講義録で考察するゲームはいわゆる非協力ゲームの範疇であり,そのなか

でももっとも基本的な「展開形ゲーム」と「標準形(戦略形)ゲーム」である.初学者のためのゲーム理論の入門書ではないので,読者は「効用(利得)関数」「非協力ゲーム」「展開形ゲーム」「標準形(戦略)ゲーム」「ナッシュ均衡」等の基本的用語,概念についてはある程度既知であるとする.たとえば岡田 (2011, [64]),グレーヴァ香子 (2011,

[15])等の標準的教科書を参照されたい 3.(標準形ゲームに対するナッシュ均衡の定義は5.1節 (49頁)を参照されたい.)さらに,本講義録は従来の標準的教科書とは認識,理解が異なる「悪書」であること

もお断りしておく.本講義録のいくつかの節は内外の査読付き学術誌に投稿して掲載を断られた内容に基づいているから読者も査読者になったつもりで読まれることをお勧めする.参考のために「あとがきにかえて」に過去3つの内外の学術誌に投稿して掲載を断られた時の査読報告書とそれに対する私の反論を載せておいた 4.私の主張を最左端に,国際誌の編集委員会からの desk rejectの評価を最右端に,掲載可,不可の点を真ん中にして,あなたの査読結果はどの位置にくるだろうか.試みてみるのも一興かと思う.

1残る一人はいわずとしれた J.F.Nashである.2それにつけても折に触れて思い出されるのは,3回生のときの数学科の講義で,3時間という長時間

の講義の合間に学生をリラックスさせるためであろうか,老教授が話してくれた数学史上偉大な数学者の逸話についてである.19世紀の始め,ラプラスはすでに功成り名遂げた数学者として侯爵となっていたが,アカデミーの研究発表で若き日のコーシーの無限級数に関する収束・発散の話を聞いてショックを受け,急いで自宅に戻ると,門を閉ざして 1週間すべての自著の級数について誤りがないことを確認してようやく門を開いた,という話が印象に残っている.当時はまだ無限級数に関して収束,発散の違いが認識されていなかったようである.しかし,若い駆け出しの研究者の発表を聞いて直ちにその重要性を認識した老ラプラスも研究者として評価されてよいであろう.彼は政治的にはナポレオンに取り立てられながら後に裏切る等変節漢であるとの評価もあるが少なくとも研究者としては立派な業績を残している,というのが老教授の評価だったように思う.それに比べると世上知られているノイマン教授と大学院生ナッシュの出会いはその後のゲーム理論の発展に寄与しなかったような気がしてならない.

3本講義録で使用する利得(効用)はいわゆるフォン・ノイマン=モルゲンシュテルン効用のことである.「効用」に関する議論は本講義録では一切行わない.

4英文の査読報告書は大学の経済学研究科が発行している欧文学術誌,和文の査読報告書は工学系学会が発行している和文学術誌のそれである.ゲーム理論への理解が経済学関係の研究者と工学系の研究者では微妙に違うようで興味深い.残念ながら,数学関係の学術誌にゲーム理論プロパーの論文は投稿しずらい.尤もアメリカ数学会の分野の分類表にはゲーム理論もちゃんと入っているのだがあいにく国内外にゲーム理論の専門家を自称している数学者の知り合いがいなかった.

i

Page 3: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

本講義録を執筆するにあたって,既発表の自分の論文(2013, [38]と 2016, [44])から相当部分を引用した.快く許可して頂いた数理社会学会編集委員会に対して感謝の意を表したい.また,私の投稿論文に対する査読報告書の引用を認めて頂いた当該編集委員会に対

して感謝の意を表したい.誰の主張が正しいか,ということではなく,オープンで健全な議論を行うことによって,我が国における学術研究の質の向上のための一助になればと思い試みたもので他意はない.私の想いが伝わることを切に願っている.最後になったが,本講義録は畏友福山克司氏に再度,そして恐らく最後のお願いをし

て実現の運びとなったものであり,彼の協力と理解なしには本講義録は出版出来なかった.彼の御尽力と御配慮に衷心から感謝申し上げたい

2016年 12月 1日  河 野 敬 雄e-mail: kono.norio.58x@ st.kyoto-u.ac.jp

追記:以上のような「序にかえて」を含む原稿本体の pdfファイルを添付して 10月 28

日に 2カ所の編集委員会宛てに査読報告書の引用を認めて頂くようメールした.(「序,,,」の日付を 12月 1日にしておいたのは 1ヵ月の検討時間を見込んでおいたためである).経済学研究科の方は,担当者から 11月 4日に前と現の編集委員長に伝えた旨の返信メールがあった.しかしその後は音沙汰がない.改めて 12月 12日に確認のメールを編集委員会宛てに送ったが爾来今日に至るまで音沙汰がない.工学系学会誌の編集委員会からは直ちに「特に問題なし」とのご返事を頂いたので当方の思いを理解して頂いたようである.改めて感謝の意を表したい.私が数学科の大学院生だったとき,喫茶店での雑談で,論文がどう評価されるのが

よいかについて指導教授が次のように話されたことが思い出される.もちろん,ベストなのはプラスに評価されることである.しかし,セカンドベストなのはマイナスに評価されることであって,最悪なのは無視されることである,と.ところで,無視された側の研究者はどう対処すべきであろうか.この点に関して指

導教授は何も言われなかったように思う(思い出せない).思うに,ひたすら淡々と研究を続ける他はないのではないだろうか.ただし,無視された以上彼らの意向を忖度する必要はまったくないだろう.従って,基本的に 12月 1日時点の原稿を公にすることにした.口幅ったいようだが,我が国の特に社会科学関係の学界の風潮に一石を投じることになれば望外の幸せである.もちろん,すべての責任は著者である私にある.

2017年 4月 3日  河 野 敬 雄

ii

Page 4: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

目次

1. ゲーム理論再考 ― ゲーム理論の創設者は誰か? · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 1

1.1. 問題意識 · · · · · · · · · · · · · · · · · · · · · 1

1.2. 先行研究 · · · · · · · · · · · · · · · · · · · · · 2

1.3. 検討 · · · · · · · · · · · · · · · · · · · · · · · · 4

2. 非協力ゲーム理論の大前提ー公理の再確認 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 14

3. 展開形ゲームと標準形ゲームの違いは何か? · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 18

3.1. 展開形ゲームに対する新しい定義 · · · · · · · · · 19

3.2. 最も簡単な例による説明 · · · · · · · · · · · · · · · · · · 22

3.3. 新しい定義の帰結として得られる定理 · · · · · · 25

4. 新しい定義に基づく従来の結果の見直し · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 28

4.1. Selten(1975)の有名な例の再検討 · · · · · · · · · 28

4.2. 後向き帰納法の再検討 · · · · · · · · · · · · · · · · · · · · · 30

4.3. 部分ゲーム完全均衡の再検討 · · · · · · · · · · · · · · · 33

4.4. 信ぴょう性のない脅しゲーム (II) · · · · · · · · · 37

4.5. 標準形ゲームに対する知見 · · · · · · · · · · · · · · · 40

4.6 「新しい定義」の問題点 · · · · · · · · · · · · · · · · · · 44

5. 期待利得最大化原理の再検討ーMaximin原理の立場から · · · · · · · · · · · · · · · · · · 48

5.1. 標準形ゲームに対するMaximin戦略の定義 · · · · · · · · · · · · 49

5.2. Aumann-Maschler の例の再検討 · · · · · · · · · · · · · · · · · · · · · · · · 51

5.3. 信ぴょう性のない脅しゲーム (II)とMaximin原理 · · · · · · 56

5.4. ナッシュ合理性 vs.Maximin合理性 · · · · · · · · · · · · · · · · · · · · · 60

5.5. 超ナッシュ均衡について · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 62

参考文献 · · · · · · · · · · · · · · · · · · · · · · · · · · ·  · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 66

あとがきにかえて · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 70

転載許可書 · · · · · · · · · · · · · · · · · · · · · · · · 数理社会学会機関誌『理論と方法』編集委員会

iii

Page 5: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

1. ゲーム理論再考 ― ゲーム理論の創設者は誰か?

 前回の私の講義録 (2011, [32], 以下,前回の講義録ということにする.なお,2003年

の講義録 [26]は前々回の講義録ということにする)の § 1「ゲーム理論雑感」において,ゲーム理論の生い立ちと若干の科学史的考察を行ったが,もとより科学史の専門家ではないので,以下に述べることも私のこれまでのゲーム理論についての学習に基づく個人的感想,印象記であることをお断りしておく 5.

1.1. 問題意識

学問分野としてのゲーム理論がノイマン・モルゲンシュテルンの大著「ゲームの理論と経済行動」([1944]1953=2009, [78]) (以下,vN-Mの本,と略記する)を出発点としていることはよく知られている.しかし,仔細に文献やその後の発展を調べているうちに少々疑問に思うようになった.つまり,概念的に図示してみると次のようになる.

♣ ゲーム理論の発展史ー大方の見方ー

•�

��

@@@@

前史,E.Borel 等

von Neumann (1928, [77])ゲーム理論の誕生

von Neumann-Morgenstern (1944, [78])

ゲーム理論世に広まる

協力ゲームの理論Nash 交渉解 (1950, [58])加わる

非協力ゲームの理論Nash 均衡 (1950, [57]; 1951, [59])ゲーム理論の主流となり現在に至る

結論:ゲーム理論の創設者は von Neumannである.或はゲーム理論の出発点を1944年に出版された von Neumann-Morgensternの ”Theory of Games and Economic Behavior”

であるとする.ただし,Nash は非協力ゲームに関して多大な貢献をしている,という評価は定着している.

♠ ゲーム理論の発展史ー本講義録の見解ー

結論:von Neumann が創設したのは協力ゲーム理論(提携ゲーム,特性関数型ゲーム)であって,非協力ゲームの理論は J.F.Nash の 1950年 ([57]);1951年 ([59])の論文が出発点である.この論文によって初めて「均衡」概念が導入され,その存在が証明された.ちなみに von Neumann-Morgensternの本で論じられているゼロサムゲームに対する「解」概念はNashの非協力ゲームにおける「均衡」概念と結果的に一致しているが本質的に異なる概念である.この後,種々検討するように,vN-Mの本は基本的に n人ゼロサムゲームに関する “cooperative game theory”であって 2人ゼロサムゲームだけを取り出して非協力ゲームと見なすのは誤りである,と考えるのが本講義録の見解である.

5この節は河野 (2012, [35])において準備した解説文に加筆,修正したものである.

1

Page 6: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

•�

��

��

@@@

��

��

前史,E.Borel 等

von Neumann(1928[77])

ゲーム理論の誕生

von Neumann-Morgenstern (1944[78])

いわゆるゲーム理論世に広まる前史

協力ゲーム理論 協力ゲーム理論Nash 交渉解

(1950[58];1953[60])

提携ゲーム

von Neumann のゲーム理論 Nash のゲーム理論誕生

@@

@@

��

��

非協力ゲーム理論Nash 均衡

(1950[57];1951[59])

主流となり現在に至る

結局,現在研究されている「ゲーム理論」のルーツは 1. ノイマンに始まる協力ゲーム(キーワード:提携,コア),2. ナッシュに始まる協力ゲーム(キーワード:交渉),3. ナッシュに始まる非協力ゲーム(キーワード:均衡)の 3流派に分かれているのではないだろうか.次節以降で取り上げるのは 3番目の系統に属する「非協力ゲーム理論」である.この「非協力ゲーム理論」は,現在大いに隆盛を誇っているが,本講義録の目的はこの中で,「非協力ゲーム理論」に属する展開形ゲームと標準形(戦略形)ゲームを対象にして,新しい認識,理解に基づいて批判的に再検討することである.

1.2. 先行研究

先ず始めに vN-Mの本 (1944)の発売当初に極めて高い評価を与えていた数学者がいたことがKuhn and Tucker 編 (1953, [50])の Prefaceの冒頭に紹介してあるので引用しておく.

“Posterity may regard this book as one of the major scientific achieve-

ments of the first half of the twentieth century, “ A.H.Copeland, Bulletin of

the American Mathematical Society 51(1945), p.498.

ここで,注意すべきことはこの時点(1953年)では既にナッシュの論文(1950, [57];1951,

[59])は発表され,ゲーム理論の専門家の間では知れ渡っていたと思われることである.しかし,ナッシュ均衡概念の重要性は当時はまだ十分認識されていなかったのだろうか.その後のナッシュ均衡概念の発展を思うと疑問の残るところである.ノイマンの権威がそれほど強かったということかもしれない.

次に,ゲーム理論専門家の見解を目についた範囲で紹介しておく:

1. Luce and Tucker編 (1959, [53]) の Prefaceにおいて,彼らは “...that this volume

be dedicated to the memory of John von Neumann, creator of the Theory of Games” と述べている.もっとも,この時期はフォン・ノイマンが 1957年に死んで間もない頃で

2

Page 7: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

あり,ナッシュはまださほど有名ではなかったこともあるだろう.

2. 鈴木 (1994, [72])は 1章を立てて「ゲーム理論の成立」について論じているが,内容は徹頭徹尾ノイマンとモルゲンシュテルンが如何にして「ゲーム理論」を作り上げたか,という物語である.ナッシュに関しては 31頁に 5行ばかりの囲み記事で「非協力ゲームの均衡点と後に述べる交渉問題のナッシュ解によって,ゲーム理論に不滅の貢献をした,真に天才とよべる人」と紹介しているに過ぎない.

3. Myerson(1999, [56])はゲーム理論の先駆者として Cournot, Borel, von Neumann

を挙げている(p.1070 § 3 Nash’s Precursors: Cournot, Borel, and von Neumann).しかし,1073頁の § 4では “Nash’s Reconstruction of Game Theory”と題しているから,彼はNashをゲーム理論の創設者ではなく,ゲーム理論のいわば中興の祖と位置づけているように思われる.そうするとやはり彼はゲーム理論の創設者としては von Neumann

を想定していたのではないだろうか.あるいは,「ゲーム理論」という言葉を誰が創設したとも言えないもっと漠然とした意味に使っているのかもしれない(「ゲーム理論」のプライオリティー論争は避けている?).尤も,彼は次のように述べてNashの業績を激賞しているのだが (同, p.1067).

Nash’s theory of noncooperative games should now be recognized as one

of the outstanding intellectual advances of the twentieth century. The for-

mulation of Nash equilibrium has had a fundamental and pervasive impact

in economics and the social sciences which is comparable to that of the dis-

covery of the DNA double helix in the biological sciences.

4. 中山は vN-Mの本の翻訳の文庫本 III, 493頁 (2009, [78]) の解説において「今日,経済学においてゲーム理論と呼ばれているものは,上に述べたナッシュが創始した非協力ゲームを意味することが多い.」(503頁 ↑ 4)と述べていることから推察すると上記の「本講義録の見解」はゲーム理論の専門家にとっては周知の事実かもしれない.

5. しかし,彼は別の場所で「本書 ([78])の 2/3 以上のページを費やして展開されているのは今日協力ゲームと呼ばれている理論である」(499頁 ↑ 2 )と述べているところをみると,察するに残りの 1/3 足らずの部分を指していると思われる 2人ゼロサムゲームを非協力ゲームに分類しているのではなかろうか(私の前回の講義録では十分検討することなくこの説を引用してしまった).私はこの後に縷々解説するように vN-Mのこの本は 100%協力ゲームのことしか述べていないと現在では考えている.

6. 岡田 (2008, [63] 6頁)には,ゲーム理論の創設者をフォン・ノイマン,モルゲンシュテルン,ナッシュとしてナッシュの名を挙げているが, ゲーム理論の誕生は 1944

年の vN-Mの本であるとしている.しかし他方では(8頁)ナッシュの貢献として,「,,,ナッシュによって始められた非協力ゲームの理論は現代のゲーム理論や経済学の研究に大きな影響を与えている」(9頁 ↓ 3 )とあり,プライオリティー論争に関しては少々不徹底な態度をとっているように思われる.

7. グレーヴァ香子 (2011, [15])は題名が「非協力ゲーム理論」となっているにもかかわらず,序にはゲーム理論は 1944年の vN-Mの本によって創始されたと述べている.「vN-Mの本では両者(協力ゲームと非協力ゲーム)の理論がまったく対等に繰り広げている」という認識の下で,自分の本は「非協力ゲーム」に限定する,という意味のよう

3

Page 8: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

だ.しかし,内容を見る限り,ナッシュ(1951, [59])以降に得られた結果ばかりで,vN-M

の本の内容はまったくといってよいほど反映されていない.彼女は恐らく,vN-Mの本の中で,2人ゼロサムゲームに関する内容を(本講義録の理解とは違って)非協力ゲームに分類しているからであろう.

8. 「ゲーム理論」の創設者は結局誰なのか.結局,現在の研究状況からすると単に「ゲーム理論」と言えば ナッシュの創設した

非協力ゲーム理論を指すことが多い,というのが実態なのかもしれない.本講義録ではノイマン・モルゲンシュテルンの提携形協力ゲーム(特性関数型ゲーム)に関する理論を「ノイマンのゲーム理論」,ナッシュの交渉ゲームと非協力ゲームに関する理論をそれぞれ「ナッシュの協力ゲーム理論」,「ナッシュの非協力ゲーム理論」と呼んで区別して考えることにしたい.本講義録はそのなかで特にナッシュの非協力ゲームのみを考察の対象にしている.

1.3. 検 討

1. ナッシュの非協力ゲームの枠組みは完全に vN-M の本の枠組みに従っているから非協力ゲームもノイマンにプライオリティーがあるのではないのか,という考え方に対してはノイマン自身の言葉と伝えられる次の文章 (Luce-Raiffa 1957, [52] p.2; 1.2 Historical

Backgrounds.)とそのパロディーを添えておく.Frechet has raised a question of priority by suggesting that several papers

by Borel in the early ’20’s really laid the foundations of game theory. ...

Although Borel gave a clear statement of an important class of game theoretic

problems and introduced the concepts of pure and mixed strategies, von

Neumann points out that he did not obtain one crucial result - the Minimax

Theorem - without which no theory of games can be said to exist.

同じ論法を使うと,vN-Mの本には標準形ゲーム,展開形ゲームが定式化されており,ゼロサムゲームの理論も含まれているが,He did not obtain one crucial result –

the concept of equilibrium and its existence theorem – without which no theory of non-

cooperative games can be said to exist. なのではないだろうか.

2. Luce-Raiffa(前掲書)の目次の並べ方を見ると彼らはノイマンのゲーム理論とナッシュのゲーム理論の違いを意識してはいなかったように思われる.すなわち,§ 4. Two-Person Zero-Sum Games, § 5. Two-Person Non-Zero-Sum Non-Cooperative Games, § 6.Two-Person Cooperative Games, となっている.しかし,ナッシュの非協力ゲーム理論の立場からは予めゼロサム・ゲームを準備しておく必要はないし,ノイマンのゲーム理論の立場からは 2人ゼロサムゲームの次に来るべきセクションは 3人ゼロサムゲームだからである.実際,vN-Mの本では

(§ 12.4 つぎの目標:[78]文庫本 I, 230頁)一般 1人ゲームについてはすでに考察したので,そのつぎに単純なゲームは,ゼロ和 2人ゲームである.そこで,まずゼロ和 2人ゲームを検討しよう.あとで,一般 2人ゲームを取りあげるか,ゼロ和 3人ゲームを取りあげる

かという選択の問題が生じる.本書の議論の進め方からいって,どうしてもゼロ和 3人ゲームをさきに取りあげる必要があることが明らかとなる.つぎ

4

Page 9: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

にゼロ和n人ゲーム(n = 1, 2, 3, · · ·)にまでこの結果を拡張し,そのあとではじめて一般 n人ゲームを研究するのが妥当だということがわかるだろう.

(§ 20.1 一般的視点:文庫本 II, 13頁)つまり,1人ゲームには最大化問題になるという特徴があったし,ゼロ和 2人ゲームには利害の截然とした対立が存在していて,それはもはや単一の最大化問題としては記述されえないものであった.そして,1人ゲームからゼロ和 2人ゲームへ移行することによって,純粋の最大化問題という性格が失われたのと同じように,セロ和 2

人ゲームからゼロ和 3人ゲームへ移るにつれて,利害の純粋な対立もまた消滅する.

ここでも 2人ゼロ和ゲームは非協力ゲームであり,3人ゼロ和ゲームは協力ゲームだ,と彼らが分類しているわけではない.n人ゼロ和ゲームにおいて,n = 2の場合は協力する相手がいない,ということを述べているにすぎないのである.彼らは一貫してn = 1, 2, 3, 4, ...と連続してゼロ和ゲームを考察しているのである.ただし,n = 1 の場合だけはゼロ和という定義ができない,ということも指摘している.

(§ 20.1.3 文庫本 II, 15頁)だれと利害を一致させるかが選択できるとすると,これはつまり,同盟者を選ぶ問題になる....これらのことはいずれも,ゼロ和 2人ゲームでは少しも現れようがなかっ

た.(正確に)他人の得失分以外のものは獲得できぬような 2 人のプレイヤーの間では,同意や協調は問題とはならない1).脚注:1)一般 2 人ゲーム(つまり,利得総額が変化する 2 人ゲーム)で

は,もちろん話が違う.その場合には,この 2 人のプレイヤーは,より大きい利得総額を生み出すために協力することがありうる.この点で一般 2 人ゲームとゼロ和 3 人ゲームとの間には一定の類似性がある.

ここで彼らはナッシュのゲーム理論と違って,一般 2 人ゲームを非協力ゲームとはみなしていないことに注意されたい.また,ゼロ和 2 人ゲームは n = 2 という特殊性から同盟者を選ぶことが出来ない,と述べているのであって,2 人ゼロ和ゲームがナッシュのゲーム理論のいう非協力ゲームだという認識は一切ない.本講義録で中山氏の指摘とは違って,vN-Mの本は 100%提携形の協力ゲームの理論のことしか書いてない,と主張する根拠である.なお,ナッシュ交渉解の問題は「一般 2 人ゲームとゼロ和 3 人ゲームとの間には一

定の類似性がある」という彼らの理論展開とは全く別の解決法をナッシュが提案している,と考えることが出来る.この意味でもナッシュはノイマンのゲーム理論に対して徹底的に批判的であったと思われる.もう少し踏み込んで言わせて貰えば,ナッシュは「ノイマンゲーム理論」とはまったく別の新しい「ナッシュゲーム理論」を構想していたのではないだろうか.ノイマンがナッシュに対して好意的な反応を示さなかったといわれるのはけだし当然であったろう.さらに,彼らは

(§ 20.2 結託,§ 20.2.1: 文庫本 II, 17頁,脚注1)つぎのことに注意しておく必要があろう.すなわち,ゼロ和ゲームにおいては,結託は,ゲームの参加者が 3人になったときにはじめて生じるということである. 2 人ゲームでは,結託が組めるだけの十分な数のプレイヤーがいない.つまり,結託であるからには少なくとも 2 人のプレイヤーを含んでいなければならないが,そうすると,対抗する相手がいなくなってしまうからである.ところが,3

5

Page 10: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

人ゲームでは本来結託が生じるが,参加者の数がまだ少ないので,そのような結託の範囲はごく狭く限定されてしまう.つまり,1 つの結託はきっちり2 人のプレイヤーによって,(残りの)ただ 1 人のプレイヤーと対抗するために結成される以外にはないのである.

とも述べている.彼らは,「3 人ゲームでは本来結託が生じるが... 」と述べているように,ノイマンのゲーム理論にあってはプレイヤー間に協力,結託が生じるというのは自明な大前提,公理だと思われる.この点でもノイマンのゲーム理論はナッシュのゲーム理論とは本質的に異なる仮定から出発している.なお,ナッシュのゲーム理論を非協力ゲーム理論と表現するのは多少誤解を生じるように思われる.つまり,ナッシュのゲーム理論ではプレイヤーどうしが「協力しない」,と積極的に主張しているわけではなく,協力しようにも相手の情報が全くない,あるいはコミュニケーションが取れない(取ってはならない),という状況を想定しているからである.非協力ゲームというより無情報ゲームという方が適切かもしれない.同様の内容であるが,

(§ 21.2 ゲームの分析,《協調》の必然性.§ 20.2.1:文庫本 II, 21頁)まず第1に明かなことは,このゲームにおいてプレイヤーのなすべきことは,相棒を見つけること,つまり彼とカプルを作る用意のあるもう 1 人のプレイヤーを探すこと,をおいては他にない.

(§ 56.2架空のプレイヤー ゼロ和拡大 F,§56.2.1:文庫本 III, 209頁)さきに,この一般ゲームの理論を,ある種の方法でゼロ和ゲームの理論と結びつけたいと述べたが,実はそれ以上のことが可能なのである.実際,与えられた任意の一般ゲームを,ゼロ和ゲームとして解釈しなおすことができるのである.

以上縷々検討して来たように,ノイマンのゲーム理論にあってはゼロ和ゲームが基本であり,如何にして同盟者を選ぶか,結託,提携してより有利で安定した利得配分に与るかが彼らのゲーム理論の中心課題なのである.

3. 結局,ノイマンのゲーム理論において,一般に n人ゲームと言った場合,大前提としてゼロサムは仮定していると思われる.かつ,2人ゲームは非協力ゲーム,3人以上のゲームは協力ゲーム,という分類はしていない.つまり,ノイマンにとってそもそも「非協力ゲーム」という概念は存在しないのである.鈴木,中山等ノイマン以降のゲーム理論家が 2人ゼロサムゲームを非協力ゲームに分類するのは,この場合,Maximin戦略がナッシュ均衡戦略と一致するからだと思われる.しかし,ノイマンのゲーム理論には均衡概念は登場しないし,ノイマンがゲームの値,と称してもっぱら得られる利得を如何にして与えられた条件下で最大にするか,「利得」に注目しているのに対して,ナッシュは与えられた条件(相手の戦略を所与とする)の下で自分の利得を最大にする戦略は何か「最適応答戦略」という「戦略」に注目したことがノイマンのゲーム理論との本質的違いである.ゼロサムゲームの場合に得られる結果が一致しているからと言って基礎になっている思想,原理が同じだというわけにはいかない.基本的に問題なのは,ゼロサムであることを前提にしてしまうと 2人ゲームの場合,自分の利得を知れば結果的に相手の利得も同時に分かる(符号が逆の数値が相手の利得)がナッシュの非協力ゲームでは自分の利得と相手の利得は原理的に独立のパラメータである.しかも,ナッシュ均衡戦略は相手の利得にも依存して決まるのに対して,Maximin戦略は自分の利得のみ

6

Page 11: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

で決定できるから,ゼロサムを仮定してしまうと結果的に一致してしまい,両者が本質的に異なる,ということが認識できない.(本講義録,5節, 48頁も参照されたい.)

4. 非協力ゲームはプレイヤーどうしが「協力」しない,というより互いに情報交換が出来ない,コミュニケーションが取れない,と理解する方が適切であるということはすでに述べたが,実はNash自身が論文 (1951, [59])の最初の出だしで強調していることである.このような歴史的経緯は紙数制限のある論文では書きづらいのでここに収録しておく.

Von Neumann and Morgenstern have developed a very fruitful theory of

two-person zero-sum games in their book Theory of Games and Economic

Behavior. This book also contains a theory of n-person games of a type

which we would call cooperative. This theory is based on an analysis of

the interrelationships of the various coalitions which can be formed by the

players of the game.

Our theory, in contradistinction, is based on the absence of coalitions in

that it is assumed that each participant acts independently, without collab-

oration or communication with any of the others.

と述べているから,ノイマン達のゲームが cooperative gameと呼び得るのに対抗してnon-cooperative gameと命名したように思われる.そこには,彼らのいう「ゲーム理論」とこの論文で扱う「ゲーム理論」は全然別ものなんだぞという,すでに功成り名を遂げたノイマン教授に対する無名の大学院生の強い自己主張を感じるのである.一部のゲーム理論家が主張するように vN-Mの本で分析している 2人ゼロサムゲームの結果はナッシュが得た非協力ゲームの結果の典型例だなどと,ナッシュは決して,絶対に考えていなかったと思われる 6.ナッシュをゲーム理論の創設者ノイマンの後塵を拝するように位置づけるのはナッシュ自身納得はしないのではないだろうか 7.なお,Luce-Raiffa(1957, [52] p.94)はプレイヤーどうしの preplay communicationの

可能性について論じているが,これに関連した話題は本講義録の注意 3.3(22頁)を参照されたい.

少々脱線するが,もう少し,協力ゲームと非協力ゲームの違いは何か?について考えてみたい.

4.1. オーマン (1989=1991, [4])では,第 2章 非協力ゲームのところで,まず標準形ゲームのゼロサムゲームを「厳密に競争的」(strictly competitive, 10頁)なゲームとして導入しているがminimax定理より先に,ナッシュの名前を出さずに「均衡点」を定義している.その後ひとしきり 2人ゼロサムゲームの議論をしたあと,(20頁)「さて,次に議論するゲームにおいては,プレイヤーの利害が完全には相反してはいない.これを非ゼロ和ゲームと呼ぶ.」と述べて,わずか 6頁,5例の数値例と数値例の練習問題 3題のあとにナッシュ均衡の存在定理と証明が解説なしに述べられているだけだ.ただ,興味深いのは 21頁の数値例(調整ゲームと言われるタイプ)において,2つの純戦略ナッ

6もちろん,ナッシュは数学者だから 2人ゼロサムゲームは彼の分析した非協力ゲーム理論の 1例だ,ということは認識していただろう.しかし,特別重要な典型例だとは思わなかったはずだ.何故ならば,彼の非協力ゲーム理論において,ゼロサムであるという仮定に特別な意味はないからである.

7ノーベル経済学賞を貰ったのだから良しとするか.

7

Page 12: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

シュ均衡に強い意味でパレート最大元が存在するとき,本講義録の定理 3.3.2(26頁)と同じことを主張していることである.また 24頁の例では本講義録でも述べた注意 5.2(50

頁)と同じ内容のゲームが数値例で与えられている.ところが,次の第 3章は「シャプレイ値」となって,

この章以降では,“協力ゲーム”の理論へと進むことにしよう.ここでの興味の焦点は,プレイヤー達が彼らの手にゆだねられた利得を特定の戦略を用いることによって達成することができる方法にあるのではなく,むしろ彼らがこの利得をめぐって互いに交渉する方法にある.

と述べて,いきなり提携形 (coalitional form)ゲームの定義から始まっている.結局,オーマンの本を全体として眺めると,基本的には vN-Mの本を要約した内容

で,ほんの少々ゼロサムではない 2人非協力標準形ゲームが紹介してある,という程度のようだ.Common knowledgeや backward inductionについてあれほどあれこれ考察した人とは思われない淡泊さでNash(1951, [59])の均衡概念を紹介しているだけで,協力ゲームと非協力ゲームの違いは何か,とこちらが期待したような言明はついに発見することはできなかった.1970年代の講義録が元になっているせいか,その後の非協力ゲームを中心としたナッシュのゲーム理論が隆盛を極めるだろうという予兆は感じられない(補筆する時間的余裕は十分あったように思うのだが).

4.2. 鈴木 (1999, [73] 27頁)にはコミュニケーションの有無からさらに進んで,取るべき戦略の決定にあ

たって,プレイヤーの間に拘束的な合意が可能かどうかという問題があります.プレイヤーの間に拘束的合意が存在しないことを前提として組み立てられた理論が非協力ゲームの理論で,拘束的合意が存在することを前提として組み立てられた理論が協力ゲームの理論です.

 とあるが,29頁には拘束的合意の存在によって,非協力ゲームと協力ゲームとを分けますが,

拘束的合意とは何か,そして,それはいかにして可能かという問題が起こってきます.

と述べて,結局この「問題」に明確な解答は与えられていない.

4.3. 岡田(2011, [64] 6頁, 1.3 非協力ゲームと協力ゲームの理論)ではナッシュは 1951年に発表した論文 ([59])で,非協力ゲームを,(1)プレイ

ヤーの間でコミュニケーションが可能でなく,さらに,(2)拘束力のある合意が可能でない,ゲームと定義した。,,,,これに対して,協力ゲームの理論では,プレイヤーの間で戦略決定に関して話し合いと拘束力のある合意が可能であることを前提にしたときに,どのような提携の形成や利得配分が実現されるかが分析の中心であった。

と述べているが,上記で引用されているナッシュの論文の Introductionには “without

collaboration or communication”あるいは “absence of coalitions”とだけ述べているのであって,coalitionや collaborationが拘束力のある合意を前提にしている,とは vN-M

の本にも明示されていない.卓越した数学者であった von Neumannが「理論」の外に

8

Page 13: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ある「拘束力」をあてにしたような数学理論を構想するとは思われない 8.

4.4. グレーヴァ香子 (2011, [15] 4頁 1.2 非協力ゲームと協力ゲーム)にもナッシュ(Nash,1951)の定義でいうと,複数の意思決定者の間で拘束的な

合意 (binding agreement)をすることができないという前提のゲーム理論が非協力ゲーム理論であり,それができるという前提のゲーム理論が協力ゲーム理論である。

というように排反的定義になっている.さらに,伊藤 (2012, [24] 8頁のコラム「ゲーム理論の枠組み」)では岡田,グレーヴァの説明よりもっと踏み込んで,法哲学者らしく,

ここで「拘束力のある合意」というものが意味しているのは,どのような選択を行うかについていったん複数のプレイヤーのあいだに合意が生まれたならば,サンクション等の存在により彼らは必ずこの合意に従うだろうと考えられるということである。

と述べている.「拘束力」がある,という以上その背景にはそれを担保するサンクションがあると考えるのは自然ではある.しかし,以下いろいろ調べてみて,どう考えても von

Neumannはもちろん,Morgensternにしろ,Nashにしろサンクションまでは考えていなかったように思われる.たとえ現実の人間には到底無理ではあっても,「理論」である以上,依拠すべき「力」はあくまでも「理性の力」でなくてはならないからである.では,何と表現すべきだろうか.Nash(1953, [60] p.130) の論文で彼が言及している”a sort of

umpire”という言葉とも考え合わせると enforceable agreementにしろbinding agreement

にしろ「実効性のある合意」と訳すべきではないのだろうか.あるいは少々意訳になるが,「ある種の合意」でもよいのかもしれない.さらにいえば,概念として重要なことは「合意」の有無なのだから,ことさらに形容句を付ける必要性もないのではなかろうか.

4.5. クレプス (1990=2000, [46] 11頁 3.非協力ゲーム理論の基本概念)には,ゲーム理論は,協力 (co-operative)ゲームと非協力 (non-cooperative)ゲー

ムの 2つに分けられます。この区別は曖昧なこともありますが,,,,.これに対して,協力ゲーム理論において分析の対象となるのは,たいていグループ,あるいは,専門用語でいうところの「提携」(coalition)です.この「提携」というかたちでゲームが規定される場合,その規定の一部として,グループもしくは提携を結んだ各プレイヤーが何を獲得できるかを規定します.その際には,それによってどのような特定の結果がもたらされるかについては,あまり言及しません.

とあり,「拘束力」云々には一切言及していない.

4.6. ビンモア (2007=2010, [11] 181頁 9.交渉と提携)はまず最初に,「vN-Mの本の半分は 2人ゼロ和ゲームの分析にあてられている.この部分からは,われわれがこれま

8“coalitions”を殆どの日本語の教科書では「提携」と訳しているが,銀林他訳の vN-Mの本 ([78],本書は当初 1972年から 1973年にかけて東京図書から出版された.)には「結託」と訳されていた.けだし,適訳だと思う.なぜならば,「互いに助け合う」というニュアンスの「提携」よりも,「ぐるになる」という功利主義的イメージのある「結託」の方が「数学的理論」として相応しいように思えるからである.実際,鈴木 (1999, [73] 78頁)にも,特性関数の定義式について,「この定義の中に,協力関係の厳しさを感じます.,,,協力といっても,提携は常に形成と崩壊を繰り返す競争関係の中にあります.」と述べている.ついでにいうと,ナッシュの「交渉問題」(“The Bargaining Problem”(Nash 1950, [58])は「談合問題」と訳す方がよいと思う.何故ならば,「談合」を成り立たせている根拠は「拘束力」ではなく,「功利的判断」だと思われるからである.

9

Page 14: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

で学んできた非協力ゲーム理論が生まれた」.と述べているから彼はナッシュを非協力ゲーム理論の創設者とは看做していないようだ.続いて,「協力ゲーム理論という用語のために,たえまなく混乱が起きている.」として種々間違った理解の仕方を批判的に取り上げている.その上で (182頁),

協力ゲーム理論が非協力ゲーム理論と異なるのは,ヒトという種において協力が「なぜ」生き残ったのか,ということの説明を放棄している点だけである.その説明を放棄した代わりに,協力ゲーム理論では,プレイヤーは,モデルの中では説明されない,次のようなブラックボックスが利用できることを前提にしている.それは,この本全体を通してわれわれをときおり悩ませてきたコミットメントや信頼の問題を何らかの方法で全て解決する,そのようなグラックボックスである.,,,

このブラックボックスを binding agreementだと割り切ってしまうと「理論」としての協力ゲームの問題点やNashが苦労した点が理解できなくなるのではないだろうか.そこで,ナッシュの「交渉問題」に関するNashの論文 (1950, [58];1953, [60])を見てみよう.

4.7. Nash(1950, [58] p.155)

In general terms, we idealize the bargaining problem by assuming that

the two individuals are highly rational that each can accurately compare his

desires for various things, that they are equal in bargaining skill, and that

each has full knowledge of the tastes and preferences of the other.

彼がこの論文で仮定していることは後々,完全合理性(合理的人間像)とか共有知識(common knowledge) の問題として知られる概念であって,「拘束力」云々は登場しない.しかし,やはり何かが欠けていると感じたのだろうか,3年後の論文 (1953, [60] )では“A new approach is introduced involving the elaboration of the threat concept.” と述べて,

(p.130) A common device in negotiation is the threat.The threat concept

is really basic in the theory developed here. It turns out that the solution of

the game not only gives what should be the utility of the situation to each

player, but also tells the players what threats they should use in negotiating.

If one considers the process of making a threat, one sees that its elements

are as follows: ,,,

The point of this discussion is that we must assume there is an adequate

mechanism for forcing the players to stick to their threats and demands once

made; and one to enforce the bargain, once agreed. Thus we need a sort of

umpire, who will enforce contracts or commitments.

確かに,“an adequate mechanism”の存在を仮定しなくてはいけない,と主張しているが,それは “a sort of umpire”と表現しているから,要するに彼がイメージしたのはゲームの「審判」のようにゲームを公正に進行させるためのプレイヤー以外の第 3者の存在ではなかったのだろうか.この “umpire”の役割として,違反したプレイヤーにサンクションを与える権限までもが与えられているとは想定されていないように思われる.もちろん,経済学,社会学等の「実学」にこのゲーム理論を応用するためには,この第 3

者とは「公権力」である必要があるかもしれない.しかし,そこまで仮定してしまうと

10

Page 15: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

よく知られているように,その「公権力」を維持するコストは誰が払うのかという 2次のジレンマ問題に踏み込んでしまい,閉じた,完結した「理論」にならない.

4.8. 以上みてきた限りの文献では協力ゲームと非協力ゲームの違いをプレイヤー間の communicationの有無と binding agreementsの有無で特徴づけているが,数学的に定式化しづらい binding agreementsという概念を「理論」としてのゲーム理論に持ち込むことには賛成しかねる.非協力ゲームにおいてプレイヤー間に communicationが存在しない(禁止されている)というルールは意思決定(戦略の決定)を独立確率変数として,またある種の pre-play communicationは補助的確率変数の導入によって数学的に厳密に定式化できることはすでに河野 (2008, [30]; 2009, [31])で示した.ところが,Harsanyi-Selten(1988, [21] p.1 p.3–p.4)では両者の違いを主としてbinding agreementsに置いている.すなわち,彼らは“It is preferable therefore to use a one-criterion distinction

– to define cooperative games simply as those permitting enforceable agreements and

noncooperative games as those not permitting them.”と述べている.本講義録は出発点からして彼らとは認識を異にしているらしい.

4.9. では,最初に “binding agreements”と言い出したのは誰だろうか.調べてみた限りでは Luce-Raiffa( 1957, [52] p.89)だった.

By a cooperative game is meant a game in which the players have complete

freedom of preplay communication to make joint binding agreements. In

a non-cooperative game absolutely no preplay communication is permitted

between the players.

ただし,イタリックで強調してあるbindingの内容は説明してない.Nash(1953, [60] p.128–p.129)が述べているように,“an abstract mathematical view point”から “the axiomatic

method”で cooperative games を分析する以上,得られた定理は全プレイヤーにとって受け入れられるものでなければならないだろう.協力ゲームであろうと非協力ゲームであろうと,ゲーム理論の「理論的解析結果」は,自己拘束的 (self-enforcing)でなければ意味をなさない.ナッシュが心配したのは解析途中の「交渉経過」について,「ちゃぶ台返しはしない」(してはならない)そのための “a sort of umpire”の存在を仮定したのではないだろうか.少なくとも「公権力」を背景にしたサンクションは数学的概念ではない.なお,R.Duncan LuceもHoward Raiffaも純粋数学者ではないようだ.

5. もうひとつ確認しておくことがある.それは von Neumannの Minimax Theorem

は Maximin Principle とは全く別物である,ということである.ノイマンの Minimax

Theoremは作用素 maxと作用素 minが交換可能である,という定理である.ノイマンは明かに全プレイヤーの合理性と期待効用最大化原理を仮定しているから,2人ゼロサムゲームの場合,相手が期待効用を最大化するに違いないと仮定してその前提の下で自分が期待効用最大化戦略を採用した時の値 v1がmax-minで得られ,相手から見た場合に同様のことを考えると,相手プレイヤーの得る期待利得(値 v2)はPlayer 1 の期待利得のmin-max値の符合を変えた値となる.作用素maxとminの定義から一般に v1 + v2 ≤ 0

となるが,ノイマンの Minimax Theorem は等号が成り立つ,という命題である.従って,数学的には,作用素maxとminが交換可能である,という命題と同値である.実際ノイマンの論文(1928, [77], 英訳 p.26)には単に「Proof of the Theorem ”Max Min

=Min Max”」と表記してある.

11

Page 16: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

6. 典型的 example の持つどのような性質をどのように拡張するかは難しい問題ではあるが,その方向を誤ると袋小路にはまってしまいその後の発展は望めない.センスの問題ではあるが,他山の石として次のことを指摘しておきたい.

Luce-Raiffa(前掲書,p.106, § 5.9 Definitions of “Solution” for non-cooperative Games)はゼロ和 2人ゲームで成り立つ “interchangeability”を一般非協力ゲームにまで拡張して

A non-cooperative game is said to be solvable in the sense of Nash if

every pair of equilibrium pairs are interchangeable.

と定義しているが,interchangeabilityは作用素maxと作用素minが交換可能である,という事実から導かれる性質であって,ナッシュ均衡戦略はmax 作用素,min 作用素とは無縁な概念だからナッシュ均衡戦略に interchangeabilityを要求するのはまったく意味がない.従来の標準的ゲーム理論においてよく言われるマックスミニ(ミニマックス)戦略や

ミニマックス原理という用語や概念はvN-Mの本で詳しく解説してあるように,基本的に,ノイマンのゲーム理論におけるゼロサムゲームに対してのみ有効な概念である 9.vN-Mの本以降,ときどきゼロサムゲームに対してのみ有効な概念,たとえば“interchangeability“

を一般の非協力ゲームに対して応用しようとする教科書が散見されるが,あまり意味がないように思われる 10.その理由は,ゼロサムゲームの場合はノイマンの有名なMinimax

Theorem(1928, [77]),つまり,max作用素とmin作用素が可換である,という数学的定理に基づいている理論であって,ナッシュのゲーム理論である一般の非協力ゲームの基本的概念である「最適応答」や「ナッシュ均衡」とMinimax Theoremは関係ないからである.ナッシュの論文 (1951, [59])でも,ナッシュ均衡戦略セットの集合が“interchangeability

condition”を満たす場合に “A game is solvable”と定義しているが,定義上ナッシュ均衡戦略セットが 1組しか存在しない場合は自動的に “solvable”になる.しかし,たとえばチキンゲームとか男女の争いゲームのように応用上も意味のある簡単な標準形ゲームには複数のナッシュ均衡が存在して,interchangeability conditionは満たされない.従って,solvableではない.どうもゲーム理論家は一貫して均衡点はただ 1つだけ存在することが望ましい,と考えているふしがある 11.いずれにしろ,その後の非協力ゲーム理論の発展史においてこれらの概念は重要な

役割を果してこなかった.結局ゼロ和 2人ゲーム固有の性質から導かれた性質であって,

9確かに,最悪な場合を想定して最善をつくす,という意味でのミニマックス原理 (河野 2013, [38]では maximin原理と呼んでいる)はゲーム理論とは相性がよい.しかし,2人標準形ゲーム一般に対して「理論的」かつ「系統的」に取り入れたのは河野 (2013, [38])が最初である(と信じている).なお,岡田(2011, [64] 240頁)の繰返しゲームのところで登場するミニマックス行動と混同してはならない.

10Shubik(1981, [71] p.174)には “These properties have been suggested for nonconstant sum games.Unfortunately they do not hold in general”とある.

11純粋数学の場合,線形微分方程式の解の存在と一意性の問題は重要な研究テーマである.しかし,非線形微分方程式の場合は常にそうとばかりは言えない.1988年に出版された Harsanyi-Selten([21])の本の ForewordにおいてAumannは “In general, a given game may have several equilibria. Yet uniquenessis crucial to the foregoing argument. Nash equilibrium makes sense only if each player knows whichstrategies the others are playing; if the equilibrium recommended by the theory is not unique, theplayers will not have this knowledge. Thus it is essential that for each game, the theory selects oneunique equilibrium from the set of all Nash equilibria.と述べている.しかしながら,ゲーム理論において均衡は必ず一意に定めなければならないのだろうか.安定した多様な社会状態が存在する以上ナッシュ均衡も複数存在してよいのではないだろうか.

12

Page 17: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

非協力ゲーム一般に拡張しても意味を持たないからではないだろうか 12.

7. 最後に,提携形の協力ゲームは「ノイマンのゲーム理論」,交渉ゲームは「ナッシュの協力ゲーム理論」,現在主流の非協力ゲーム理論を単に「ナッシュのゲーム理論」と呼び,ノイマンのゲーム理論とナッシュのゲーム理論を峻別することが真にゲーム理論を理解するためには不可欠であることを強調しておきたい.もちろん,研究対象としての「協力ゲーム」と「非協力ゲーム」は必ずしも排反的に理解する必要はない.非協力ゲームの枠内であってもある種の preplay communicationの概念を導入することによって「協力」を引き出すことは可能である 13.

8. なお,「ノイマンのゲーム理論」における 2人ゼロサムゲームはナッシュ以降のゲーム理論の分類に従えば非協力ゲームの 1例であることは確かである.そこで,改めて von

Neumannの最初の論文 (1928=1959, [77]) を読んでみると,「ノイマンのゲーム理論」と「ナッシュのゲーム理論」の違いは「n人ゼロサムゲーム」か「非ゼロサムゲーム」の違いと考えることも出来ることに気が付いた.実際,「ノイマンのゲーム理論」の大前提は「n人ゼロサムゲーム」なのである.この論文では n = 2, 3の場合まで述べてあり,最後の節はPreliminary Remarks on Games for n > 3 となっている.つまり,vN-Mの本はこの論文の続きなのである.coalitionという言葉はすでにこの論文の n = 3の場合に殆ど説明なしに登場する.このことからしてもノイマンがn = 2つまり,2人ゼロサムゲームを 3人以上の「協力ゲーム」と区別していたとは思われない.では何故ノイマンは「ゼロサム」という仮定をはずして一般化を考えなかったのか,

数学者なら当然一般化を考えるだろう,と思われるかもしれないがそれは当たらない.ノイマンにとってはそれは当然なのである.何故ならば,n人非ゼロサムゲームはダミーのプレイヤーを 1人加えることによってn+1人ゼロサムゲームに帰着できるからである(vN-Mの本にそう指摘してあることは先に述べた).数学的には実にきれいな定式化なのであるが,応用面では極めて不都合なことは明らかである.2人非ゼロサムゲームを3人ゼロサムゲームに帰着させてあれこれ分析してもダミーに対応させる人間が存在しないのでは現実社会の分析にはならないからである.以上縷々説明したが,やはり,ノイマンの 2人ゼロサムゲームだけを取り出してノイマンのゲーム理論には非協力ゲーム理論(の一部)が含まれている,という認識は間違っていると確信する 14.

12Luce-Raiffa(1957, [52] p.89-p.90)は,ゼロサムゲームの特徴として interchangeabilityをあげて,非ゼロサムゲームでは成り立たない例をくどくど説明している.しかし,この事実こそ,一方は minimaxtheoremをベースにしたノイマンのゲーム理論であり,他方は equilibriumをベースにしたナッシュのゲーム理論であるという数学的に異なる概念に基づく異質のゲーム理論である何よりの証拠ではないだろうか.

13Luce-Raiffa(1957, [52] p.91-p.94) を参照されたい.なお,河野 (2008, [30]; 2009, [31]) の相関均衡(correlated equilibrium)の概念は非協力ゲームの枠内で可能な協力について定式化した概念であると考えることができる.また,非協力ゲームの定式化から出発して提携ゲームの理論分析を行うことも可能である (河野 2007, [29]).

14素朴に考えれば,集合とは物の集まりのことである.従って,何もないところに集合は存在しない.しかし,理論としての集合論に空集合は欠かせない.空集合を導入しなければ理論としての集合論は完結しない.同様にノイマンのゲーム理論においては,一見非協力ゲームに思える 2人ゼロサムゲームなしには彼の協力ゲーム理論は理論として完結しない.一方,ナッシュの非協力ゲーム理論において,ゼロサムであることには特段の意味はない.

13

Page 18: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

2. 非協力ゲーム理論の大前提ー公理の再確認

 奇妙に思われるかもしれないが,数学の一分野とみなされることもあるゲーム理論

の数学的な前提,つまり,公理が実ははっきりしない.確かに,vN-Mの本には効用関数が公理的に定義されている(従って,公理を意識する場合は,ノイマン・モルゲンシュテルン効用という言い方をする場合がある).その上で彼らはこの効用関数を最大化する(期待効用最大化原理)ことを目指して各プレイヤーは最善を尽くす,という感覚的にも直感的にも納得できる大前提に従って各プレイヤーは戦略を決定している,と仮定されている 15.彼らはことさらゲーム理論の公理である,という表現はしていないが,以後のすべてのゲーム理論の教科書で陰に陽に指摘してある.河野 (2013, [38])16で最初の公理として掲げているが,ただ単に数学の教科書風に公理と表現したに過ぎない,とも言える.ゲーム理論家にとっては自明な大前提であろう.本講義録でも公理 2.1として最初に掲げる.

公理 2.1. 期待利得最大化の原理

この公理に基づいて,各プレイヤーは相手プレイヤー(複数でもよい)の戦略を想定(予想)して,その戦略に対して自己の戦略の中で自己の利得が最大になる戦略(最適応答戦略という)を選ぶ.他のすべてのプレイヤーが同じことを考えるわけだから,すべてのプレイヤーの戦略が,他のプレイヤーの最適応答戦略になっているとき,すべてのプレイヤーは自己の戦略を変更する動機を持たない.このような平衡状態をナッシュ均衡,その時の戦略をナッシュ均衡戦略 17と呼ぶ.ナッシュ均衡戦略は他のプレイヤーの戦略を前提にしている概念であるからすべてのプレイヤーの戦略を一括して,正確にはナッシュ均衡戦略セットと呼ぶべきであるが,誤解の恐れがない場合は単にナッシュ均衡と呼ぶ.

次に,これまた当然なことであるが,囲碁・将棋をプレイするためには当然ルールを知っていなければならない.もっとも碁の打ち方,将棋の指し方を知っているだけでは到底勝ち目はないが,そこはあくまで「理論」の話だからルールさえ知れば最善の指し手が出来ると仮定する(完全合理性の仮定.ただし,この仮定は公理ではない.メタ論理である).ただ,vN-Mの本には明示的には書いてないようだ.彼らにとっては自明だったのかもしれない.しかし,Nashは彼の学位論文ですでにゲーム理論において後年 “Common Knowledge”と呼ばれるような仮定が必要なことを認識していたようだ.従って,我々も取りあえず公理として挙げておく.

公理 2.2. 共有知識の原理

Nashによる Essays(1996, [61])の序文でBinmore がNashの論文 (1951, [59])では学位論文の一部が省略されている,としてその部分をAppendixとして再録しているが,そ

15多少抽象的な言い方の「効用関数」より具体的な表現である「利得」という言い方をすることが多いので,以下ではすべて,利得,期待利得,という言い方をする.

16この論文と論文 (2016, [44])からの部分的引用については著作権を有する数理社会学会から書面による許可を頂いている.記して感謝の意を表しておきたい.

17これに対して,5節 (48頁)で導入するMaximin原理,この原理に基づくMaximin戦略は相手プレイヤーの利得とは無関係に自己の利得表のみで決まることに注意されたい.

14

Page 19: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

の中で,Nashは “the players know the full structure of the game,,,”と述べている.その上で,この仮定が “quite strongly a rationalistic and idealizing interpretation”であるとも述べている.さらにNash(1950, [58] p.155)においても “each has full knowledge of the

tastes and preferences of the other.”と述べている.当然といえば当然であるが,ゲームをする以上は当該ゲームのことについてお互いに十分な知識を持っていなければ勝負にならないことは明らかである.この点についてはさらに,Luce-Raiffa(1957, [52] p.49)にも “he is fully aware of the

rules of the game and the utility functions of each of the players.”と明示してある.ただし,彼の場合,展開形ゲームについての前提のようだが,ゲーム理論全般に当然適用すべきであろう.だがしかし,である.既に前回の講義録 (2011,序の iv頁)で既に縷々批判的にコメントしたからここでは繰り返さないが,Nashや Luce-Raiffaの full knowledge を「共有知識」(Common Knowledge)という大前提にまで強めたのは Aumann(1976, [2])

のように思われる.数学分野ではなじみのない概念だと思われるし,著者には到底理解不能な概念であるが,試みにたとえば,Fudenberg-Tirole(1991, [13], 14. Common

Knowledge and Games)等を参照してみてほしい.もちろん,Luce-Raiffa 程度の常識的知識は総てのプレイヤーが了解しておく必要があるのは言うまでもない.河野 (2013, [38])

ではAumannのいうCommon Knowledgeと区別するために意図的に公理 IIとして「共通了解」(Common Understanding)と呼んでいるが,本講義録の「共有知識」(Common

Knowledge)はこの「共通了解」とまったく同じ意味の公理であることをお断りしておく.いずれにしろこの問題に深入りするつもりはない.

以上 2つの公理は非協力ゲーム理論に関する従来の標準的ゲーム理論の教科書には必ずどこかに書いてある.確かに書いてはあるが,その後に解説してあるさまさまな結果,定理が真にこの 2つの公理だけから導かれるのかその他の前提たとえば現実的,心理的感覚に基づく説明なのか,実験的,実証的データに基づいているのかが明確でないゲーム理論関連本が,入門書,教科書はもちろん専門書にも多い.具体的には後向き帰納法 (4.2節, 30頁)のところでも詳しく議論するつもりである.

実は河野 (2013, [38])でも非協力ゲームに関してはこれら 2つの公理しか掲げなかった.この論文ではもっぱら同時手番ゲームである標準形ゲームしか扱わなかったからそれでよかったのであるが,その後,このアイディアを逐次手番ゲームである展開形ゲームに拡張しようとして展開形ゲームの特徴は何かを考え始めて驚いた.従来の標準的ゲーム理論の教科書をよく読んでもどうも著者によって認識,理解の仕方が違うようだ.この点についてはすでに前回の講義録 (2011, [32])の § 1 ゲーム理論雑感のところでかなり詳しく論じたから繰り返さないが,混乱する議論の根底には,実はもう一つ大事な公理が忘れられているのではないだろうか,ということに最近ようやく気が付いた.それが河野 (2016, [44])の論文で初めて明示的に導入した次の公理である.

公理 2.3. 戦略の事前選択の原理

ゲームを「理論」として考察する場合は,すべてのプレイヤーはゲームが始まる前にあらゆる可能な選択肢を検討した上で公理 2.1,公理 2.2 に基づいて自分のすべての戦略を決定している,確定している,とみなさなければならないということを意味している.この公理 2.3は従来,殆どの教科書に取り上げられてはいない.特に逐次手番ゲーム

15

Page 20: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

である展開形ゲームの場合,ゲームが進行している途中でそれ以前の情報を基に「手」を選択する,あるいは変更できると考えてしまうと,現実のゲームあるいは心理感覚はともかくとして,理論的な分析過程では種々不都合が生じる.この公理は従来の標準的ゲーム理論の教科書では殆ど触れられていないが,既にノイマンの論文 (von Neumann,

1928=1959, [77] p.18)には,‘it may well be assumed that before the play has started he knows how to

answer the following question: ”“In other words, the player knows beforehand

how he is going to act in a precisely defined situation:”

とある.さらに,Neumann-Morgenstern(2004, [79] p.84) にも “After all choices have

been made, they are submitted to an umpire who determines that the outcome of the

play for the player k is ,,,.” とある,また,Luce-Raiffa(1957, [52] p.51) にも “, for

in principle we could cause each player to state in advance what he would do in each

situation which might arise in the play of the game.” とある.つまり,各プレイヤーはin advance に各自の決定した戦略を an umpire に通知することが要請されていると考えられる.

van Damme(1991, [75] p.21, remark 5)も “A strategy of player i is usualy interpreted

as a complete plan of action for this player.”と述べているから展開形ゲームの途中経過で,自分の手番の戦略を変更することが許されているとは思われない.ゲーム理論の専門の教科書とはいえないが,W.パウンドストーンの「囚人のジレン

マーフォン・ノイマンとゲームの理論ー」(1992=1995, [66])の 296頁には頭のよい人は,初めてするゲームの前にルールを一つ一つ検討した上で,最善の策を練るだろう。フォン・ノイマンは,これをもっと極端にした形のゲーム理論の前提を立てた。つまり,プレーヤーは考えられるすべての手を検討して,ゲームの最初の一手が始まる前に,すべての手が決まった,最善の戦略を選んでおくというものだ。

とある.つまり我々の公理 2.3はフォン・ノイマンのゲーム理論の大前提を再確認したに過ぎないのである.

しかしながら,この公理を意識しないまま考察を進めると,直感的または心理的に,さらには理論的な不整合が生じる.Aumann-Maschler(1972, [6]; 1974, [7]),Taylor(1972,[74])でも種々に論じられている.Aumann-Maschler(1972) では,偶然選択の結果を先手番のプレイヤーだけが知り得て,後手番のプレイヤーは知らずに戦略を決定しなければならないような展開形ゲームの場合 (本講義録の 5.2節, 51頁を参照されたい),偶然選択の結果を知っている先手番プレイヤーがナッシュ均衡戦略を計算するために,後手番が絶対に選択し得ない後手番の利得を考慮しなければならない,という「奇妙な」現象について種々議論している.彼らの例では「自然」という偶然手番のプレイヤーのプレイが始まった後に,その結果を知っている先手番プレイヤーと知らないプレイヤーの葛藤を意味しているから,もともと公理 2.2の共有知識の原理が満たされていない.議論の前提が初めから成り立っていないのである.さらに後年,Aumann(1995, [5])は公理 2.3を無視して公理 2.1,公理 2.2の範囲内で後向き帰納法や合理性 (rationality)を論じているために大混乱に陥っている.(4.2節, 30頁も参照されたい.)本講義録でもこの後縷々説明するように,後向き帰納法 (4.2節, 30頁)や部分ゲーム

完全均衡 (4.3節, 33頁)の問題点はまさにこの公理 2.3を無視していることに起因してい

16

Page 21: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

る.

「ゲームをプレイするにあたっての大前提は,すべてのプレイヤーは公理 2.1~公理2.3を認識した上で,自己の意思決定(戦略の選択)をしなければならない,ということである.従って,数学理論として,ゲームの帰結に関する命題の真偽はすべて,ゲームが始まる前にこれらの公理から正しく推論されているかどうかで判定されなければならない 18」

ということを幾ら強調してもし過ぎることはない.本講義録主題は,あくまで公理に基づいた理論的研究であるから,現実感覚や心理的感情を混入してはならない.理論的帰結を確認した後に初めて,現実感覚や心理的感情を加味した「ゲーム理論」が社会科学には求められているのではないだろうか.展開形ゲームの場合,プレイが始まってからあれこれクレームをつけるプレイヤーがいかに多いか,ということでもある.最初にumpire に提出した計画書をプレイが始まってから途中経過を見て変更することは公理2.3に反するのである.もちろん,現実の囲碁・将棋の場合,自分の手番ごとに改めて最適な「手」を考えることが許されている(日常で言う「ゲーム」とはそういうものだ).しかし,「ゲーム理論」的には,その時点毎にその場面を所与とした新しいゲームについて「ゲーム理論」的考察をしているのであって,ゲームが始まる前の展開形ゲームに対してあらかじめ選択していた戦略とは当然異なってよい.後での結論を先取りしてしまったが,後向き帰納法や部分ゲーム完全均衡の問題点は,現実のゲーム感覚を「理論」に取り込もうとしたところにある.現実に観察される目の錯覚現象を合理的に説明するためにユークリッド幾何学の公理を修正した「ユークリッド幾何学」は有り得ない.話の順序は逆であって,理論としての「ゲームの理論」が確立して初めて心理学,脳科学等による研究成果と比較検討が可能となり,より一層「ゲーム理論」が「理論」としても豊かになるのではないだろうか 19.

185節 (48頁)において,リスクを伴う公理 2.1に対して,リスクをさける新しい公理,Maximin原理を導入して種々の例についてこの 2つの公理の比較検討を行う.

19いわゆる「ムカデゲーム」や「最後通牒ゲーム」についての実証データが「理論的予測」といかに乖離しているかということはよく知られている.「理論」といえども現実とのかかわりを無視する必要はないのであって,「ゲーム理論」は,「理論」を豊かにするためにも,心理学,脳科学,実験経済学等の実学的諸分野とのコラボレーションが必要であろう.

17

Page 22: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

3. 展開形ゲームと標準形ゲームの違いは何か?

 展開形ゲームと標準形ゲームはどこがどう違うのだろうか 20.すでに前回の講義録

(2011, [32])の 3頁から 6頁にわたって縷々論じてきたからここでは繰り返さない.ただ,今回論文 ([44])を書くにあたって,さらにいくつかの記述を発見した.vN-Mの本では

von Neumann-Morgenstern(2004, [79] p.85)“Since these two forms(注:the

extensive and the normalized form of the game) are strictly equivalent, it

is entirely within our province to use in each particular case whichever is

technically more convenient at that moment.”

と述べられている.実際,彼らが考察しているゲーム理論の範囲内では正しい記述ではあるが,ナッシュ均衡の精緻化,というレベルの研究においては正しくないのである.数学の対象を「同一視 (equivalent)」することと,最初から同じ (identical)である(区別がつかない)ということは同じことではない.彼らの認識は当然のことながら,von Neumannの最初の論文 (1928=1959, [77] 以下

英訳からの引用)にまでさかのぼる.その Introductionで説明されている 2人ゲームはvN-Mの本で定義されている extenxive gameを意味すると思われるが,続く § 1. General

Simplificationsは次の文章で始まっている.1. The definition of a game of strategy given in the Introduction is rather

complicated, which may appear justified in view of the fact that games of

strategy may be arbitrarily complex. Nevertheless it is possibe to bring all

games falling under this definition into a much simpler normal form, in a

way, into the simplest form that is at all conceivable.

続く説明ではThe relation “earlier” is never realized.と述べているから, simpler normal

formに変換した時点で「順序構造」が失われたことを指摘している.さらに最後の頁では “tactically21 equivalent” games of strategyと表現しているから,数学者のノイマン自身が strictly equivalentと認識していたとは到底考えられない.後世のゲーム理論家が次第に誤解していったのではないだろうか.注意すべきことは当初は “normalized form” と表現されたりしており,一般的ゲー

ムである展開形ゲームを時間的順序は無視して「戦略」(strategy)についてのみ分析するために「標準化」したゲーム,という含意があったと思われる.もちろん,ノイマンは数学者だからそのことを十分自覚していたと思われる.実際,Kuhn(1950, [48] p.570)

も,“radical simplification” と表現している.Selten(1975, [69] p.29)にも,“As we shall see, in the transition from the extensive

form to the normal form some important information is lost22.” と述べているにも関わらず,遥か後年に出版された,Vega-Redondo(2003, [76] p.9–p.11)の本を見ると,2× 2

双行列ゲームの展開形ゲームによる表現(ゲームの木)を図示してくり返しこれらが同じ

20以下,本講義録で扱う展開形ゲームは完全記憶をもつゲームに限る.本講義録における主題は「展開形ゲーム」を如何に理解,認識すべきか,という問題であるから,「展開形ゲーム」の厳密な形式的,数学的定義は当面先送りし,従来の標準的ゲーム理論で説明してある範囲で考える.注意すべき点はその都度コメントする.

21strategically と同義だと思われる.原論文のドイツ語との照合はできなかったが,partial differentialequation(偏微分方程式)を部分微分方程式,と訳す類か.

22展開形ゲームが持っていた順序構造が失われることは確かである.

18

Page 23: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ゲームであることを説明し,Summary において,“two alternative ways of representing

any given game: the extensive form and the strategic(or normal) form.”(p.26)と述べている.しかし,Shubik(1981, [71]p.157 3.1 Strategic or Extensive Form)は,次のように述

べている.There is a not completely innocent modeling assumption that any finite

game in extensive form can be reduced to a game in strategic form which

is equivalent to the original description of the game from the viewpoint of

the application of a solution theory. There are enough difficulties with this,

as has been shown by Selten(1975) and others, that extra considerations

must be taken into account when the noncooperative equilibrium solution is

applied to a game in extensive form.

他方,Harsanyi-Selten(1988, [21] p.29)では両者を融合するような定式化がなされている.すなわち,“Our theory will be based on a game form that is intermediate between

the extensive and the normal form. We call it the standard form.”である.この standard

formは先に Selten(1975, [69])が導入した agent normal formと一見同一に思われるが,p.33のCommentを見ると,“It also differs from the agent normal form which has been

introduced for the purpose of defining perfect equilibrium points (Selten 1975).”と述べている.しかし,いずれにしろ本来の extensive formが持っている順序構造は失われている.ここでも本講義録の認識と彼らのそれとは異なっている.この節では 23従来の標準的ゲーム理論の教科書でも記述が異なり 24,時間発展を表

現している逐次手番ゲームである展開形ゲームとジャンケンのような同時手番ゲームとは数学的構造が違うにもかかわらず,どうして同じだといってみたり,いや違うと言ってみたり混乱がみられるのだろう,という以前からの疑問に私なりの解答を与えたいと思う.つまり,私は逐次手番ゲームである展開形ゲームと同時手番ゲームである標準形(戦略形)ゲームに排反的定義を与え,理論的概念として,本質的に異なるゲームであると理解するに至ったのである.

3.1. 展開形ゲームに対する新しい定義

前回の講義録 (河野 2011, [32])の最後の § 7で,「展開形ゲーム瞥見」と題して展開形ゲームと標準形ゲームとを排反的に分ける定義を与えた.しかし,「本質的展開形ゲーム」と仮に呼んだように時間経過が陽に現れるような展開形ゲームに限られていて,標準形ゲームを展開形ゲームで表した場合は除外されていた.今回は熟慮の末,病理的例外を除いて,従来の標準的ゲーム理論の教科書に載っている展開形ゲームの大半を含むような,標準形ゲームとは排反的定義を与えることにした.一度この定義を採用すると,従来の標準的ゲーム理論の枠内で,つまり公理 2.1~公理 2.3のもとで従来の標準的ゲーム理論の理解,認識とは異なる帰結が導かれる.以下に詳しく説明する.

展開形ゲームはトランプゲームのように時間的経過を伴う「逐次手番」ゲームであ

23この節はもっぱら河野 (2013, [37]; 2016, [43], [44])に基づいている.特に [44]の引用にあたっては,数理社会学会の書面による承諾を頂いている.

24岡田 (2011, [64])に至っては説明すらない.どうやら意図的に避けているようだ.

19

Page 24: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

り,標準形(戦略形)ゲームはジャンケンゲームのように「同時手番」ゲームであって,容易に区別できることは直感的にも常識的にも明らかであろう.たとえば,ギボンズ(1992=1996, [16])では,「静学ゲーム」である同時手番ゲームを標準型による表現とよび,「動学ゲーム」である逐次手番ゲームを展開型による表現とよんで排反的に取り扱っている.にもかかわらず,彼は我々の例 3.2.1(22頁)のような標準形ゲームも展開形ゲームで表現できる,と述べて ([16], 120頁)異なるゲームに変換されてしまうという認識は持っていないようだ.一方,クレプス (1990=2000, [46] 23頁)には「どのような展開形ゲームについても,それに対応して,1つの戦略形ゲームが考えられる.その戦略形ゲームでは,実行すべき「戦略」を同時に選択する複数のプレイヤーが想定される.他方,一般にある与えられた戦略形ゲームに対しては,いくつかの異なった展開形ゲームを対応させることができる.」とある.察するに,応用重視で考えた場合,逐次手番ゲームである展開形ゲームと同時手番ゲームである標準形ゲームは違うのが当たり前だが,ゲーム理論を「理論的」に考察する時には区別が付けられない,という混乱状態にあるようだ 25.実際,従来の「ゲーム理論」の「理論的」枠組みでは展開形ゲームを標準形ゲーム

に「標準化」(normalized)して考察することが von Neumann(1928=1959, [77])以来一貫して行われてきた.逆に,標準形ゲームを形式的に展開形ゲームで表現することは可能なために,従来の標準的ゲーム理論の教科書でも両者は同値なゲームであり,目的,用途によって使い分けすればよい,ただ表現の仕方が異なるだけだ,と考えられている.確かに,ナッシュ均衡のみを考察する場合には両者の違いはない.というより,展開形ゲームのナッシュ均衡は標準形ゲームに表現し直して定義するからである.つまり,「戦略的同値」(strategically equivalent)なのである.しかし,数学で「同値」(equivalence)

という概念は,本来は異なる数学的対象をある視点(この場合はナッシュ均衡)から考察する場合は同一視してもよいという意味で用いる 26

本講義録では,河野(2016, [44])に従って,展開形ゲームに対して,従来の認識とは本質的に異なり標準形ゲームとは互いに排反的な次のような定義を与える.

定義 3.1. 展開形ゲームとは,すべてのプレイヤー(ただし,「偶然手番」をプレイする「自然」は除く)があらかじめ,自分および自分以外のすべてのプレイヤーのプレイする順番を認識しているゲーム,つまり,自分の手番はいつ如何なる状況の時であるかを認識しており,先手番のプレイヤーは自分が最初に意思決定 (=戦略の選択)ができるとい

25ある学会誌に奇をてらって「展開形ゲームと標準形ゲームとは異なるゲームである」という表題の論文を投稿したところ,査読報告書で「そんなことは当たり前だから題名を変更すべきである」と指摘された.

26Selten(1975, [69] p.31)では,完全記憶を持つ展開形ゲームにおいては,Kuhnの定理 (1953, [49] p.214Theorem 4) に基づいて,混合戦略と行動戦略が “realization equivalent” であると述べている.つまり,ナッシュ均衡戦略を実際に求めるに際して,混合戦略の範囲で求めても,行動戦略の範囲で求めても同じ結果が得られることを意味している.ちなみに岡田 (2011, [64])では完全記憶を持つ展開形ゲームのナッシュ均衡を始めから行動戦略の言葉で定義している(70頁,定義 3.1).しかし,Kuhn の定理は展開形ゲームとその標準化したゲームがナッシュ均衡の精緻化についても一致する,ということを保証しているわけではない.van Damme(1984, [75] p.1) は既に,“a perfect equilibrium of the extensive form neednot be perfect in the normal form and a perfect equilibrium of the normal form need not be perfect inthe extensive form.”と指摘している.数学的理由は明らかで,岡田 (82頁)にも簡単な例で示されているように,展開形ゲームにおける混合戦略の全体と行動戦略の全体はユークリッド空間の中で次元が異なる凸集合となる可能性があるからである.従って,極限(位相)の概念を用いて定義する Selten の完全均衡の概念は行動戦略の空間上で定義される場合(展開形ゲームの場合)と混合戦略の空間上で定義される場合(標準形ゲームで表現した場合)では当然数学的に異なる結果を与える可能性がある..

20

Page 25: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

う優先的選択権をもっていること,後手番のプレイヤーは先行するプレイヤーがあらかじめ定められた順序で,自分より先に意思決定 (=戦略の選択)をすることができる,ということをすべてのプレイヤーが承知した上で自己の意思決定 (=戦略の選択)をしなければならない(いわゆる逐次手番)ゲームである.このことは,必ずしも先手番のプレイヤーの選択結果 (戦略)自体を後手番プレイヤーが知ることができるということを意味しない.また,各プレイヤーが複数回プレイすることは有り得る.ただし,誤解してはいけないことは,上に説明したことを全員がすべて了解した上で,プレイが始まる前に,全員が意思決定 (=戦略の選択)を終えなければならないということである(公理 2.3)27. これに対して,標準形ゲームについては,従来の標準的ゲーム理論の理解において

も比較的曖昧さがない.すべてのプレイヤー(ただし,「偶然手番」をプレイする「自然」は除く)による同時手番ゲームであるとも言われる理由はすべてのプレイヤーが同時に意思決定を行わなければならないゲームを想定しているからである.ただし,このことは相手が選択を行ったかどうかを自己の意思決定に反映させることなくプレイしなければならないことを意味しており,必ずしも時間的に同時にプレイしなければならないことを意味しない 28.

注意 3.1. 定義 3.1では,展開形ゲームと標準形ゲームとが互いに排反的に定義されていることに注意されたい.ただし,標準形ゲームの定義(理解)は従来の標準的ゲーム理論のそれと完全に同一である.なお,展開形ゲームについては,vN-Mの本やKuhn(1950,

[48]; 1953, [49]),Selten(1975, [69])を始め,その後の多くの論文や教科書にはゲームの木から出発して展開形ゲームを定義している.一方,同時手番ゲームである標準形ゲームも形式的にはゲームの木で表現できるためにあたかも同じゲームであるかのごとき錯覚をする 29.しかし,Kreps-Wilson(1982, [47] p.866–p.869)では展開形ゲームを順序構造を持つ点集合から出発して情報集合等の概念を定義しているから,順序構造を持たない標準形ゲームとは数学的構造が異なる,つまり展開形ゲームと標準形ゲームが数学の研究対象としては異なる,ということは明確である.残念ながら,この事実はゲーム理論の研究者の間で必ずしも明確には意識されていないようで,Fudenberg-Tirole(1991,

[13] p.77) では展開形ゲームの定義を言葉で与えているが,徹底せず,仮定として,(2)

the order of moves–i.e. who moves when をあげ,その後の説明で,The order of play

(point 2) is represented by a game tree. と述べて,結局ゲームの木を用いて理解しているために標準形ゲームとの違いが明確になっていない.岡田の教科書 (2011, [64])もそうである.そもそも彼の場合,展開形ゲームと標準形ゲームの関係には触れていない.い

27プレイする順番が定まっているゲームの木のルールに従って,プレイヤーが umpireのもとに自分が選択すべきすべての戦略を一括して順番に届けた後に,umpireが届けられた戦略に基づいてプレイを実現させる,というイメージである.多くの標準的教科書の説明にあるようなプレイが始まってから途中の頂点で改めてその場のプレイヤーがそれまでのプレイを知った上で戦略を変更する,ということは許されていない.

28時間的な同時性にこだわるより,相手が意思決定をしたかどうかさえわからないまま自分の意思決定を行わなければならないような状況を表現したゲームが標準形ゲームであると理解した方がわかりやすい.ただし,ジャンケンゲームのようにナッシュ均衡として,ただ 1つの混合ナッシュ均衡しか存在しないようなゲームの場合,定義 3.1の意味の展開形ゲームで表現しても標準形ゲームで表現しても得られる分析結果は同じである.異なるゲームによる定式化により同一の分析結果が得られるという例から「理論」として両者が同一のゲームであると結論することはもちろんできない.

29実は,標準形ゲームをゲームの木で表現した瞬間にすでにプレイする順番が表示され,標準形ゲームにはなかった順序構造が導入されてしまうのである.つまり別のゲームに変換されてしまうのである.

21

Page 26: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ずれにしろ,従来の理解の仕方では標準形ゲームもゲームの木で表現できるから,両者の関係があいまいになってしまうのである.Kuhn(1953, p.199),船木 (2012, [14] 90頁)には 2人ゲームの場合で,プレイヤーの手番の順序がわからないような,偶然手番から始まる「ゲームの木」の例が紹介されている.しかしながら,従来の標準的ゲーム理論の教科書に紹介してあるような「ゲームの木」で表現されている,興味ある展開形ゲームの例は殆どの場合,上記の定義 3.1における展開形ゲームとして理解できる 30.

注意 3.2. 展開形ゲームの特徴づけとして必ずしも「逐次手番」である,という時間的順序に拘る必要はない.状況によっては「優先的選択権」で特徴づけられる場合もあり得る.たとえば,対立するグループないし個人の間に既に主導権をどちらが握っているかについて自他ともに共通了解が存在するような状況をゲーム理論的に表現する場合は同時手番の標準形ゲームよりも逐次手番の展開形ゲームによる分析の方が適しているであろう.その場合,もちろん逐次手番という時間的順序とは無関係に主導権を握っている方が先手番プレイヤーとして表現される.

注意 3.3. Aumann(1974, [1]; 1987, [3])の相関均衡 (correlated equilibrium)の定式化は通常の標準形ゲームの枠内にはおさまらない.しかし,河野 (2008, [30]; 2009, [31])で取り上げたように,確率変数を用いて定式化すれば順序構造のない同時手番ゲームとして表現できるから,Aumannの相関均衡の概念は標準形ゲームの一般化によって定式化できていると考えられる.なお,ゲームの木で表現した場合は,本講義録の理解では,異なるゲームであるとみなされ,順序構造をも考慮に入れた考察が必要である.

注意 3.4. 標準形ゲームを有限回繰り返しプレイするゲーム,たとえば有限繰り返し囚人のジレンマゲームは従来の標準的ゲーム理論の枠内ではゲームの木でも表現できるから展開形ゲームの特別な場合として理解できるが,我々の定義 3.1でいう展開形ゲームには含まれない.逐次手番ゲームと同時手番ゲームが混合しているからである.しかし,無限回を含めて繰り返しゲームは数学的には有限または無限の確率変数列(離散確率過程)としてより厳密に定式化できる.河野 (2003, [26]; 2005, [28])を参照されたい.

3.2. 最も簡単な例による説明

  従来の標準的ゲーム理論における解釈とは異なる定義を与えた展開形ゲームと標準形ゲームについて,新しい定義の下でどのような新しい知見が得られるであろうか.もっとも簡単な標準形ゲームである 2× 2の双行列をゲームの木で表現した展開形ゲームについてみてみよう 31.

例 3.2.1. 男女の争いゲーム.

ここで,ゲームの木について用語の定義を兼て簡単に説明しておく.黒丸 (•) を手番と呼ぶ.ただし,単にゲームの木と見る場合は,頂点 (node)という.

頂点から枝別れしている枝はこの頂点が属するプレイヤーがこの頂点において選択出来る選択肢,手である.出発点 t = 1の手番からゲームが始まって各プレイヤーによって

30本講義録でも数学的に完璧なゲームの木による展開形ゲームの定義を与えるつもりはない.ただ,我々の定義 3.1が適用できるような展開形ゲームのみを取り上げる.

31実は,前回の講義録 (河野 2011, [38] § 7.展開形ゲーム瞥見)ではこのような例は本質的展開形ゲームではない,として展開形ゲームからは除外して考えていた.

22

Page 27: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

それぞれ手が選ばれて最終的に(有限回で)終点の白丸 (◦)に達して 1つのゲーム,プレイが完結する.終点 zi ; i = 1, . . . , 4において各プレイヤーは指定された利得を受取る.カッコ内の左が Player 1の,右が Player 2の利得である.なお,

条件 3.2.1. a1 > a2 > 0, b2 > b1 > 0

を課した場合に男女の争いゲームと呼ぶ.

α

β

•(1.1)

(2.1)

(2.2)

I2

•���

��

bbbbb

αqα

β

z1 : (a1, b1) : N1

z2 : (0, 0)����

��

bbbbbb�����

bbbbb

•◦

αqαqβ

β

z3 : (0, 0)

z4 : (a2, b2) : N2

Player 1

Player 2

time: t = 1 t = 2

図 3.2.1 2× 2 の双行列ゲームをゲームの木で表現した展開形ゲーム

このゲームの場合,3個の頂点,(1.1),(2.1),(2.2)があり,(1.1)は Player 1の手番,(2.1)と (2.2)はPlayer 2の手番である.標準形ゲームとは異なる展開形ゲーム独特の概念は情報集合の概念である.ゲームの木では点線で囲まれた集合で表されている.この情報集合に含まれている頂点はすべて同一のプレイヤーに属している.重要なことは,この情報集合に含まれているどの頂点が先行プレイヤーによって選択されたのかを当該プレイヤーは知ることが出来ない,というルールになっていることである 32.ただし,ただ 1点の頂点のみからなる情報集合の場合は点線で囲むことはしない.このゲームの例ではPlayer 1に属する情報集合はただ 1つの頂点 (1.1)のみであり,Player 2に属する情報集合は 2つの頂点 (2.1)と (2.2)を含む 1つの情報集合 I2のみである.通常はゲームの木と呼ばれるように,各頂点に対して 1つの選択肢の集合が付随してこの頂点に達したプレイヤーがその選択肢の集合から 1つの行動戦略(確率的選択を含む)を選択する,と考える.ただし,ここで注意することは同じ情報集合に属する頂点に付属する選択肢の集合は実は同一の集合でなくてはならない(単に個数が等しいだけではなく,まったく同一の集合でなければならない).何故ならば,この情報集合の属するプレイヤーは,この情報集合内のどの頂点に手番が到達したのかを識別することがルール上出来ないからである.その意味では図を描くとき,各頂点からではなく,各情報集合から枝分かれさせるべきだろう.しかし,それでは「ゲームの木」にならないので伝統的な描き方に従う.また,プレイヤーが意思決定する順番は “time”で示されており,このゲームの場合,t = 1 における手番は Player 1の,t = 2 におけるそれは Player 2の手番であることを示している.このゲームの場合は 2人のプレイヤーとも情報集合を 1つしか持たないため,混合

32完全記憶 (perfect recall)を持つ展開形ゲームであることを仮定しているから,この先行プレイヤーは当該プレイヤーとは異なる.

23

Page 28: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

戦略と行動戦略は一致しているから,単に戦略と呼ぶことにする.このゲームにおいては,Player 1の戦略は選択肢 αを確率 0 ≤ pα ≤ 1で選び,Player

2 のそれは選択肢 α を確率 0 ≤ qα ≤ 1 で選ぶことによって一意に表すことが出来る.このとき,条件 3.2.1の下で,よく知られているように次のような 2組の純粋ナッシュ均衡 N1, N2 と 1組の混合ナッシュ均衡 N3 が存在する.それぞれのナッシュ均衡に対して,Player 1 の期待利得を u1(Nk) ; k = 1, 2, 3,Player 2 のそれを u2(Nk) ; k = 1, 2, 3

とすると

N1 : pN1α = 1, qN1

α = 1. u1(N1) = a1, u2(N1) = b1.

N2 : pN2α = 0, qN2

α = 0. u1(N2) = a2, u2(N2) = b2.

N3 : pN3α = b2/(b1 + b2), qN3

α = a2/(a1 + a2).

u1(N3) = a1a2/(a1 + a2), u2(N3) = b1b2/(b1 + b2).

である.さて,改めて図 3.2.1で表現されている展開形ゲームを考えてみよう.このゲームの

木においては Player 1が先手番であり,Player 2 が後手番であることは自然に定義できていて,両者ともそのことが認識できる(公理 2.2).つまり,定義 3.1が適用できる展開形ゲームである.Player 1 は自分に戦略決定の優先権があることを自覚している.従って,仮定から u1(N1) > u1(N2) > u1(N3) だから,3組のナッシュ均衡の中で自分にとって最も有利な N1 を選ぶ(公理 2.1).そのことをPlayer 2 も認識できるから(公理2.2),Player 2 は pN1

α に対する最適応答戦略 qN1α を選択せざるを得ない.確かにゲーム

のルールから,Player 2 は Player 1 が α と β のどちらを選択したかを知ることは出来ないが,Player 1 が公理 2.1と公理 2.2および定義 3.1に基づいて先に意思決定することが出来る優先的選択権を持っていることを認識しているから,Player 1 の選択を合理的に推論することは出来るのである.なお,図 3.2.1において,Player 1 と 2 を入れ替えれば,Player 2 が先手番,Player

1 が後手番のゲームとなり,図 3.2.1が表現している展開形ゲームとは異なるゲームとなる.この場合は Player 2 が決定権を握り,公理 2.1からナッシュ均衡 N2 を選択し,Player 1 もそれを受け入れざるを得ない.つまり,同時手番ゲームである標準形ゲームを従来の標準的ゲーム理論の教科書のようにゲームの木で表現すると,それは逐次手番ゲームである展開形ゲームであって,本講義録の理解では定義 3.1によって,もとの標準形ゲームとは異なるゲームとなる.また,この例では公理 2.3を意識する必要はほとんどなかったが,4節(28頁)以下で取り上げる典型的な展開形ゲーム,すなわち,部分ゲーム完全均衡や後向き帰納法を議論するような展開形ゲームの場合は公理 2.3が決定的役割を果たすことに注意されたい.同時手番ゲームとしての標準形ゲームに対して,手番の順番を決めるゲーム(例え

ば,コイン投げ)をプレイの前に行えば図 3.2.1が得られる,との考え方もあるが,それこそまさに,同時手番ゲームである標準形ゲームと図 3.2.1の展開形ゲームがゲームとして異なることの何よりの証拠である.数学的には,順序構造のない同時手番ゲームである標準形ゲームに対してコイン投げという新たな操作を加えることによって順序構造をもつ逐次手番ゲームである展開形ゲーム,別のゲームに変換したのである.図 3.2.1において,Player 1 とPlayer 2 では情報集合が非対称だから(Player 1 の情

報集合は 1点のみからなり,Player 2のそれは 2点集合である),Player 1とPlayer 2を

24

Page 29: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

入れ替えると異なる展開形ゲームになることは明らかである 33.Luce-Raiffa (1957, [52]

p.47)には,“it is clearly immaterial whether we put player 1’s move before or after player

2’s move on the tree, for the information sets are so chosen to make them simultaneous

in effect.” と述べているが,vN-Mの本 (2004, [79] p.85) に引きずられた解釈ではなかろうか.本講義録ではその違いが material(essential) である,という認識に立っている.

3.3. 新しい定義の帰結として得られる定理

最も簡単な 2 × 2の標準形ゲームを従来の標準的ゲーム理論の理解の仕方で展開形ゲームで表現した例 3.2.1について,展開形ゲームに対する我々の新しい定義 3.1と,再確認した公理 2.1~公理 2.3から,複数のナッシュ均衡の中から一意にナッシュ均衡が選び出される機序を説明してきた.ここで,より一般的に定理として整理しておく.なお,ここで注意することは,定義 3.1が適用できる展開形ゲームは従来の「ゲームの木」で定義される展開形ゲームより若干狭いが,少なくとも,従来の標準的教科書で例として取り上げられている興味ある応用例は大方含まれているということである.(この問題については 4.6節, 44頁を参照されたい)

定理 3.3.1. 定義 3.1で特徴づけられる展開形ゲームにおいて,複数のナッシュ均衡の組(ただし,すべてのプレイヤーに対して,各プレイヤーの期待利得が一定であるような連結した 34ナッシュ均衡戦略は 1組のナッシュ均衡とみなす.つまり同一視する 35)N1, , , , Nn ; n ≥ 2 が存在したと仮定する.かつ自然手番を除く最初の手番をプレーする先手番のプレイヤー(Player 1と呼ぶ)の,それぞれのナッシュ均衡における期待利得をu1(Nk) ; k = 1, . . . , n とする.このとき,これらの期待利得の最大値 max{u1(Nk) ; k =

1, . . . , n} に一致するナッシュ均衡がただ 1組(例えばN1 とする)ならば,すべてのプレイヤーの一致した選好としてナッシュ均衡 N1 が実現する.

証明. 先手番の Player 1 は優先的意思決定権を持っているから,公理 2.1に従ってN1 を選択し,他のすべてのプレイヤーは公理 2.1~公理 2.3に従って,先行するプレイヤーの N1 に対する最適応答戦略を選択せざるを得ない.つまり,全プレイヤーの一致した選好の結果として N1 が一意に選択される 36.

同時手番ゲームである標準形ゲームにあっては,本講義録の公理 2.1~公理 2.3に基づいて,複数のナッシュ均衡から 1組のナッシュ均衡を全プレイヤーの一致した選好結果として一意に決定することは一般には出来ないが,次のような場合はそれが可能であるという知見が得られる.

33数学的構造の違いは明白で,展開形ゲームは順序構造を持ち,標準形ゲームには順序構造が定義されていない.異なる順序構造を持つ展開形ゲームは当然異なる展開形ゲームである.もちろん,Player 1とPlayer 2を同一視してはならない.

34混合戦略の全体は距離空間とみなせるから,その部分集合に対して連結集合という概念が定義できる.35典型的な展開形ゲームの場合,すべてのプレイヤーに対して同一の期待利得を与える複数のナッシュ均衡戦略セットが混合戦略空間または行動戦略空間で連結している場合がしばしば起こる.これらを異なる均衡戦略セットだとして区別する理論的,実際的根拠はないように思われる.ナッシュ均衡の個数,というときはこの同一視を前提にしている.たとえば,4.1.1節 (28頁) の Seltenの例を参照されたい.

36全プレイヤーが戦略を選択した後,それを公理 2.3に従って,umpireに予め届けなければならない.プレイが始まってから「待った」といってゲーム出発時点で選択した戦略を変更してはならない.このことは特に 4.2節 (30頁)や 4.3節 (33頁)で再検討する後向き帰納法や部分ゲーム完全均衡の再検討の際,忘れてはならない要点である.

25

Page 30: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

定理 3.3.2. 標準形ゲームにおいて,複数のナッシュ均衡の組(ただし,すべてのプレイヤーに対して,各プレイヤーの期待利得が一定であるような連結したナッシュ均衡戦略は 1組のナッシュ均衡とみなす)にパレートの意味で最大元 37がただ 1組存在するならば,すべてのプレイヤーはこの最大元を選択する.つまり,一意に最大元であるナッシュ均衡が実現する.

証明は公理 2.1~公理 2.3 から明らかである.一見自明な定理であるが,4.5節(40

頁)でも改めて取り上げて検討するが,たとえば,Fudenberg-Tirole(1991, [13] p.21) はこの定理の正当性に疑問を投げかけている.理由は本講義録でもしばしば言及しているように,ゲーム理論を「理論」として考察することと,現実のゲーム感覚,心理描写とを混同することに原因があるのではないだろうか 38.「ゲーム理論」の歴史的発展なかで,「理論」が示唆することと「現実」感覚との間

のギャップは多くのゲーム理論家を悩ませ続けてきたようだ.たとえば,Shubik(1981,

[71] p.156)は次のように述べている.The search for appropriate solution concepts may proceed allong several

different lines. The main distinction is between behavioral and normative

approaches. Most of the cooperative solution theories are usually defended

normatively. In contrast, for the most part a behavioral rather than norma-

tive argument is made out for the noncooperative equilibrium.

Whether one adopts a normative or descriptive approach to the noncoop-

erative equilibrium, there is still a choice to be made concerning the domain

of applicability of the solution. Does the normative or behavioral theorist

wish to assert that the noncooperative solution is going to give a “reason-

able or desirable” answer as to what individuals will do or should do in all

circumstances?

彼と同様の問題提起は繰り返しゲーム理論家の間で議論されてきているようだが,私は「純粋理論」とその応用に関する混同ないし,誤解から生じている混乱だと思っている.

37n 次元(n ≥ 2)ユークリッド空間 Rn の部分集合 U の要素 x = (x1, . . . , xn), y = (y1, . . . , yn) に対して,x ≤ y ≡ xk ≤ yk ; k = 1, . . . , nと定義すると良く知られているように U は半順序集合となる.x ≤ y であって,x = y のとき,xは y に対してパレート劣位である,y は xに対してパレート優位である,という.u ∈ U が最大元であるとは ∀x ∈ U ; x ≤ uが成り立つときをいう.なお,定義の部分をxk < yk ; k = 1, . . . , nに置き換えるとより強い意味になる.本講義録では(強い意味で)という形容句を添えて使い分けるので注意されたい.半順序集合の場合,U が有限集合であっても最大元は必ずしも存在するとは限らない.たとえば,チキンゲームの 3つのナッシュ均衡に対する 2人のプレイヤーの期待利得の対(プレイヤーの利得ベクトルということにする)の集合(3点集合)には最大元は存在しない.なお,極大元と最大元を混同してはならない.v ∈ U が極大元であるとは v ≤ xであるような v = x ∈ U が存在しないときをいう.チキンゲームの場合,3つのナッシュ均衡に対する期待ベクトルの集合の要素はすべて極大元である.極大元をパレート最適 (optimal)という.このあたりの用語は個人差があるように思われるので文献毎に確認されたい.たとえば,利得支配 (payoff dominance)している,されている,という表現もある.ここで定義した半順序関係は Rn全体に対して定義できるから,最大元云々という場合はどのような部分集合に対して言えるのかを確認することが重要である.この定理ではナッシュ均衡に対応する利得ベクトルであって,戦略セットに対する利得ベクトル全体の集合に対する概念ではないことに注意されたい.また,異なるナッシュ均衡の組に対する期待ベクトルはたとえ数ベクトルとして一致していても同一視してはならない.従って,定理の成立条件として,最大元の存在のみならず一意性も要求した.

38現実感覚でいうならば,最近ビジネスの世界で「ウイン・ウイン」の関係,という表現をよく見かけるが,これはビジネスのように駆け引き(ゲーム)の世界でもパレートの意味で(強い意味の)最大元となる提案だから双方にとって合理的で望ましい協力関係が築けますよ,つまり,定理 3.3.2が成り立っている場合だ,ということを意味しているのではないだろうか.

26

Page 31: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

偉大な数学者,物理学者として知られるP.S.ラプラスはまた古典確率論の大成者としても知られているが,19世紀初めに既に,その著「確率の哲学的試論」(1814=1997, [51]

132頁)に「確率の見積もりにおける錯覚について」という 1節を設けて次のように述べている.

視覚に錯覚があるように精神にも錯覚がある.そして,さわってみて目の錯覚が正されるように,反省と計算によって精神の錯覚も正される.日常の経験に基づいた確率,あるいは心配や期待によって誇張された確率は,それより優れているが計算の結果にすぎない確率よりもわれわれに強く作用する.

われわれが目撃する事象は,それが依存する原因に関する判断においてわれわれをしばしば誤らせるような影響を及ぼす.われわれがその事象から受け取る生き生きとした印象は,他の人々が観察した反対の現象に注意することをほとんど忘れさせてしまう.われわれの誤りの一つの主要な源であるこの錯覚に陥らないよう,いくら注意してもしすぎることはない.

たとえば,ラプラスが見出したいわゆるベイズの定理について,正しくデータを与えても事後確率についての直感的な推論は,よほど訓練を受けていない限り,この定理の結論とは大きく乖離する場合が多いことはよく知られている.結論的に言えば,“behavioral approach”と “normative approach”を統一的に表現す

るような「ゲーム理論」は有り得ないのではないのだろうか 39.公理から出発する「ユークリッド」幾何学と錯覚現象を研究対象とする心理学,行動科学,脳科学とは相互に関連はあるにしても独立の学問分野であるように「ゲーム理論」に関しても「理論」と「応用」とに原理的に分離した「ゲーム理論」として別々に研究しない限り混乱した現状から抜け出すことは出来ないのではないだろうか.

39たとえば,Harsanyi-Selten(1988, [21])のA General Theory of Equilibrium Selection in Gamesで導入されている risk dominaceという基準でナッシュ均衡を一意に絞ると,我々の定理 3.3.2とは異なるナッシュ均衡を選択する場合がある.4.5節の注意 4.4, 42頁を参照されたい.つまり,彼らの risk dominanceはゲーム理論の大前提である公理 2.1(期待利得最大化原理)とは両立しない.彼らにはノイマンのゲーム理論における解概念 (solution concept)に惑わされてナッシュ均衡も何らかの基準によって一意に絞り込みたい,という願望が強いように思われる.しかしながら,チキンゲームや男女の争いゲームにおける 2つの純ナッシュ均衡から 1つの純ナッシュ均衡を選択すべき合理的で,公理 2.1と両立するような基準を求めることは難しい.もしそのような合理的基準が存在するならば,キューバ危機は起こらなかっただろうし,ジェンダー論という学問分野も存在意義がなくなるのではないだろうか.

27

Page 32: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

4. 新しい定義に基づく従来の結果の見直し

前節の例 3.2.1は,相手が何を選択したかという情報がえられないまま,自分の選択肢を決定しなくてはならない,という意味で通常の感覚での展開形ゲームには感じられないかもしれない.従来の標準的ゲーム理論との唯一の違いは,相手が先に意思決定すること(優先的意思決定権)を認識,承認するかどうかという微妙な違いであるから前回の講義録 (河野 2011, [38])では本質的展開形ゲームではない,と考えていた.しかし,次に取り上げる例はゲームの木による表現からプレイする順番が明らかに表現された逐次手番ゲームの典型的な展開形ゲームであって,ノーベル賞を貰った Seltenが,複数のナッシュ均衡の中からより合理的 (rational),あるいは妥当な (reasonable)なナッシュ均衡を選び出す 40ために perfect equilibriumという概念を導入したときに使用した有名な例である.ところが,である.何と,結論として Seltenが選び出した perfect equilibrium

であるというナッシュ均衡によって得られる利得はもうひとつの perfect equilibriumではないというナッシュ均衡によって得られる利得より強い意味でパレート劣位である (つまり全員の利得が低い)という信じ難い基準なのである.これに対して,何故そうなるかは後ほど説明するが,我々の基準,つまり,公理 2.1~公理 2.3および定義 3.1から得られた定理 3.3.1によって選ばれるナッシュ均衡はごく常識的にも納得のできる選択,つまり,すべてのナッシュ均衡で得られる利得のなかで,全員にとって最も利得の高い(i.e.

強い意味の最大元となる)ナッシュ均衡なのである 41.

4.1. Selten(1975)の有名な例の再検討

例 4.1.1. (Selten, 1975, [69] p.33.)

αpα

β

pβ•

��

���

bbbbb

α

β

◦ z2 : (3, 2, 2) : N1

z1 : (0, 0, 0)

���

���

bbbbbb �����

bbbbb

•◦

α

β

α

β

z4 : (4, 4, 0)

z3 : (0, 0, 1)

Player 1(1.1)

Player 2(2.1)

Pleyer 3

(3.1)

(3.2)

I3

time: t = 1 t = 2 t = 3

@@@@

@@@◦ z5 : (1, 1, 1) : N2

図 4.1.1   Seltenの例

このゲームでは,3人のPlayer 1,2,3 がこの順にプレイする.Player 1の情報集合は頂点 (1.1)のみ,Player 2の情報集合も頂点 (2.1)のみからなるが,Player 3の情報集合は

40ナッシュ均衡の精緻化という.41たとえ,従来の標準的ゲーム理論に従って,この展開形ゲームを標準形ゲームに変換して求めたナッシュ均衡の組に我々の定理 3.3.2を適用したとしても同じ結論が得られる.

28

Page 33: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

頂点 (3.1), (3.2)の 2点からなる I3である.それぞれの情報集合に属する選択肢の集合は{α, β}である.すなわち,Player 2はPlayer 1が選択肢 βを選んだ場合のみプレイすることが出来て,Player 3はPlayer 1とPlayer 2が選択肢 αを選んだ場合のみ,いずれのプレイヤーが αを選んだのかを知ることなくプレイしなくてはならない,というルールである.なお,Player 1が β, Player 2も βを選択した場合ゲームは終了し,Player 3がプレイする機会はない.各プレイヤーの戦略(このゲームではすべてのプレイヤーについて混合戦略と行動戦略は一致している)はそれぞれ,選択肢 αを選ぶ確率 pα, qα, rα で一意に表される.終点 zi ; i = 1, · · · , 5におけるかっこ内の数値は左からそれぞれ Player

1,2,3 の利得を表す.このゲームのナッシュ均衡は次の2組N1, N2であることが容易に確認できる.なお,

それぞれの場合 Player n ;n = 1, 2, 3 の利得を un(N1), un(N2)で表す.

N1 : pN1α = 1, 0 ≤ qN1

α ≤ 2/3, rN1α = 0. u1(N1) = 3, u2(N1) = 2, u3(N1) = 2.

N2 : pN2α = 0, qN2

α = 0, 3/4 ≤ rN2α ≤ 1. u1(N2) = 1, u2(N2) = 1, u3(N2) = 1.

ここで, u1(N1) > u1(N2) だから,先手番である Player 1は定理 3.3.1に従ってN1

を選び,Player 2と 3はそのことを認識できるから(公理 2.2),最適応答であるN1を選ばざるを得ない.しかもこの例ではN1による利得はすべてのプレイヤーにとって,N2

のそれより大きい(強い意味でパレート優位)から,たとえ,先手,後手の違いがなくても全員が定理 3.3.2からN1を選択するだろう,ということは合理的に予測できるのである 42.では,なぜ Selten はN1が “unreasonable equilibrium” である,と主張するのであ

ろうか.今,すべてのプレイヤーがN1を選択しているとき,Player 1の手が「震えて」(Selten 1975, p.35. A Model of Slight Mistakes), N1のつもりで pN1

α = 1−ϵ, (ϵ > 0,十分小)だったとしよう.その場合でもPlayer 2の z2 における期待利得 2−2 ϵは u2(N2) = 1

より大であり,qα = 1に変更しても 4× ϵが得られるだけである.Player 3にしてもやはり終点 z2における期待利得 2− 2 ϵは u3(N2) = 1より大であり,かつ,わざわざ rα = 1

に変更して,z3における利得 1 × ϵを期待する動機を持たない.つまり,公理 2.1を共有している限り,少々N1による期待利得が減少してもN2の期待利得を下回ることは有り得ない,かつそのことをすべてのプレイヤーが認識できる(公理 2.2).それでもなお N2の方を選択する方が “reasonable” であるとどうして言えるのであろうか.実際,Vega-Redondo(2003, [76] p.125–p126) は,N2は完全均衡であり,N1は “weak perfect

Bayesian equilibrium”ですらないが,(N1を選ぶ方が)“it might still be a reasonable way

to play” と述べてその理由を “heuristic” かつプレイヤーの “mental processes”を援用しつつ半頁に渡って縷々説明している.最後に彼は

As we shall argue repeatedly throughout, the “message” that transpires

from this state of affairs is a rather eclectic one: the value and relevance of

any equilibrium notion( for prediction or otherwise) is necessarily context

dependent; i.e., it cannot abstract from the specific circumstances in which

it is applied.

42くどいようだがここで念を押すと,各プレイヤーが決められた順番で意思決定したあと,ゲームが始まる前にその結果を umpireに報告することを忘れてはならない(公理 2.3).プレイが始まってから意思決定したり,事前の選択を変更することは許されていない.

29

Page 34: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

と述べている.これは「ゲーム理論」の「理論」と「現実感覚」を一致させるような定式化は不可能だ,という意味ではないだろうか.少なくとも彼は give upしたらしい.では,何故 Seltenの「精緻化」概念は失敗したのだろうか.その数学的理由は明らか

で,Selten の問題点は,まず第 1に我々の公理 2.3(戦略の事前選択の原理)を考慮していないことと,第 2に,期待利得関数 unは混合戦略空間(距離空間)で定義された連続関数であるのに対して,最適応答とその結果としてのナッシュ均衡はこの距離空間上で不連続に変化する,という数学的事実を考慮していないからである.確かに,pβ = ϵ > 0

をPlayer 2が予想し,Player 3はそのまま rα = 0 を選択している,とPlayer 2が予測したと仮定すると,Player 2は選択肢 α を選ぶ方が利得が高いから qα = 1 に変更する動機を持つ(公理 2.1).しかし,その時のPlayer 2の期待利得は高々 3 ϵ 増加するに過ぎないから,N1 の終点 z2における期待利得が 2− 2 ϵ に減少してもなお N1 を維持しておく方が有利なのである.つまり,公理 2.1~公理 2.3を前提とする限り,たとえ,Player

1の手が震えているのを見たとしてもPlayer 2は qN1α = 0 を qα = 1 に変更する動機は持

たないのである.実は,Gintis(2009, [17] p.92)も彼の local best response(LBR) という 1つのナッシュ

均衡の精緻化概念によってN1 を選ぶべきであると主張している.しかし,彼のLBR基準から導かれる結果が我々とは異なる例も存在するから,定理 3.3.1による基準とは別概念である.ただ,彼は同じ論文の abstractの最後に “The LBR criterion appears to

render the traditional refinement criteria superfluous.”と述べているが,定理 3.3.1の意味するところも同様であると考えている.

4.2. 後向き帰納法の再検討

 完全情報 43有限ゲーム(有限回で終了するゲーム)にあっては,最後のプレイヤーの手番に至るすべての経過がすべてのプレイヤーに開示されているから,ゲーム終了の直前のプレイヤーは公理 2.1に従って,自己の利得の大きい方を選択する(以下の考察では各プレイヤーが得られるはずの利得の値はすべて異なると仮定する).次に,もうひとつ前のプレイヤーの立場で考えると,すでに終了直前のプレイヤーの選択肢は公理2.1と公理 2.2によって推測可能であるから,それを前提に公理 2.1によって,自己の利得が最大になる選択肢を選び,さらにその手前のプレイヤーは同様に公理 2.1と公理 2.2

によって,,,と帰納的に考察して行くと最終的に,最初のプレイヤーの選択肢が公理 2.1

と公理 2.2から合理的に決定できる 44,と考える.これがいわゆる「後向き帰納法」である.

まず,後向き帰納法の問題点を列挙してみる.1. 先行プレイヤーの選択を無視して,途中の時点から新たに始まるゲームとして考

察しているが,出発時点においてすべてのプレイヤーが望ましいと考えた戦略が,途中の時点から新たに始まる部分ゲームの望ましい戦略と一致すべきである 45,という根拠は公理 2.1~公理 2.3からは導かれない.一致しない反例を示すのが本節の主目的である.

43本講義録の定義 3.1に照らせば,「完全情報」という概念は展開形ゲームに対してしか意味を持たない.つまり,すべての情報集合が 1点集合のみからなる展開形ゲームのことである.

44すでにお気づきだろうが,この伝統的な説明法には我々の公理 2.3(戦略の事前選択の原理) が出てこない.実はこれが大問題なのである.以下の解説をよくよく熟読吟味されたい.

45Selten(1965, [68])の「部分ゲーム完全均衡」という概念はこのことを暗黙の内に仮定しているように思われる.

30

Page 35: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

2. 利点は,有限な完全情報展開形ゲームの純粋ナッシュ均衡戦略を必ず求めることが出来るアルゴリズムを与えている点にある.従って,ナッシュ均衡の存在が証明される(Zermero の定理,Kuhn 1953, [49]).しかしながら,複数のナッシュ均衡が存在するとき,後向き帰納法で得られたナッシュ均衡が最も reasonable な均衡であるという合意は得られていない 46.この節で反例を示すように,我々の公理 2.3を確認して改めて見直してみると後向き帰納法で得られたナッシュ均衡よりも reasonble なナッシュ均衡が存在することがわかる.この事実は後向き帰納法の一般化である部分ゲーム完全均衡というナッシュ均衡の精緻化概念には reasonableな根拠がないということを意味する.これについては次節の注意 4.2(36頁)を参照されたい.

例 4.2.1. クレプス (1990=2000, [46] 117頁,精緻化と反理論的なこと (counter-theoreticals)

の例次のようないわゆるムカデゲームを考察する 47 .このゲームは以下の図 4.2.1のようなゲームの木で表される完全情報を持つ展開形

ゲームである.Player 1と Player 2は,Player 1, Player 2, Player 1の順にプレイする.Player 1の情報集合は頂点 (1.1)と頂点 (1.2)の 2つである.その上の選択肢の集合はそれぞれ 2点集合 {α, β}であるから,行動戦略をそれぞれ,選択肢 αを選択する確率pαと rα で表すことができる.Player 2の情報集合は頂点 (2.1)ただひとつである.その上の選択肢の集合も 2点集合 {α, β}であるから,行動戦略を同様に qαで表す.終点zi : i = 1, 2, 3, 4 における数値は左側がPlayer 1の利得,右側がPlayer 2の利得.Player

1の行動戦略は (pα, rα), Player 2の行動戦略は qαで表される.

Player 1 Player 2 Player 1(1.1) (2.1) (1.2)

α, pα α, rαα, qα

βpβ

βqβ

βrβ

z1 : (3, 3) z2 : (10, 0) z3 : (1,−10)

z4 : (2, 1)

time t = 1 t = 2 t = 3

図 4.2.1

ここで,簡単な計算によって,このゲームのナッシュ均衡は次の 2組N1, N2であることが容易にわかる.また,このときのPlayer n ;n = 1, 2の利得をそれぞれ un(N1),un(N2)

とする.N1: p

N1α = 0, rN1

α は任意, 7/8 ≤ qN1α ≤ 1. u1(N1) = 3, u2(N1) = 3.

N2: pN2α = 1, 0 ≤ rN2

α ≤ 10/11, qN2α = 0. u1(N2) = 10, u2(N2) = 0.

もちろん,後向き帰納法で求めたナッシュ均衡はN1の中の純戦略セットrN1α = 1, qN1

α =

1, pN1α = 0である.

さて,以上の 2組のナッシュ均衡のうち,どちらのナッシュ均衡を選択するのが合理的(rational)ないし妥当 (reasonable)だと考えるべきだろうか.以下,純戦略ナッシュ均衡戦

46Aumann(1995, [5])と Binmore(1996, [10])の論争を参照されたい.47本節は河野 (2016, [43])に基づいている.

31

Page 36: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

略セットの範囲内で考察する.我々の定理 3.3.1に基づいて判断すれば,2人のプレイヤー共通の合理的判断としてN2つまり,pN2

α = 1, qN2α = 0, rN2

α = 0が選択されることに疑問の余地がない.何故ならば,先手番であるPlayer 1の利得は u1(N2) = 10 > u1(N1) = 3

であるから,優先的意思決定権を行使して公理 2.1に基づいて pN2α = 1と rN2

α = 0を選択し,後手番の Player 2も公理 2.2によってその決定を予測できるから,Player 2は先手番の Player 1の戦略 (pN2

α = 1, rN2α = 0)に対する最適応答である qN2

α = 0 を選択し,公理 2.3に従って 2人ともこれらの戦略をあらかじめ umpireに届けなければならないからである.ところが,クレプスは次のように主張している (同 118頁).

理論とは反対に,Player 1が選択肢 pN2α = 1を選ぶと想定します.いまや,

あなたは,Player 1が,あなたが保持する理論に沿って行動していないということを示す最善の証拠を持っています.Player 1は,理論的に予想されることをしませんでした.そこであなたは,いまや自分 (Player 2)が qN1

α = 1

を選んだときに,Player 1が理論に沿って rN1α = 1を選ぶと,しっかりと,確

信できるでしょうか.我々は彼の主張に対して 2つの重大な誤解を指摘しておきたい.第 1点は,すでに指摘したように,どうやら彼は後向き帰納法で選ばれた戦略を選ぶのが合理的である,という俗説を正しい理論として確信しているらしいこと.第 2点は公理 2.3を完全に失念していることである.つまり,公理 2.3によって,彼らの意思決定はゲームが始まる前になされて umpireに届けなければならないのである.何度も念を押すが,ゲームが始まってから相手の手を見てあわてて選択肢を変更することは(縁台将棋は別として)理論上は許されていないのである.

注意 4.1. Aumann(1995, [5])はCommon Knowledge of Rationalityから Backwaud In-

ductionが導かれることを「証明」している.しかし,彼の論文に対してBinmore(1996,

[10])が反論している.興味のある読者は自分でフォローしてほしい.Aumann: “if com-

mon knowledge of rationality obtains in a game of perfect information, then the backward

induction outome is reached.” vs. Binmore: “rational players would not necessarily use

their backward-induction strategies if there were to be a deviation from the backward-

inducion path.”

なお,Aumannの論文にはBasu(1990, [9])の論文が引用されている.この論文の序文には

A more general problem which applies to games of both imperfect and

perfect imformation is that standard solution concepts, like subgame per-

fection, implicitly require that players turn a blind eye to another player’s

‘irrationality’ even if this has been revealed by virture of having reached a

node that could not have been reached had this player behaved rationally.

Attempts to solve this problem seem to run invariably into difficulties.

The aim of the present paper is to prove the problem is, in fact, insoluble.

と書かれている.この論文では4つの前提(公理)を満たす如何なる ‘solution concept’

も存在しない,という定理 (Theorem 1)が証明されている.これはあたかもアロー 48の

48K.J. Arrow, 1972年ノーベル経済学賞受賞者

32

Page 37: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

一般不可能性定理(たとえば,Sen(1970=2000, [70])の第 4章,あるいは河野 (2003, [27])

を参照されたい)を彷彿させる定理である.しかし,前提の含意が十分理解できなかった.ただ,前提(公理)の仮定が強すぎるような気はする.Aumannはこの論文を先行研究として挙げてはいるが,結論を受け入れていないことは彼の論文の主張から明らかである.実はBasu(1988, [8] p.247)の論文の次の文章を読むと当初は同じ問題意識をもちながらこの問題を肯定的に解決しようと試みたようだ.

even if a player has revealed himself irrational, others continue to believe

he is rational. In reality, a particular history of moves may reveal to a player

traits of the other players and thereby influence his play in the remainder of

the game. The present paper is an attempt to introduce this idea formally.

残念ながら彼自身認めているように十分な解決にはなっていないように思われる.ある意味で,我々の公理 2.3(戦略の事前選択の原理)(15頁)の導入,というより確認(すでに述べてきたように当初からゲーム理論では implicitに前提とされていたように思われる)することによってBasuの問題は「理論」の問題ではなく,現実のゲームプレイにおける in realityの問題として行動心理学や脳科学の研究対象であると理解するのが妥当なのではないだろうか.従来の標準的ゲーム理論がこの公理 2.3 を忘れて展開形ゲームにおいて時間経過とともに考察をやり直すことによって,如何に不合理で結局は矛盾に満ちた混乱した議論に終始してきたことか.

Basuの論文には引用されていないが,Kohlberg-Martens(1986, [25] p.1004)は exten-

sive game における backwards inductionの採用を求めている.すなわち,a good concept of “strategically stable equilibrium” should satisfy both

the backwards induction rationality of the extensive form and the iterated

dominance rationality of the normal form, and at the same time be indepen-

dent of irrelevant details in the description of the game. Our object in this

paper is to define an equilibrium concept which satisfies all these require-

ments.

しかし,結局は無いものねだりだったのではないのだろうか.

4.3. 部分ゲーム完全均衡の再検討

Nash の原論文 (1950, [57];1951, [59]) における均衡概念は標準形(戦略形)ゲームに対してのみ導入されているが展開形ゲームに対しても同様に定義できる 49.ところで,ナッシュ均衡は複数存在する可能性がある.従って,複数のナッシュ均衡の組の中からより最適な (optimal),あるいは合理的な (rational),あるいは妥当な (reasonable,

plausible), あるいは賢明な (sensible)ナッシュ均衡を絞り込むといういわゆるナッシュ均衡の精緻化 (refinement)の研究が盛んに行われるようになった.最初の精緻化概念は

49normal form game, extensive form gameという区別は von Neumann-Morgenstern([1944]1953=2009,[78])の本で定義されているが,両者を厳密には区別していない,というより同一視している.実際,彼らの協力ゲームの理論においては,もともと非協力ゲームの分類である標準形,展開形の区別は意味をなさない.しかしながら,van Damme(1991, [75], p.1)が指摘するように “Game Theory is a mathematicaltheory which,,,” とするならば,順序構造を持つ逐次手番ゲームである展開形ゲームと順序構造を持たない同時手番ゲームである標準形ゲームは,まず出発点においては厳密に区別した数学的対象として研究する必要がある.その結果としての論理的帰結についての考察は河野 (2013, [37]; 2016, [44])で既に指摘した.本講義録でも両者は同一視しない.本講義録では主として展開形ゲームについて考察するが,これを標準形ゲームに変換して考察し直してはならない.

33

Page 38: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

Selten(1965, [68]) による部分ゲーム完全均衡の概念である.最も簡単な展開形ゲームである次のようなゲームに対して van Damme(1991, [75], p4) は一方のナッシュ均衡がいわゆる “incredible threat”であるが故に reasonable なナッシュ均衡ではない,という結論を導いている.ところが,よく読むと何故 incredible threatであるのか,という説明がmathematical theory という枠に納まっていない極めて感覚的説明に始終しているように思われる.その原因はわれわれが確認した公理 2.3(戦略の事前選択の原理)を無視しているからである.では,我々の定理 3.3.1を適用するとどのような結論が得られるかを以下で分析してみよう.

この例は市場参入ゲーム,あるいは信ぴょう性のない脅しゲームとも言われ,ほとんどすべての非協力ゲーム理論の標準的教科書に取り上げられていて,Player 1(新規参入予定者)とPlayer 2(既存経営者)の葛藤を展開形ゲームで表現している.「理論」として重要な条件はPlayer 1の利得 a3 が a1 と a2 の間にある,ということである.以下a2 < a3 < a1 を仮定する.また,ナッシュ均衡が 2組ある場合を考察するために,b2 < b1を仮定する 50.

例 4.3.1.  市場参入ゲーム (信ぴょう性のない脅しゲーム (I))

条件 4.3.1. a2 < a3 < a1, b2 < b1.

�����

bbbbbb

•Player 1

(1.1)

•Player 2(2.1)

���

��

bbbbb

◦α

β

α

β

z1 : (a1, b1) : N1

z2 : (a2, b2)

z3 : (a3, b3) : N2

time: t = 1 t = 2

図 4.3.1 市場参入ゲーム (信ぴょう性のない脅しゲーム (I))

プレイは次のように行われる.先手番であるPlayer 1がまず,選択肢 α または β を選び (混合戦略でもよい)そのことを umpireに報告する.Player 2 は Player 1が既に意思決定をした,ということを知った上で,もし,Player 1が選択肢αを選んだ場合のことを想定して,自己の選択肢 α または β を選び (混合戦略でもよい)umpireに報告する 51.その後,umpireはすべてのプレイヤーの戦略を点検し,outcome を計算し,各プレ

イヤーの期待利得を公表してゲームは終了する(従って,混合戦略であっても期待利得は計算できる).従って,たとえPlayer 1が本当は選択肢 β を選択していた場合には結果としてプレイは終了していて,Player 2には手番がまわってこないが,それでもPlayer

50van Dammeの例もそうであるが,殆どすべての標準的ゲーム理論の教科書の例は数値例で説明してある.しかし,「理論」としてゲーム理論を理解するためには可能な限り一般化して理解すべきである.この例では 2組のナッシュ均衡が存在する,という仮定が本質的であるが,数値例を見ただけでは何が本質的仮定か分からない.

51van Damme(1991, [75], p.21, remark 5)は “A strategy of player i is usualy interpreted as a completeplan of action for this player.”と述べている.

34

Page 39: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

2は選択を行っておかなければならない (公理 2.3).たとえ完全情報を持つ展開形ゲームであっても理論としてのプレイヤーの戦略は,逐

次手番で先に選択した相手の手を見て,相手の実力を推し量りながら次の一手を意思決定する現実の囲碁・将棋の類のゲームの戦略とは異なることに注意されたい.このことは幾ら強調してもし過ぎることはない.というのはこの前提を無視した説明が多くの標準的教科書においてなされているからである.

このゲームのナッシュ均衡は容易に計算出来て,Player 2の利得 b3 の如何に拘わらず次の 2組 N1,N2 である (各プレイヤーの戦略の表し方は例 3.2.1(22頁)と同様である).なお,そのときの Player nの利得を un(Nk) ; n = 1, 2. k = 1, 2 とする.

(1) N1: pN1α = 1, qN1

α = 1. u1(N1) = a1, u2(N1) = b1.

(2) N2: pN2α = 0, 0 ≤ qN2

α ≤ (a3 − a2)/(a1 − a2). u1(N2) = a3, u2(N2) = b3.

これら 2組のナッシュ均衡を比べてみると,u1(N1) = a1 > a3 = u1(N2) だから先手番である Player 1は定理 3.3.1からナッシュ均衡 N1 を選択し,そのことを Player 2は公理 2.2から推論できるから pN1

α = 1 に対する最適応答として qN1α = 1 を選択する,つ

まり結果として N1 が実現する.では,何故このゲームが「信ぴょう性のない脅し」ゲームとも呼ばれるのであろうか.

上記の 2組のナッシュ均衡の導出において,実は b3はいかなる条件も必要ない,何の関係もないのである.にも拘らず,従来の標準的ゲーム理論の教科書をよくみると,必ず,b1, b2 < b3 が仮定してある.つまり,この仮定の下では Player 2としてはナッシュ均衡の N2 が実現してほしいのである.Player 2の選択が qN2

α = 0 の時,Player 1が pN1α = 1

を選択すると Player 1の利得は a2 となって最悪だから,Player 1が N1 を選択するのを躊躇するだろう.しかし, pN1

α = 1 に対する Player 2の最適応答は qN1α = 1 だから,

Player 1が pN1α = 1 を先に選択すれば,頂点 (2.1)において考えるとPlayer 2は qN1

α = 1

を選択する方が有利である(つまり,公理 2.1に従って qN2α = 0を選ぶはずがない).従っ

て,Player 2が qN2α = 0を選択するのは「信ぴょう性」のない「脅し」である,という説

明がなされる.その上で N2 は「部分ゲーム完全均衡」ではないから N1 を選択するのが合理的である,という解釈が従来の標準的ゲーム理論の説明である.しかし,我々の定義 3.1と公理 2.1~公理 2.3に基づいて考察してみるとPlayer 1が優先的選択権を持つ先手番であり,そのことをPlayer 2も認識している(公理 2.2)以上,u1(N1) > u1(N2)

だから(u1(N2) > u1(N1) という仮定は有り得ない.何故ならば,その場合,N1 はナッシュ均衡にはならないことに注意されたい),公理 2.1によって Player 1が N1 を選択することを Player 2も認識し,予め選択肢を決定しなければならない以上(公理 2.3),「部分ゲーム完全均衡」という概念を導入する必要はなく,N1 が定義 3.1と公理 2.1~公理 2.3の帰結として実現する(定理 3.3.1).もちろん,Player 2が公理 2.1を無視して,あるいは公理 2.2が成り立たず,「価格競争」に突入する可能性が現実にはあるであろう.しかし,本稿では定義 3.1と公理 2.1~公理 2.3の下での理論的考察であるから,実際上の現象や人間心理については考慮しない.それらは別の専門分野の研究対象である.「理論」に焦点をあてるか「応用」に焦点をあてるかによって問題意識が異なるのは当然である.なお,同様の議論を次節でも行う.ここで,b1 < b3の場合に,Player 2の立場でしばし考察してみる.この場合,Player

2 にとっては,願わくばナッシュ均衡N2が実現してほしい.何故ならば u2(N1) = b1 <

35

Page 40: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

b3 = u2(N2) だからである.従って,Player 2 はナッシュ均衡 N2(以下期待利得が同じである限り純戦略で説明する),つまり,qN2

β = 1 を選びたい.しかし,先手番のPlayer

1 は既に選択肢 αを選んでいると合理的に推測できるから 52諦めてナッシュ均衡 N1つまり,qN1

α = 1 を選択しておかざるを得ない 53.では,Player 1 がナッシュ均衡 N2 を選択することは絶対にないのであろうか.1つ

の可能性はプレイヤー 1 が,Player 2 が合理的な判断ができるプレイヤーであるかどうかを疑う,ないし不安に思った場合である.このような説明をしている教科書もあるが,難点は「理論」から外れた説明となってしまうことである 54.そこで注目することはリスクの概念である.実はナッシュ均衡は,期待利得最大化原理に基づく最適応答の概念と共有知識の仮定の下で相手プレイヤーも完全に合理的に判断して戦略を選択している,ということを前提にしているから,相手プレイヤーが自分のナッシュ均衡戦略に対する最適応答をしてくれないと意図した期待利得が得られない可能性がある.たとえば,図 4.3.1のゲームの例でいうと,Player 1 が,自分が先手番のプレイヤー

であることを自覚して 55自分にとって期待利得が大きい (u1(N2) = a3 < u1(N1) = a1だから) ナッシュ均衡戦略 pN1

α = 1 を選んだとしても,Player 2 が何らかの理由で 56

qN2α = 0 を選んだとすると,Player 1 の期待利得は u1(p

N1α , qN2

α ) = a2 < u1(N2) = a3となってしまう.このようなリスクはナッシュ均衡のみをゲーム理論の分析手段とする限り避けがたい.ここで,Player 1 がそのようなリスクを回避することを意図するならば,N1 よりも N2,つまり,pN2

α = 0を選択する動機が生じる.これはまさに河野 (2013,

[38])において標準形ゲームに対して導入したMaximin原理を展開形ゲームに対しても導入することである.ただし,この例では後手番のPlayer 2の方がリスクを回避しようとしてMaximin戦略を採用すると,Player 2のMaximin戦略は qN1

α と一致してしまう.従って,Player 2 の立場からは,Maximin原理に従った場合でも期待利得 u2(N2) = b3をゲットすることは期待できない.では,後手番のPlayer 2 にとって,先手番のPlayer

1 とは逆の選好を持つときであっても,「理論」としてはPlayer 2 は如何なる時にも先手番のPlayer 1 の優位性を受け入れざるを得ないのであろうか.実は 5.3節 (56頁)において最も簡単な不完全情報展開形ゲームの範囲で,Player 2がMaximin原理の立場に立つとき,Player 1も自己の期待利得を最大化させるためにPlayer 2に従ってMaximin原理に従ってMaximin戦略を選択せざるを得ない場合があることを 5.3節 (56頁)において示す.

注意 4.2. Fudenberg-Tirole(1991, [13] p.69)には “Selten(1965) formalized the intuition

with his concept of a subgame-perfect equilibrium, which extends the idea of backward

52非協力ゲームの大前提のひとつである「共有知識 (common knowledge)」の仮定を用いている.共有知識についても種々議論がなされているが本稿では深入りしない.

53van Damme(1991, [75], p.4)では Player 2 が現実に選択しなくてはならない場合(つまり,Player 1が選択肢 αを選んだあと)Player 2は選択肢 α を選ぶのが合理的だからナッシュ均衡 N2 は実現できない,incredible threat だ,という説明になっているが,この説明は前述したように全てのプレイヤーの戦略はプレイが始まるまでにすべて選択し終えて umpireに報告しておかなくてはならない,という公理 2.3に反する説明である.

54良く知られているように,理論としてのゲーム理論ではすべてのプレイヤーの完全合理性を仮定している.

55逐次手番の展開形ゲームであり,共有知識の仮定により Player 2 も認識している,と考えられる,56このゲームを従来の標準的ゲーム理論に従って,2× 2の標準形ゲームに変換して考察すると,Player

1が先手番のプレイヤーであり,共有知識の仮定により Player 2もそのことを認識している,という逐次手番ゲームである展開形ゲームの定式化が消えてしまうので注意されたい.

36

Page 41: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

induction to extensive games,,, と述べている.我々はすでに後向き帰納法によって得られるナッシュ均衡を選ぶことが必ずしも合理的な選択ではない(定理 3.3.1に従った選択ではない)ことを指摘しているから,後向き帰納法のアイディアを拡張した「部分ゲーム完全均衡」にも当然合理的選択である根拠はない.

なお,Player 1がPlayer 2の合理性を疑い,リスクを避けるためにMaximin戦略と一致する N2 を選択する可能性が現実にはあるであろう 57.ナッシュ均衡戦略とMaximin

戦略との関係については 5節 (48頁)で改めて詳しく論じるつもりである.

4.4. 信ぴょう性のない脅しゲーム (II)の再検討

次の例は van Damme(1991, [75])をはじめ多くの標準的ゲーム理論の教科書や論文に取り上げられて 58,ナッシュ均衡の精緻化概念の例を説明するために繰返し議論されている最も簡単な不完全情報展開形ゲームの例である.ただし,利得表は一般化してある.

例 4.4.1. 信ぴょう性のない脅しゲーム (II)

α

β

γ

•(1.1)I2

•����

bbbbb

α

β

z1 : (a1, b1)

z2 : (a2, b2)��

���

bbbbbb�����

bbbbb

•◦

α

β

z3 : (a3, b3)

z4 : (a4, b4)

Player 1

Player 2

(2.1)

(2.2)

time: t = 1 t = 2

図 4.4.1: 信ぴょう性のない脅しゲーム (II)

JJJJJJJJJJ◦ z5 : (a5, b5)

ここで,Player 1の選択肢の集合は {α, β, γ}で,Player 2の選択肢の集合は {α, β}である.前節のゲームとの大きな違いは複数の頂点を含む情報集合の存在である.つまり,例 4.3.1は完全情報ゲームであるのに対して本例は不完全情報ゲームであるという違いである.図 4.4.1に於いて,I2で表されている点線で囲まれた領域に含まれる頂点に到達したPlayer 1の選択(この例の場合は,選択肢 α と β)をPlayer 2は区別(認識)出来ないことを意味している.Player 2の混合戦略については,正しくは情報集合 I2上

57たとえば人質事件における警官隊は犯人が合理的人間であるとは思わないであろう.佐藤 (2008, [67])の銀行強盗の例は現実にはありそうにない.

58目についた例を列挙すると,Basu(1988, [8], p.259),Fudenberg-Tirole (1991, [13], p.83, Figure 3.7a; p.322, Figure 8.1; p.343, Figure 8.6 a; p.359, Figure 8.17),ギボンズ (1992=1996, [16], 176頁, 図4.1.3, 図 4.1.3; 235頁, 図 4.4.1),ギンタス (2009=2011, [18], 254 頁, 9.4 節; 260頁, 9.8 節),ヒープ・ファロファキス (1995=1998, [22], 137頁, 図 3.7),Kohlberg-Mertens(1986, [25], p.1007, Figure 2),クレプス (1990=2000, [46], 116頁,図 5.4(b); 192頁, 図 6.7(a)),Kreps-Wilson(1982, [47], p.866, Figure1; p.871, Figure 4; p.878, Figure 9; p.884, Figure 14),McLennan(1985, [54], p.890, Figure 1),佐藤(2008, [67], 130頁, 21 信用できない脅し再考),Shubik(1981, [71] p.177, Figure 9.),van Damme(1991,[75], p.12, Figure 1.4.3; p.117, Figure 6.5.1; p.121, Figure 6.5.4) 等.

37

Page 42: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

の行動戦略というべきであるが,このゲームの場合,混合戦略と一致しているので区別せず単に戦略ということにする.ゲーム終了後の終点 zi ; i = 1, . . . , 5 におけるPlayer 1

の利得を ai,Player 2の利得を biで表している.このゲームの場合,Player 1の選択肢の集合は 3点集合だから,混合戦略を決定するためには独立なパラメータが 2個必要なため,Player 1の戦略,すなわち各選択肢を選ぶ確率を確率ベクトル p = (pα, pβ, pγ)で表す.同様に,Player 2のそれを確率ベクトル q = (qα, qβ)で表す.戦略セット (p, q) に対する Player n ;n = 1, 2 の期待利得を un(p, q) で表す.注意すべきことは Player 1 が選択肢 γを選ばなかったと想定した場合,不完全情報ゲームであるために一見 2× 2 の同時手番ゲーム(標準形ゲーム)あるいは,我々の新しい定義に従うと,例 3.2.1(22頁)

と同じ展開形ゲームのように感じられるかもしれないが,正しい理解ではない.改めてこの時点でゲームを始めるようなイメージを抱いてはならない.何故ならば,公理 2.3

と定義 3.1に従って,time : t = 1において,Player 1が意思決定して umpireに報告した後に Player 2も意思決定して umpireに報告しなくてはならないからである.

この展開形ゲームは部分ゲームを持たない.従って,ナッシュ均衡の精緻化概念の 1

つである「部分ゲーム完全均衡」は意味を持たないことに注意されたい.つまり,形式論理上すべてのナッシュ均衡が部分ゲーム完全均衡となって reasonableなナッシュ均衡を絞り込むことが出来ない.そのために,多くの教科書やゲーム理論の論文では補助的なあれやこれやの理屈をつけて 1つのナッシュ均衡に絞り込もうとしている.しかし,本節では我々の公理 2.1~公理 2.3と展開形ゲームに対する新しい認識 (定義 3.1)に基づいて考察する限り(つまり,定理 3.3.1を適用すれば),これらの文献で導入されている新しい精緻化概念を用いることなく,容易に同じ結論が得られることを示す.なお,最適な (optimal),あるいは合理的な (rational),あるいは妥当な (reasonable, plausible), あるいは賢明な (sensible)ナッシュ均衡とはみなされない,いわゆる「信ぴょう性のない脅し」戦略が実は,5節 (48頁)で導入するMaximin原理に基づく新しい公理 2.1∗に基づいて意思決定すると,リスクを避けるという意味で妥当な選択となり得る場合があることを 5.3節 (56頁) において,同じ例 4.4.1を用いて論証する.

本例が多くの文献で繰り返し取り上げられている理由は,perfect equilibrium, sequen-

tial equilibrium 等ナッシュ均衡の精緻化の視点から議論するための最も簡単な展開形ゲームの 1つだからではないだろうか.しかしながら,展開形ゲームにおける混合戦略と行動戦略が一致するこのような簡単なゲームの場合でさえ,perfect, sequencial等の均衡概念が時に reasonableであり,時に unreasonableであり得ることもこれまた多くの文献で指摘され議論されている通りである.これらの文献で取り上げられているゲームはすべて数値例であるが,すべての例における共通点は,次のようなタイプの 2組のナッシュ均衡 N1, N2が存在していることである.すなわち,Player 1のナッシュ均衡戦略pN が

仮定 4.4.1. N1: pN1 = (pN1

α , pN1β , 0)

および,仮定 4.4.2. N2: p

N2 = (0, 0, 1)

の場合である.Player 2のナッシュ均衡戦略 qN1 , qN2 について,ここでは何も仮定しない.

38

Page 43: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

注意 4.3. ナッシュ均衡の定義を少し詳しく考察すると,Player 2の終点 z5における利得 b5は,仮定 4.4.1,仮定 4.4.2の成立,不成立に何ら影響を与えないことがわかる.

このゲームにまつわる従来からの様々な説明,物語を解説する前に,以上の設定から直ちに導かれる結論を定理および系として纏めておく.

定理 4.4.1. 仮定 4.4.1と仮定 4.4.2の下で,ナッシュ均衡 Nk ; k = 1, 2 がプレイされたときの Player n ;n = 1, 2 の期待利得を un(Nk) とするとき,

a5 = u1(N2) ≤ u1(N1)

が成り立つ.なお,u2(N1) と u2(N2) の大小関係は決定できない. 証明. a5 = u1(N2) > u1(N1) であったと仮定すると,pN1 は,pN2 = (0, 0, 1) へ変更

する動機を持ち,ナッシュ均衡戦略ではなくなるからである.

系 4.4.1. 定理 4.4.1の仮定の下で,さらに,u1(N2) < u1(N1)が満たされているならばナッシュ均衡N1が両プレイヤーの一致した選好として選択される.

証明. 定理 3.3.1から明らかである.

チェックした限りの教科書,文献における数値例ではこの系の条件が満たされている.従って,ナッシュ均衡を絞る込むためのさらなる精緻化,たとえば perfect equilibrium

や sequential equilibrium等の概念は必要ないのである.なお,u1(N2) = u1(N1)となる場合は,Player 2の選択の如何にかかわらず先手番の Player 1はN2を選択することによって確実に a5 = u1(N2) = u1(N1)を得ることができるから,リスクを避けるべきである,という基準をさらに加えればN2を選ぶ方が合理的だと考えられるが,そのためには 5節(48頁)で導入するMaximin原理に基づく新しい公理 2.1∗に従って議論する必要がある.「理論」的考察をする際に心理的,現実的感覚を無批判に,あるいは ad hoc

に導入してはならない.

以下,従来の標準的ゲーム理論の教科書に解説されていることに対する,本講義録の立場からのコメントをしておきたい.このゲームについても例 4.3.1のゲームと同様に,「信ぴょう性のない脅しゲーム」で

あると言われることがあるが,その場合は必ず,仮定 4.4.1,仮定 4.4.2の他に u1(N2) <

u1(N1) とさらに,u2(N1) < b5 が仮定してある.つまり,Player 2の立場から考えた場合,ナッシュ均衡 N2 が実現してほしいのである.そこで,彼は qN2を選択するぞ,とPlayer 1を「脅す」というのである.例えば,佐藤 ([67], 132頁)に従うと,もしPlayer

1がナッシュ均衡 N2 を選択したとすればそれは,「Player 1が pN1 を選んだら,自分は qN2 を選ぶぞ,そうすればお前は高々u1(N2)の利得しか得られないのだぞ」,というPlayer 2の脅しを Player 1が信用したことを意味する,とある.しかし,この「脅し」は信用されない,何故ならばPlayer 2の情報集合 I2における最適応答はPlayer 1の戦略pN1に対する qN1 でなければならないからである,という説明がなされる.しかし,公理的に考察すれば,例 4.4.1のゲームにおいて,仮定 4.4.1,仮定 4.4.2の

他に u1(N2) < u1(N1) を満たしさえすれば,系 4.4.1 から,両プレイヤーの一致した選好としてナッシュ均衡N1が選択されることに疑問の余地はない.いかなる精緻化概念も必要ないのである.

39

Page 44: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

結局,多くの標準的ゲーム理論の教科書に書いてある説明はいづれも我々の公理 2.1

~公理 2.3および定義 3.1から外れた根拠のない心理描写に過ぎない.何故ならば,各プレイヤー の選択はゲームが始まる前になされなくてはならない(公理 2.3)からである.展開形ゲームの場合,後手番のプレイヤーが妥当な戦略の決定のために先手番のプレイヤーの選択を想定することは必要であるが,ゲームが開始された後にPlayer 1が選択肢 γを選ばない(つまり,N2 を選ばなかった)ことがわかった後になってから後手番であるPlayer 2が選択肢を変更することは許されていない 59.なお,逐次手番のゲームであっても各プレイヤーは情報を交換することなく独立に各自の選択肢を決定しなくてはならない,ということも忘れてはならない 60.従って,後手番のプレイヤーが「自分は qN2 を選ぶ心算だが,その場合お前の利得は高々 u1(N2) であるぞ」,という「脅し」を先手番のPlayer 1に伝えることは出来ない,つまり脅せない.強いて言えば,Player

1がPlayer 2の合理的判断能力を疑った場合,安全を見込んで確定的利得である u1(N2)

の方を選択するという可能性はあり,前節の図 4.3.1のゲーム(34頁)と同様の状況である.この場合,pN2 は 5節で導入するMaximin戦略と一致している.つまり,Player 1

にとってリスクを避ける,という意味で消極的に,Maximin 戦略を選択する reasonable

な動機は存在する.確かに,Player 1がPlayer 2の合理的な判断力に疑問を感じ,リスクを避けたいと思う可能性は否定できない.そのような状況を公理に取り込んでゲーム理論を再構築することは可能であり,河野 (2013, [38])において試みている.詳しくは,5節 (48頁)以下を参照されたい.

4.5. 標準形ゲームに対する知見

次に,標準形ゲームについて少々考察してみよう.次の例はNash(1951,[59]. ex.6)に挙げてある例である.この例に対するコメントから察するに彼自身,ナッシュ均衡は複数存在し,その中には必ずしも望ましくない「均衡」が存在する,つまり今でいう「ナッシュ均衡の精緻化」が必要であることを当初から認識していたのではないだろうか.

例 4.5.1. ナッシュの example 6 

この例は2×2の双行列ゲームであって,最も簡単な標準形ゲームの1つである.Player1と Player 2の戦略はそれぞれ,選択肢 α を選択する確率 pα (従って,選択肢 β を選択する確率は 1 − pα), qα で表される.純戦略の組に対する利得はかっこ内の数字の組で表され,左側の数値が Player 1の,右側の数値が Player 2の利得を表している.

Player 2

Player 1

α β

α (1, 1) (0, 0)

β (0, 0) (0, 0)

図 4.5.1 ナッシュの example 6

59理論としてのゲーム理論は現実のゲームとは異なる.しかし,特に展開形ゲームの場合,時間経過を容易に想像できるために,理論から外れた現実感覚に基づく説明を無批判に受け入れてしまう,という誤りを犯している教科書が多い.

60非協力ゲームは 1.3節 (4頁)でも種々議論したように基本的にプレイヤーどうしの情報交換が許されていない.本講義録では公理として明示することはしなかった.

40

Page 45: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

このゲームには次のような 2組の純粋ナッシュ均衡 N1, N2 が存在することが容易にわかる.それぞれのナッシュ均衡に対して,Player 1の期待利得を u1(Nk) ; k = 1, 2,Player 2 のそれを u2(Nk) ; k = 1, 2 とする:

N1 : pN1α = 1, qN1

α = 1. u1(N1) = u2(N1) = 1

N2 : pN2α = 0, qN2

α = 0. u1(N2) = u2(N2) = 0

これらのナッシュ均衡に対する期待利得をよく見ると,ナッシュ均衡 N1 がパレートの意味で(強い意味の)最大元であり,そのことを両者とも認識できるのだから,公理 2.1~公理 2.3 を前提とする限り,定理 3.3.2によって,一意に N1 が選ばれることに疑問の余地はない.ナッシュはひとこと,N2 を “instability” と表現している.理由は述べていないが彼にとっては自明だったのではないだろうか.わざわざ完全均衡ではない,とか「手が震えたら」云々と考えるまでもないことである.

次の例はFudenberg-Tirole(1991, [13] p.21–p.22 Figure 1.11)が論じている例である.

例 4.5.2. Fudenberg-Tiroleの例Player 2

Player 1

α β

α (9, 9) (0, 8)

β (8, 0) (7, 7)

図 4.5.2 Fudenberg-Tiroleの例

この標準形ゲームは例 4.5.1と同様で,ただ数値が異なるだけである.このゲームには次のような 2組の純粋ナッシュ均衡 N1, N2 と 1組の混合ナッシュ均衡 N3 が存在することが容易にわかる.それぞれのナッシュ均衡に対して,Player 1の期待利得をu1(Nk) ; k = 1, 2, 3,Player 2 のそれを u2(Nk) ; k = 1, 2, 3 とする:

N1 : pN1α = 1, qN1

α = 1. u1(N1) = u2(N1) = 9

N2 : pN2α = 0, qN2

α = 0. u1(N2) = u2(N2) = 7

N3 : pN3α = 7/8, qN3

α = 7/8, u1(N3) = u2(N3) = 63/8.

これらのナッシュ均衡に対する期待利得をよく見ると,ナッシュ均衡 N1 がパレートの意味で(強い意味の)最大元であり,そのことを両者とも認識できるのだから,公理2.1~公理 2.3を前提とする限り,定理 3.3.2によって,一意に N1 が選ばれることに疑問の余地はない.たとえば,ゲーム理論の教科書とは思えない伊藤の本 (2012, [24] 96頁の脚注)には,「ある均衡点が他の均衡点を利得支配しているとき,いずれのプレイヤーも前者の均衡点が実現されることで利得が改善されることから,この均衡点が実現されるような戦略を選択するものと考えられる.」と述べているから,我々の定理 3.3.2(26頁)はもはや folk theorem と言っても過言ではない 61.もし,実現できなかったときの「リスク」が気になるなら,改めてMaximin原理を導入した上で分析を進める,と明示すべきであって,それが「理論家」の役割ではないのだろうか.ところが,Fudenberg-Tirole(1991,[13] p.21) は “Is this the most reasonable prediction of how the game will be played?”

61Aumann(1989=1991, [4] 21頁–22頁,例 2.18)は,2 × 2 標準形ゲームの 3つのナッシュ均衡の中でパレートの意味で(強い意味の)最大元でない均衡が選ばれることはありそうにない.と述べているから我々の定理 3.3.2を彼は認識していたと思われる.

41

Page 46: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

と疑問を投げかけている.実はこのゲームでのいわゆるMaximin戦略は pα = qα = 0 なのである.ところが,Player 2がMaximin戦略を採っていることを知らずにPlayer 1が両者にとってベストなナッシュ均衡だと信じてN1を選択すると,結果的に Player 1の期待利得は 0 となってしまう.当然の結果ではあるが,ここで注意する必要があることはMaximin戦略を採用することの必然性は公理 2.1~公理 2.3だけからは導かれないことである.何故ならば,公理 2.1およびその帰結としての「最適応答」と「ナッシュ均衡」という概念には「リスク」の概念が欠落しているからである 62.もちろん現実社会では「リスク」は重要な判断材料であることは論を待たない.し

かし,「理論」としてのゲームの枠組みに前提とされていない判断要因を持ち込むべきではない.結果的に彼らは “we are not certain what outcome to predict” と不可知論に迷い込んでしまうのである.もし,彼らの論理に一貫性があるとするならば,この論理をMyerson(1978, [55] p.77)がナッシュ均衡の精緻化である propernessを導入した例に適用すると,proper なナッシュ均衡もMaximin戦略ではなく,リスクの大きい戦略であるから「合理的」な選択ではないことになる(5節 48頁.河野 2013, [38] 331頁も参照されたい).なお,この例は鹿狩りゲーム(スタグ・ハントゲーム)として古くから知られてい

る例と数値が異なるだけで理論的構造はまったく同一である.「鹿狩りゲーム」と言われる所以や社会学的含意はたとえば,伊藤 (2012, [24] 14頁)を参照されたい.ゲーム理論を社会学に応用する場合は,必ずしも我々の公理 2.1~公理 2.3や定理 3.3.2に拘る必要はないが,どこまでの説明が「理論」であって,どこから先の議論は社会学的認識なのかをもっとはっきりと区別した議論をすべきではなかろうか.この点があいまいなまま,ゲーム理論が世に流布することは,すこし大げさにいえば,「社会科学」という「学問」の発展のためにならないし,その責任の大半はゲーム「理論家」にあるのではないだろうか.何故ならば,論理構造を明らかにするのが「理論家」の役割だからである.

注意 4.4. グレーヴァの本 (2011, [15] 258頁)には Harsanyi-Selten(1988, [21])の risk

dominanceという基準に照らすと,図 4.5.2の標準形ゲームにおける 3つのナッシュ均衡の中でN2を全てのプレイヤーは選ぶべきであることが説明してある.これについて若干コメント(反論)しておきたい.鹿狩りゲームを少し一般化して次のような 2× 2の標準形ゲームを考える.

Player 2

Player 1

α β

α (a, a) (0, b2)

β (b1, 0) (c, c)

一般化した鹿狩りゲームの例

条件 4.5.1. 0 < c ≤ b2 ≤ b1 < a

62彼らは ad hoc にMaximin原理を持ち出しているが,リスクを避けた上での最適な戦略として定義されるMaximin戦略に基づくゲーム理論の試みについては河野 (2013, [38])において,標準形ゲーム一般(双行列ゲーム)に対してMaximin 原理とMaximin戦略を導入し,ナッシュ均衡分析だけではなく,一般的,普遍的にMaximin合理性の視点からの分析が有効であり得ることを示した.本講義録でも 5節 (48頁) 以降にナッシュ均衡戦略とMaximin戦略を同時に考慮したらどのような新しい知見が得られるか,例を通じて種々考察する.

42

Page 47: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

このゲームには次のような 2組の純粋ナッシュ均衡 N1, N2 と 1組の混合ナッシュ均衡 N3 が存在することが容易にわかる.それぞれのナッシュ均衡に対して,Player 1の期待利得を u1(Nk) ; k = 1, 2, 3,Player 2 のそれを u2(Nk) ; k = 1, 2, 3 とする:

N1 : pN1α = 1, qN1

α = 1. u1(N1) = u2(N1) = a

N2 : pN2α = 0, qN2

α = 0. u1(N2) = u2(N2) = c

N3 : pN3α = c/(a− b2 + c), qN3

α = c/(a− b1 + c),

u1(N3) = ac/(a− b1 + c), u2(N3) = ac/(a− b2 + c).

容易にわかるように un(N2) ≤ un(N3) < un(N1) ; n = 1, 2だから定理 3.3.2から両プレイヤーともにナッシュ均衡N1を選好することに異存はない.ところが,グレーヴァの本 (2011, [15] 258頁) では次のように risk dominanceの基準からN2を両プレイヤーともに選択すべきである,という結論を導いている.ここで,N2がN1を risk dominate

する,とは次の関係式が成り立つことをいう.ただし,un(pα, qα) ; n = 1, 2は Player 1

の戦略が pα, Player 2の戦略が qαであるときの Player nの期待利得を表す.

(u1(pN1α , qN1

α )− u1(pN2α , qN1

α ))(u2(pN1α , qN1

α )− u2(pN1α , qN2

α )) <

(u1(pN2α , qN2

α )− u1(pN1α , qN2

α ))(u2(pN2α , qN2

α )− u2(pN2α , qN1

α )).

実際に利得を代入してみると

(a− b1)(a− b2) < c2

となる.直ちにわかるように確かに図 4.5.2のゲームの場合は a = 9, b1 = b2 = 8, c = 7

だからこの不等式は成り立っている 63.しかし,直ちにわかるようにこの不等式は条件 4.5.1を保存したまま逆転させることができる.しかもこの場合の risk dominanceはb1 = b2の場合,両プレイヤー間で利害が必ずしも一致しない.なお,このゲームに対して,我々の公理 2.1~公理 2.3に基づく考察は両プレイヤーの選好順位だけを仮定した条件 4.5.1のみを用いているが,risk dominanceは効用値の差に依存している,つまり,効用に関してももう少し突っ込んだ議論をする必要がある.すこし一般化してみると直ちに破綻するような概念をどうして無批判に持ち込むのだろう.しかし,本講義録 5節48頁で考察するMaximin原理に基づけば,条件 4.5.1の下でMaximin合理性に立つ限りナッシュ均衡N2を両者とも選択する動機を持つことが結論される.

要約すると,同時手番ゲームである標準形ゲームにあっては,定理 3.3.2が適用される場合を除いて複数のナッシュ均衡から 1組のナッシュ均衡を合理的に選択することは難しい.かつ残念ながら興味ある多くの標準形ゲームは定理 3.3.2が適用できない.そのために従来から「ナッシュ均衡の精緻化」問題として多くの研究がなわれている.すべてのナッシュ均衡が必ずしも好ましい性質を備えているわけではないことは当初からナッシュ自身が認識していたことは明らかであるが 64,その後,大きく発展したのは Selten(1965,

[68]; 1975, [69]) の部分ゲーム完全均衡や完全ナッシュ均衡以降のように思われる.すでに多くの先行研究が示しているように,ナッシュ均衡解は本当に合理的選択の結果得ら

63グレーヴァの本 (2011, [15] 258頁)の例でももちろん成り立っている.64彼は論文 (1951, [59])の ex.5(男女の争いゲーム)について 2つの純戦略ナッシュ均衡のうちの一方について,“However empirical tests show a tendency toward (α, α)”と述べている部分を合理的に説明するような一般的な “domain of attraction”というアイディアを得て,あるゲーム理論家の集まりに売り込んで話をさせて貰ったがまったく相手にされなかった.内容は,河野 (2011, [34])で発表して予稿集も残されているはずだが,残念ながら本講義録では紹介できなかった.

43

Page 48: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

れた均衡であろうか,という「合理性 (rationality, reasonableness)」の問題,意思決定の揺らぎに対して均衡が破たんすることはないか,という「安定性 (stability, robustness)」の問題,複数の均衡解が存在する場合,さらに一つに絞る原理は何か,という「均衡選択(equilibrium selection)」の問題等々,さまざまな視点からいわゆるナッシュ均衡の精緻化 (refinement)問題が研究されてきた.ただ,この「精緻化」の問題に関しては,ビンモア (2007=2010, [11] 70頁)は「ゲーム理論の歴史の中で,この精緻化の議論は事実上終っている.ただし,応用経済学者は,どの精緻化の議論が自分の先入観に近いのかをいまだに探求し続けているが.」と皮肉っぽく述べている.一方,Govindan-Wilson(2008, [19]

p.254) には “But so far none has obtained an ideal refinement of the Nash equilibria.”

とあるから,この精緻化の問題に関しても「理論」重視のゲーム理論家と「応用」重視のゲーム理論家とは見解が分かれているのかも知れない 65.本講義録で明らかにしてきたように定理 3.3.2(26頁) が適用できる標準形ゲームは

限られているから,標準形ゲームに対する「ナッシュ均衡の精緻化問題」は応用上の含意は別として数学的興味からの未解決問題は残っているように思われる.しかし,定義3.1が適用できる展開形ゲームに関する「ナッシュ均衡の精緻化問題」は多くの興味ある例に対して定理 3.3.1(25頁)でかたが付くため,理論的興味としてはいささかマニュアックな場合しか残されていない.次節を参照されたい.残されているとしたら,それは「精緻化問題」ではなく,分析の前提としての公理が公理 2.1~公理 2.3だけで十分かどうか,たとえば,5節 (48頁)で議論するような新たな公理としてのMaximin原理の導入等,公理 2.1~公理 2.3を再検討することではないのだろうか. 

4.6. 「新しい定義」の問題点

次の例はMcLennan(1985, [54] p.896)にあるゲームの木であるがGintis(2009=2011,

[18] 264頁「9.11 妥当でない完全均衡」)でも論じられている 66.

例 4.6.1. McLennan の例このゲームでは時刻 t = 0において,「自然」というプレイヤーが選択肢 1または 2を

それぞれ確率 1/2で選び,これらの確率はすべてのプレイヤーの共有知識である 67と仮定している.その後のプレイはゲームの木が示す通りである.Player 1とPlayer 2はそれぞれ頂点 (1.1),(2.1)唯 1点からなる情報集合を 1つだけ持ち,Player 3は頂点 (3.1)

と (3.2)の 2点からなる情報集合 I3を唯 1つ持っており,それぞれの選択肢の集合は 2点集合 {α, β}である.このゲームの問題点はPlayer 1と 2のプレイする順番が「自然」の選択に依存してし

か決まらないことである.たとえば,もし「自然」が選択肢 1を選んだ場合は Player 1

がプレイして,Player 2にはプレイする機会が与えられていない.さらなる問題は,「自然」がどの選択肢を選んだか,そしてPlayer 1がプレイしたのかPlayer 2がプレイした

651988年にはHarsanyi-Selten([21])の大著A General Theory of Equilibrium Selection in Gamesが出版されていて,その 1頁の冒頭に “For any noncooperative game, including noncooperative bargaininggames, our theory always selects one equilibrium point as the solution.”と高らかに宣言しているのだが,認められなかったのだろうか.

66Gintisのゲームは McLennanのそれとは利得表の数値が 1カ所異なっている.67「自然」が選択する確率は戦略ではないから,その意味で「プレイヤー」と呼ぶべきではないのかも知れないが慣習に従った.少なくとも期待利得を表す数式上では区別しない方が分かり易い.「自然」は必ずしも常にゲームの始まりのみに登場するとは限らないが「自然」に属する情報集合は常にただ 1つの頂点からなると仮定する.

44

Page 49: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

のかを知ることなく Player 3はプレイしなければならないことである.

•cccc

ccc

����

���

αpαpβ

β

qαα

qββ

「自然」(0.1)

1

2

1/2

1/2

•�����

bbbbb

rαrβ

α

β

z2 : (3, 0, 2)

z3 : (0, 0, 3)

bbbbb

�����

•Player 1

(1.1)

Player 3

◦ z1 : (2, 0, 0)

������

•(2.1)Player 2

�����

bbbbb

•◦

rαrβ

α

β

z4 : (0, 2, 2)

z5 : (0, 0, 0)bbbbbb◦ z6 : (0, 1, 0)

I3

(3.1)

(3.2)

time : t = 0 t = 1, 2 t = 3

図 4.6.1 McLennan の例

つまり,このままのゲームの木によって表現された展開形ゲームは我々の定義 3.1(20

頁)でいう展開形ゲームに含まれない.何故ならば,各プレイヤーのプレイする順番が決まらないし共有知識にもなっていない.しかし,このゲームの木を仔細に眺めると,Player 1とPlayer 2にとっては互いが先手番か後手番かという関係ではないから,プレイする順番には依存せずに合理的選択が可能である.一方,Player 3にとって自分の選択の合理性は「自然」が選択する確率 1/2のみに依存していてPlayer 1とPlayer 2のプレイする順番とは無関係である.具体的にナッシュ均衡を求めてみると次の 2組であることがわかる.

N1 : pN1α = 0, qN1

α = 1, rN1α = 1. u1(N1) = 3/2, u2(N1) = 1, u3(N1) = 2.

N2 : pN2α = 1, qN2

α = 0, 0 ≤ rN2α ≤ 1/2. u1(N2) = 1, u2(N2) = 1/2, u3(N2) = 0.

このゲームはゲームの木をみれば直ちにわかるように,「自然」が選択したあとのゲーム構造は例 4.3.1(34頁)の市場参入参入ゲーム(信ぴょう性のない脅しゲーム (I))と同じだから,一般に u1(N1) < u1(N2)あるいは,u2(N1) < u2(N2)ということは有り得ない.従って,Player 1とPlayer 2のどちらが先にプレイするかの情報はPlayer 3にとって必要な情報ではなく,すべてのプレイヤーの一致した選好としN1が選択される,と合理的に推論できる(つまり,定理 3.3.1が適用できる).強いて定義 3.1(20頁)に含めたければ,ゲームの木に形式的に(ダミーの)頂点を枝の途中に書き加えて順番を表現してもゲームの本質的構造に変化はないと考えられる.実は欧文誌に投稿した論文では,すべてのプレイヤーのプレイする順番が予め確定す

るようにし,かつゲームの長さをすべて一定となるように,ゲームの木に必要ならばダミーの頂点と枝を付け加えておいた.これによって,プレイすることをスルーされたプレイヤーの場合はダミーの頂点において,1点だけからなる選択肢を確率 1で選択する,という行動戦略を形式的に追加して定式化してあった.たとえば,図 4.1.1(28頁)のゲー

45

Page 50: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ム(Seltenの有名な例)に痕跡を残してある.つまり,Player 1が選択肢αを選択した場合は,Player 2をスルーしてPlayer 3がプレイすることになるが,途中の t = 2のところにダミーの頂点を入れてPlayer 2の情報集合とし,ここでPlayer 2は deterministicにプレイを進める,と仮定してあった.こうすることによって,ゲームの木とゲームの実際のプレイする順番との関係が簡明に表現できる,というメリット 68がある.ただし,ナッシュ均衡の精緻化に関しては違いが生じる可能性はある.たとえば,Gintis(2009=2011,

[18] 259頁)の 9.7節「無関係な節の追加」を参照されたい.しかし,本講義録の定理 3.3.1

(25頁)の適用には影響しない.これらの例を見ても展開形ゲームにおいてナッシュ均衡の精緻化が必ずしもより深い分析,認識を与えたというより,展開形ゲームの研究に無用な混乱をもたらした,という思いを強くするのである.なお付け加えると,結局は不掲載の判定を受けた投稿論文の査読報告には定義 3.1が

想定している展開形ゲームの定義ないし定式化が not clearである,としきりに指摘してあるのだが,従来の標準的ゲーム理論でもゲームの木と展開形ゲームの完全なる対応関係は必ずしも明確ではないように思われる.現在のゲームの木による展開形ゲームの表現はほとんどKuhn(1953, [49])に基づいているが,Kuhnの論文には vN-Mの本の定義との比較が詳細に記されている.ただ,本質的違いがあるのかどうかは判断がつかなかった.しかし,vN-Mの本(2004=2014, [79])108頁の図 10のゲームの木を見ると,同じ情報集合に属する 2つの頂点上の選択肢の枝の数が異なっている.これはKuhn以後のすべての展開形ゲームの仮定に反している.あるプレイヤーの同じ情報集合に属する頂点は当該プレイヤーは区別ができないので当然その情報集合上の選択肢の集合は同一でなくてはならない(従って個数は当然同じ)からである.その後,たとえば Selten(1975,

[69])も改めてゲームの木から展開形ゲームを定義している.ただし,Kuhnと比べて多少新しい概念が導入されているが正確な異同は説明してない.Kreps-Wilson(1982, [47]

p.866)は半順序構造を持つ点集合から出発して展開形ゲームを定義しているから数学的には明確であるが,ゲームの木に表現したとき,Kuhn等のゲームの木と完全に 1対 1に対応しているかどうか定かでない.上記投稿論文では我々の定義 3.1がより明確に理解できるように,展開形ゲームを

表現するゲームの木を必要ならばダミーの頂点と枝を付け加えることによって,当初のvN-Mの本にあるようにプレイの長さを一定であると仮定した.従って,すべてのプレイについて,いつプレイすべきかというプレイする時刻を定義することが出来て,必ず同じ時刻にプレイが終わる.本講義録のゲームの木にすべて timeを記入しているのはそのためである.さらに,多少の制約になるが,定義 3.1を疑問の余地がないように適用させるために,同じ時刻にプレイするプレイヤーは同一人であると仮定した.この仮定に反する例が図 4.6.1のMcLennanのゲームの木なのである.しかしこのように仮定するメリットは情報集合を正確に定義できることである.つまり,1つの情報集合とは同一の時刻を持つ頂点の部分集合のことである.このように情報集合を定義すると,ある種の病理的な展開形ゲームとゲームの木を排除することが出来て,応用上興味あるよく知られた例は殆ど除外されない.しかし,このような再定式化は従来の展開形ゲームの

68実は vN-Mの本のゲームの木は長さが一定であることが大前提になっている.つまりすべてのゲームのプレイする長さは一定であると仮定されている.しかし,Kuhn(1953, [49])ではこの仮定を設けていない.彼も指摘しているように本質的違いが生じるとは思われない.ただし,形式的に情報集合が増えるから,純戦略セットの集合が形式上異なってくる.しかし,集合の要素の個数は同じだから混合戦略空間は数学的に同じ確率空間となり,数学的構造は不変である.

46

Page 51: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

定義に対して本質的な変更を迫るものであるとの意見もあり,従来のよく知られた展開形ゲームに我々の定義 3.1を適用するためには何ら差し障りがないと判断して改めて展開形ゲームを定義しなおすことはしなかった.結局のところ,従来の標準的ゲーム理論の教科書や論文で議論されているゲームの

木および展開形ゲームは視覚的にも意味的にもよく理解できる範囲の展開形ゲームについての研究が主である 69.従って,本講義録でも従来からよく研究されている典型的な展開形ゲームについて我々の定義 3.1が適用可能であることを指摘するに留めて,適用できるゲームの木ないし展開形ゲームの範囲を必要十分な条件を示して定式化することは見送った.投稿した論文に対して not clearだ,という査読報告書の批判は確かに的を得ているがそれは天に唾するものであろう.

69たとえば,展開形ゲームに対するナッシュ均衡の精緻化についての定理の証明を読むと果たして本当に「すべての」展開形ゲームに対して正しい命題なのだろうか,と疑問に思う命題を根拠にした推論で済ませてある場合が多いような気がしてならない.

47

Page 52: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

5. 期待利得最大化原理の再検討ーMaximin原理の立場からー

 vN-Mの本を読むとしばしばMinimax Principle70という言葉が登場する.しかし,

vN-Mの本において意味があるのは,彼らのゲーム理論の対象がゼロサムゲームだからであるということを忘れて以後しばしばこの言葉が引用されている.確かに,自分にとって最悪の場合を想定して,その中で最善の戦略を採用するという考え方は合理的であるし,本講義録でも基本的にこの意味で「Maximin原理」という言葉を用いる.ところが,奇妙なことに,ゼロサムゲームではない一般の非協力ゲームにおいて,このMaximin

原理は正当に評価され用いられてはいないように感じられて,一般の 2人標準形ゲームに対してMaximin原理を定義し,「合理的選択」の根拠にしたゲーム理論の構築を試みたのが論文 (河野 2013, [38])である.この論文のアイディアは実は 5.2節で取り上げるAumann-Maschler(1972, [6])の論文 71の中で取り上げられていた例を見て気が付いたのである.彼らは,標準形ゲームについて,ナッシュ均衡にあるときの期待利得と互いにMaximin戦略を選択した場合の期待利得が一致する例を与えている 72.ところが,彼らも指摘しているように,このゲームについてナッシュ均衡戦略を選択した場合,相手プレイヤーが何らかの理由でナッシュ均衡戦略,すなわち,最適応答をしてくれなかった場合は自己の期待利得がナッシュ均衡で得られるはずの期待利得を下回る可能性がある.ところが,Maximin戦略を選択している場合はMaximin戦略の定義から容易にわかるように,相手が如何なる戦略を選択したとしてMaximin戦略で想定した期待利得を下回ることはない.それならば,何故ナッシュ均衡戦略を選択するのが合理的であると言えるのであろうかと彼らは疑問を呈しているが,残念ながら彼らの論文の主旨はこの問題を解明することではなかったようだ.本節では,Maximin原理を展開形ゲームについても導入して,公理 2.1に代えてMax-

imin原理に基づいて戦略の合理性を判断するとどのような知見が得られるかを検討する.そのために,河野 (2013, [38])で標準形ゲームに対して導入したMaximin戦略を簡単に紹介し,我々の視点からAumann- Maschler(1972, [6] p.57)の論文で取り上げられている展開形ゲームについて再検討してみたい.

議論の筋道を明確にするために取りあえず先に期待利得最大化の原理に代る次の公理を掲げておく.

公理 2.1∗ Maximin原理

リスクをさけて堅実なMaximin戦略を採用することを好むプレイヤーは期待利得最大化原理よりも,この原理を採用する方が合理的であると考えるであろう.例えば,外交戦略のように相手の利得表が分からない場合,自分の利得表だけで決定できるMaximin

戦略の方が合理的である.また行政のようにリスクを冒さないことを求められる場合にも有効であろう.河野 (2013, [38])では,期待利得最大化原理に従ってナッシュ均衡戦略

70表記について:Mini-Max, Max-Min, Maxmin と多少異なる表記をされるが,意味する内容はすべて同じである.自分の立場で考えるか,相手の立場から考えるのかの違いである.

71彼らの論文については,Taylor(1972, [74]), Davis(1974, [12]), Owen(1974, [65]),そして Aumann-Maschler(1974, [7])の反論-再反論,と論争が続いているが,我々の公理 2.3が意識されていないためとゼロサムゲームから出発しているためか,どうも論争の焦点がよく理解できない.

72この事実はある条件下の 2人標準形ゲームに対して一般化できる (河野 2013, [38] 332頁,定理 5).

48

Page 53: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

を追い求めた場合,最悪の結果になる可能性があるチキンゲームに対して双方のプレイヤーがMaximin原理に従ってMaximin戦略を採用した場合,双方の合理的判断として協力行動が実現できることを例証した.

5.1. 標準形ゲームに対するMaximin戦略の定義

河野 (2013, [38])73では 2人標準形ゲームに対してのみMaximin戦略を導入したが,一般 n(≥ 2)人標準形ゲームに対して定義することは容易だから,ここでは人数を限定せず n人標準形ゲームΓ = (N,Sk, uk ; k ∈ N)に対してMaximin戦略を定義する.ここで,N はプレイヤーの集合,Skはプレイヤー k ∈ N の純戦略セット 74.全プレイヤーの混合戦略の直積集合の要素 σ ∈

∏P(Sk) を戦略プロファイルと呼ぶことにする.特

に,プレイヤー kと他のプレイヤーの戦略を別々に記したいときは (σk, σ−k)のように表す.ここで,S−k ≡

∏j =k Sj, σ−k ∈

∏j =k P(Sj)である 75.戦略プロファイル (σk, σ−k)

が全プレイヤーによって選択されたときのプレイヤー kの期待利得を uk(σk, σ−k)で表す.以下,必要な用語ないし概念を列挙しておく.

定義 5.1. 他のプレイヤーの戦略 σ−kに対してプレイヤー kの戦略 σkが

∀τk ∈ P(Sk), uk(σk, σ−k) ≥ uk(τk, σ−k)

を満たすとき, σk は σ−kに対する最適応答戦略である,という.σ−kに対する最適応答戦略の全体を Bk(σ−k)で表す.

定義 5.2. 戦略プロファイルσ∗ = (σ∗1, . . . , σ

∗n)がナッシュ均衡戦略プロファイル(以下単

に「ナッシュ均衡」と呼ぶ)であるとは,すべての k = 1, 2, ..., nに対して σ∗k ∈ Bk(σ

∗−k)

が成り立つときをいう.

同値な定義であるが,ナッシュ均衡を式で表すと,

定義 5.3. 戦略プロファイル σ∗ = (σ∗1, . . . , σ

∗n) がナッシュ均衡であるとは,すべての

k = 1, 2, ..., nに対して

∀τk ∈ P(Sk), uk(σ∗k, σ

∗−k) ≥ uk(τk, σ

∗−k)

が成り立つときをいう.

具体的にあるゲームについて全てのナッシュ均衡戦略プロファイルを定義 5.3から求めることは,プレイヤーの選択肢の集合が 2点集合の場合を除いて,一般的には必ずしも容易ではないが,次の定理がしばしば利用できる.まず,記号を準備する.

σ = (σk, σ−k) ∈∏n

j=1 P(Sj)に対して,

supp{σk} ≡ {s ∈ Sk ; σk(s) > 0}, Mk(σ−k) ≡ {s ∈ Sk ; uk(δs, σ−k) = maxt∈Sk

uk(δt, σ−k)}.

ここで,δ∗ は点 ∗に確率 1を割り当てたいわゆる単位分布で,σk(s)は点 s ∈ Skに割り当てられた σk ∈ P(Sk)の確率を表す.このとき,

73この論文の引用にあたっては,数理社会学会の書面による承諾を頂いている.74以下,Sk は有限集合とする.また,Sk 上の確率空間を P(Sk)と記す.P(Sk)の要素をゲーム理論では混合戦略と呼ぶ.ただし,特に断らない限り,純戦略も混合戦略に含める.完全混合戦略とはすべての純戦略 sk ∈ Sk を正の確率で取る混合戦略のことをいう.

75n ≥ 3の場合は∏

j =k P(Sj)と P(S−k)は一致しないから注意されたい.

49

Page 54: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

定理 5.1.1. σ∗ = (σ∗1, . . . , σ

∗n)がナッシュ均衡であるための必要十分条件は

∀k ∈ N, supp{σ∗k} ⊂ Mk(σ

∗−k)

が成り立つことである.

証明はたとえば,岡田 (2011, [64], 43頁 定理 2.8),河野 (2003, [26] 24頁, 定理 5.4)

あるいは van Damme(1991, [75], p.24 (2.1.12))を参照されたい.

次にMaximin戦略を定義する.強調しておきたいことは,Maximin戦略はナッシュ均衡戦略と違って,他のプレイヤーの利得を具体的に知っている必要はなく 76,自分の利得表だけから自分の意志で選択できるということである,まず,記号を準備する.

vk ≡ maxσk∈P(Sk)

minσ−k∈P(S−k)

uk(σk, σ−k), Mmk ≡ {σm

k ∈ P(Sk) ; vk = minσ−k∈P(S−k)

uk(σmk , σ−k)}.

定義 5.4. σmk ∈ Mm

k をプレイヤー k の Maximin 戦略という.ただし,定義上からはMaximin 戦略は唯一とは限らないが必ず存在する.

注意 5.1. あるプレイヤー kが自分のMaximin戦略を選択してもゲームの結果として vkが得られるわけではない.しかし,他のすべてのプレイヤーも各自のMaximin戦略を選択した場合,ゲームの結果として得られるプレイヤー kの期待利得 v∗k ≡ uk(σ

mk , σ

m−k)は

Maximin戦略の定義から必ず vk ≤ v∗kとなる.河野 (2013, [38])では vk, v∗kをそれぞれプ

レイヤー kの想定値 77,実現値 とよんで区別している. 

注意 5.2. Maximin戦略の定義から容易にわかるように,たとえ他のプレイヤーがMax-

imin戦略を選択していなくても自分さえMaximin戦略を採用していればゲームの結果得られる利得は絶対に自分の想定値を下回ることはない.しかし,ナッシュ均衡戦略の場合,それがMaximin戦略と一致していない場合 78,他のプレイヤーが 1人でもナッシュ均衡戦略を選択しなかった場合,ゲームの結果得られる期待利得が自分の想定値 vkを下回る可能性がある.このようにナッシュ均衡戦略を選択することはリスクを伴うにもかかわらず,Aumann-Maschler(1972, [6])がすでに数値例を与えているように,全員がナッシュ均衡戦略を選択したとしても得られる期待利得と想定値 vkが等しいような標準形ゲームが存在する 79.そのようなゲームの場合,Maximin戦略よりナッシュ均衡戦略の方を選択するのが果たして本当に合理的といえるのであろうか.この問題意識を本講義録では展開形ゲームに対して適用して,新たな視点から検討を加える. 

注意 5.3. 展開形ゲームに標準形ゲームの諸概念を適用する場合,多少の相違がある点を確認しておく必要がある.まず,本講義録を通じて,完全記憶 (perfect recall)を持つ展開形ゲームのみを扱っているから,20頁の脚注でも述べたように,混合戦略に対してではなく,全プレイヤーの行動戦略プロファイルに対してナッシュ均衡戦略を定義することができる.一方Maximin戦略は行動戦略毎に定義できる.スローガン的にいえば,

76つまり,公理 2.2(共有知識の原理)が完全には成り立っていなくてもよい.77岡田 (2011, [64] 35頁)では「マックスミニ値」と呼んでいる.78よく知られているように,ゼロサムゲームの場合これらは一致している.ゲーム理論で,Maximin戦略がすでによく知られている,という誤解はここら辺にあるようだ.河野 (2013, [38])は有限標準形ゲーム一般(2人ゲームの場合に定義しているが,一般化することは容易)にMaximin戦略を定義し,系統的に議論した.

79河野 (2013, [38] 332頁, 定理 5)

50

Page 55: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

当該情報集合に pathが到達したと仮定してその後に起こり得る,自分にとって最悪のケースを想定した上で当該情報集合上での自己の最良の行動戦略として定義できる.ただ,標準形ゲームの場合と違って,一般的に定式化することが難しい(種々のケースがあり,場合分けが面倒)ので,本講義録で扱っている例を参考にして,各自で応用してほしい.

5.2. Aumann-Maschler の例の再検討

Aumann-Maschler(1972, [6])が考察した次のような展開形ゲーム 80はいずれのプレイヤーも 2点集合からなる選択肢の集合をただ 1つ持ち,行動戦略と混合戦略が一致するような極めて単純な展開形ゲームである.にもかかわらず展開形ゲームの問題点が明瞭に現れていると思われるので我々の視点で再検討してみよう.

例 5.2.1. Aumann-Maschlerの例

����

���

QQQQ

QQQ

•「自然」

1

2

p1

p2

α

β

•(1.1)

(0.1)

(2.1)

(2.2)

(2.3)

I2

•���

��

bbbbb

αrα

βrβ

z1 : (3, 3)

z2 : (1, 4)����

��

bbbbbb�����

bbbbb

•◦

α

βrα

z3 : (4, 1)

z4 : (0, 0)

•bbbbb

α

β

rβ◦

z5 : (a1, b1)

z6 : (a2, b2)

Player 1

Player 2

time: t = 0 t = 1 t = 2

図 5.2.1 Aumann-Maschlerのゲームの木

このゲームではまず, time t = 0の時点で「自然」が選択肢を確率 p1で 1 を,確率p2で 2 を選ぶ(ただし,p1 > 0, p2 > 0を仮定する).Player 1は time t = 1の時点で,「自然」が選択肢 1 を選んだときのみプレイすることが出来て,選択肢 αまたは βを選択する.ただし,確率的選択を許す.つまり,αを確率 qαで,βを確率 qβ = 1 − qαで選択することが出来る.次に time t = 2の時点で Player 2がプレイすることを許され,選択肢 αまたは βを選択する.ただし,確率的選択を許す.つまり,αを確率 rαで,β

を確率 rβ = 1 − rαで選択することが出来る.ただし,「自然」が選択する確率 p1, p2はPlayer 1も Player 2も知っているものとする(公理 2.2).また,Player 2の情報集合の意味は,Player 2は「自然」が何を選択したか,Player 1が何を選択したか一切の情報を知ることなく,ただし,Player 1が戦略を選択するのは(プレイするのは)自分より

80ただし,利得表は本講義録の視点を明確にするように変更してある.「自然」の選択についても彼らの例では p1 = 2/3, p2 = 1/3となっている.また,彼らの数値例ではゼロサムゲームとなっているため,問題意識が本講義録とはずれている.

51

Page 56: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

先であることは認識した上で,戦略を決定しなければならないことを表している 81.このゲームの場合,Player 1の戦略は頂点 (1.1)(=Player 1の唯一の情報集合)での行

動戦略で選択肢α を選択する確率 qαで決まり,同様に,Player 2の戦略はPlayer 2の唯一の情報集合 I2 での行動戦略で α を選択する確率 rαで決まるから,Player 1とPlayer

2の戦略はそれぞれ qαと rα で表せる.(qα, rα) を戦略セットとよぶ.つまり,公理 2.3

によって,「自然」が選択をする前に (ただし,確率 p1, p2は事前に与えられており,共有知識となっていることを忘れてはならない) 戦略セット (qα, rα)が決定されて umpire

に通告されていなければならない.戦略セット (qα, rα)に対する Player 1と Player 2の期待利得 u1(qα, rα),u2(qα, rα)は

それぞれ次のように表される.

u1(qα, rα) = p1qα(3rα + rβ) + 4p1qβrα + p2(a1rα + a2rβ),

u2(qα, rα) = rα(3p1qα + p1qβ + b1p2) + rβ(4p1qα + b2p2).

従って,戦略セット (qNα , rN

α ) がNash均衡戦略であるための必要十分条件を定義 5.3

に従って書き下すと次の式が得られる.(i) 0 ≤ ∀qα ≤ 1 に対して,

u1(qNα , rNα )− u1(qα, r

Nα ) = p1(q

Nα − qα)(2r

Nα + 1) + 4p1rα(q

Nβ − qβ)

= p1(qNα − qα)(−2rNα + 1) ≥ 0. (5.1)

この条件式は p1 > 0, b1, b2 には依存していないことに注意されたい.(ii) 0 ≤ ∀rα ≤ 1 に対して,

u2(qNα , rNα )− u2(q

Nα , rα) = (rNα − rα)(3p1q

Nα + p1q

Nβ + p2b1) + (rNβ − rβ)(4p1q

Nα + p2b2)

= (rNα − rα)f(qNα ) ≥ 0. (5.2)

ここで,f(x) ≡ −2p1x+ p1 + p2(b1 − b2) (5.3)

条件不等式 (5.1)を見れば分かる通り,Player 1にとって,ナッシュ均衡戦略を求めるための自分に関する最適応答戦略は「自然」が選択肢 2 を選択した場合に関係する利得 a1, a2, b1, b2は全く影響しない.実際,Player 1の選択は「自然」が 1を選択した場合にのみ可能であり,Player 1に

とっては頂点 (1.1)に達したときのゲームである次のようなゲームの木で表される展開形ゲームであると理解できるからである.このゲームはいわゆるチキンゲームと呼ばれているタイプのゲームで次のような 2組の純粋ナッシュ均衡 N1, N2 と 1組の混合ナッシュ均衡 N3 が存在することが容易にわかる.それぞれのナッシュ均衡に対して,Player

1が頂点 (1.1)で仮想的に想定する期待利得を u(1.1)1 (Nk) ; k = 1, 2, 3とする.

81Player 2が,Player 1がプレイをした後にプレイする,という表現をすると,そのことは「自然」が選択肢 1 を選択したことを意味しているから Player 2は「自然」が選択肢 1 を選択したことを知ってしまう.従って,各プレイヤーがいつプレイするべきか,というプレイする順序を明示した説明の仕方をした.ゲームの木はいつ各プレイヤーがプレイすべきかを表しており,そのことはすべてのプレイヤーの共有知識である.time を明示したくなければ,umpire が各プレイヤーにプレイすべき時を告げねばならない.展開形ゲームの場合,公理 2.3(戦略の事前選択の原理)を担保するために umpireを置いておく,と考える方が理解し易い.

52

Page 57: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

N1 : qN1α = 0, rN1

α = 1. u(1.1)1 (N1) = 4,

N2 : qN2α = 1, rN2

α = 0. u(1.1)1 (N2) = 1,

N3 : qN3α = 1/2, rN3

α = 1/2, u(1.1)1 (N3) = 2.

α

β

•(1.1)

(2.1)

(2.2)

I2

•���

��

bbbbb

αrα

β

z1 : (3, 3)

z2 : (1, 4)����

��

bbbbbb�����

bbbbb

•◦

αqαqβ

β

z3 : (4, 1)

z4 : (0, 0)

Player 1

Player 2

time: t = 1 t = 2

図 5.2.1∗. Player 1が理解するゲームの木

しかしながら,このような理解の仕方は根本的に間違っている.Aumann-Maschlerの論文では様々に検討され,その後,反論 (Tayler 1972, [74]),再反論 (Aumann-Maschler

1974, [7])と混乱した議論が繰り返された理由は,我々の公理 2.3(戦略の事前選択の原理)を無視しているからである.また,Player 2から見た場合,Player 2の理解するゲームはあくまで図 5.2.1 のゲームであって,図 5.2.1∗ のゲームではない.この時点で公理2.2の共有知識の公理が満たされていないからそもそもナッシュ均衡を定義すること自体が無意味である.最後に図 5.2.1のゲームについて,ナッシュ均衡をすべて求めてみよう.無限個のナッ

シュ均衡戦略セットが現れるのは限られた場合であり 82,ナッシュ均衡戦略セットが有限個となるのは次の場合に限られる.

1. Case 1. f(1) > 0 の場合.つまり,p1 < p2(b1 − b2)の場合.次のような純戦略ナッシュ均衡戦略セットN1 : (qN1

α , rN1α )がただ一つが存在する.

N1 : qN1α = 0, rN1

α = 1

この時の各プレイヤーの期待利得はu1(N1) ≡ u1(q

N1α , rN1

α ) = 4p1 + p2a1, u2(N1) ≡ u2(qN1α , rN1

α ) = p1 + p2b1

2. Case 2. f(0) < 0 の場合.つまり,p2(b1 − b2) < −p1の場合.次のような純戦略ナッシュ均衡戦略セットN2 : (qN2

α , rN2α )がただ一つが存在する.

N2 : qN2α = 1, rN2

α = 0

この時の各プレイヤーの期待利得はu1(N2) ≡ u1(q

N2α , rN2

α ) = p1 + p2a2, u2(N2) ≡ u2(qN2α , rN2

α ) = 4p1 + p2b2

3. Case 3. f(1) < 0 < f(0) の場合.つまり,−p1 < p2(b1 − b2) < p1の場合.Case

1とCase 2の場合と同じ純戦略ナッシュ均衡戦略セット 2つと次のような混合ナッシュ

82どのような場合か各自でチェックされたい.

53

Page 58: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

均衡戦略セットN3が存在する.すなわち,N1 : qN1

α = 0, rN1α = 1

u1(N1) = 4p1 + p2a1, u2(N1) = p1 + p2b1N2 : qN2

α = 1, rN2α = 0

u1(N2) = p1 + p2a2, u2(N2) = 4p1 + p2b2さらに,0 < qN3

α < 1の範囲で f(qN3α ) = 0を満たす解が存在して混合ナッシュ均衡

N3 : qN3α = 1/2 + p2(b1 − b2)/p1, rN3

α = 1/2

が存在する.この時の各プレイヤーの期待利得はu1(N3) = 2p1 + p2(a1 + a2)/2, u2(N3) = 2p1 + p2(2b1 − b2)

である.

検討.まず第 1に気づくことは上記の場合分けは完全にPlayer 2の利得 b1, b2によって左右されるということである.このことは,Aumann-Maschler も指摘しているように,Player 1から見て納得できない.何故ならば,Player 1は「自然」が選択した結果を知る立場にいるからである.つまり,Player 1が選択できるのは「自然」が 1を選択した場合のみであって,その時点ではすでに b1, b2はゲームの結果とは無関係であることが分かっているからである.第 2に,複数のナッシュ均衡が存在する case 3の場合,Player 1は,定義 3.1に従って優先的意思決定権があることを自他ともに認識している以上,Player 1が選択する頂点 (1.1)においてナッシュ均衡N1が最適であるにも拘わらず,Player 2はゲームの木のルールによってそのことを認識できない.Aumann-Maschler の混乱の原因は Player 1が頂点 (1.1)に達した時点で改めてあれこれ戦略を検討するからであって,我々の公理 2.3と定義 3.1に従って,time t = 0の時点で意思決定しなければならないことを確認すれば何ら混乱はないのである.結局,Aumann-Maschler 論文の最大の意義は,従来の標準的ゲーム理論で殆ど自明

な前提とされていた期待利得最大化の原理 (公理 2.1)と共有知識の原理 (公理 2.2)の他に戦略の事前選択の原理(公理 2.3)が必要である,ということを我々に認識させてくれたことではないだろうか.

ところで,従来の標準的ゲーム理論の根幹である期待利得最大化原理と共有知識の原理の完全履行を求めるいわゆる「完全合理性」が強すぎる前提であるとするならばどのような方向に改善すべきであろうか.この「完全合理性」の仮定をゆるめる「限定合理性」を目指す試みは従来から繰り返されている.本講義録ではその一つの可能性としてすでに河野 (2013, [38])で導入したMaximin原理 83に基づく公理 2.1∗を用いた分析例を紹介,検討し新たなゲーム理論の可能性を探りたい 84.

まず手始めに Aumann-Maschlerの例,図 5.2.1のゲームに対してMaximin戦略を求めてみよう.すでに指摘したようにMaximin戦略は各情報集合上の行動戦略に対して定義される.この例であれば Player 1の頂点 (1.1)における想定値 v

(1.1)1 とMaximin

戦略 qm(1.1)α ,Player 2の情報集合 I2上の想定値 vI22 とMaximin戦略 rmI2

α を求める必要

83河野 (2013, [38])では,Maximin原理に基づく合理性を「Maximin合理性」と呼んでいる.それに対して,従来のゲーム理論の枠内でナッシュ均衡を分析の中心にすえる考え方を「ナッシュ合理性」と呼んで区別している.

84Maximin戦略を原理として前提に加えたゲーム理論の構築は河野 (2013, [38])によって試みられてはいるがまだ十分成熟した理論にはなっていない.本講義録の考察と共に,従来の「標準的」ゲーム理論のさらなる再検討が切に望まれる.

54

Page 59: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

がある 85.Player 1の頂点 (1.1)における期待利得 u(1.1)1 (qα, rα)は u1(qα, rα)において,

p1 = 1, p2 = 0とおいた値だから,

u(1.1)1 (qα, rα) = qα(3rα + rβ) + 4qβrα = rα(−qα + 4) + rβqα

従って 86,Player 1の頂点 (1.1)における想定値 v(1.1)1 は

v(1.1)1 = max

0≤qα≤1{(−qα + 4) ∧ qα} = max

0≤qα≤1qα = 1 : 故に qm(1.1)

α = 1.

Player 2の情報集合 I2における期待利得 uI22 (qα, rα)は新しい情報を得ることなくプレイ

するわけだから,u2(qα, rα)と同じである.従って,Player 2の情報集合 I2における想定値 vI22 は

vI22 = max0≤rα≤1

min0≤qα≤1

u2(qα, rα)

= max0≤rα≤1

min0≤qα≤1

{qα(3p1rα + 4p1rβ) + qβp1rα + p2(b1rα + b2rβ)}

= max0≤rα≤1

{p1(−rα + 4) ∧ p1rα + p2(b1 − b2)rα}+ p2b2

= max0≤rα≤1

{f(0)rα}+ p2b2, ただし,f(x)は式 5.3で定義されている.

結局,Player 2のMaximin戦略はPlayer 1と違って,p1, b1, b2に依存して決まることがわかる.数学的には 3通りに分かれるが,ここでは f(0) > 0の場合を考えてみよう.この場合,Maximin戦略は rmI2

α = 1,想定値は vI22 = p1 + p2b1となる.ここで,Player 1

もPlayer 2も公理 2.1∗に従っていることが共有知識になっている(つまり,公理 2.2が満たされている)としよう.このとき,Player 1もPlayer 2もMaximin合理性に基づいてMaximin戦略を採用するわけだから,Player 1の利得は

u1(qm(1.1)α , rmI2

α ) = 3p1 + p2a1(≡ u1(M)とおく),

Player 2の利得は

u2(qm(1.1)α , rmI2

α ) = 3p1 + p2b1(≡ u2(M)とおく)87

となる.f(0) > 0はもとの展開形ゲームの Case 1または Case 3の場合だから,rN1α =

rmI2α であり,u2(N1) < u2(M)となるから,Player 2にとってはナッシュ合理性に立つより,Maximin合理性に立った方がベターではないだろうか.一方,Player 1にとっては,Aumann-Maschlerがあれこれ思い悩むように,ゲームの構造を本当にPlayer 2が公理 2.1~公理 2.3と定義 3.1を完全に理解してくれていて,自分が優先的意思決定権を行使することを認識してくれているだろうか,と不安に思うのは尤もである.それならリスクを伴わないMaximin合理性の立場に立つ方が合理的だ,と考えるのも尤もではなかろうか.

85このゲームの例では各プレイヤーは 1つの情報集合しか持たないから,いちいち情報集合を特定する必要はないのであるが,一般化した場合のことを考えてあえて情報集合を明示した.

86ここで,良く知られた記号 a ∧ b ≡ min{a, b}, a ∨ b ≡ max{a, b} を用いる.なお,図 5.2.1のゲームの木を眺めれば直ちに分かることではあるが,利得を一般的に記号で表したとき,想定値が自明に求められるわけではない.従来の標準的ゲーム理論の教科書では殆どの例が数値例であるためにその場限りの推論で満足してしまい,一般的な条件の下での数学的推論を行う力が身につかないと常日頃思っているので本講義録では自明に思える例でも直ちに一般化できる推論の仕方を心がけた.

87u1(M)と u2(M)を河野 (2013, [38])では,「実現値」と呼んだ.ナッシュ合理性の立場に立つ限り,「実現値」は「均衡」ではないから,この状態を「Maximin均衡」と呼ぶべきではない.

55

Page 60: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

このゲームの例は従来自明の前提と思われていた公理,特に公理 2.1の期待利得最大化の原理に疑問を投げかけ,ゼロサムゲームではない一般の非協力ゲームにMaximin原理が適用できることの妥当性を認識させるきっかけになったパイオニア的論文である.次節において,より積極的にMaximin原理の妥当性を示す展開形ゲーム(いわゆる「信ぴょう性のない脅しゲーム」)について検討してみよう.

5.3. 信ぴょう性のない脅しゲーム (II)とMaximin原理

本節で再び取り上げるゲームは例 4.4.1(37頁)で取り上げた不完全情報をもつ「信ぴょう性のない脅しゲーム (II)」である 88.

α

β

γ

•(1.1)I2

•����

bbbbb

α

β

z1 : (a1, b1)

z2 : (a2, b2)��

���

bbbbbb�����

bbbbb

•◦

α

β

z3 : (a3, b3)

z4 : (a4, b4)

Player 1

Player 2

(2.1)

(2.2)

time: t = 1 t = 2

図 4.4.1: 信ぴょう性のない脅しゲーム (II)

JJJJJJJJJJ◦ z5 : (a5, b5)

本節でも 4.4.1節と同じ次の 2つのナッシュ均衡N1, N2が存在しているという仮定の下に考察を進める.

仮定 4.4.1 N1: pN1 = (pN1

α , pN1β , 0)

仮定 4.4.2 N2: pN2 = (0, 0, 1).

ただし,Player 2のナッシュ均衡戦略 qN について,ここでは何も仮定しない.

なお,仮定 4.4.1,仮定 4.4.2の下では注意 3.3で指摘したように u1(N2) ≤ u1(N1)が成り立っているが,本節ではさらに,

仮定 5.3.1. u1(N2) < u1(N1)

 を仮定する.

4.4節ですでに述べたように仮定 5.3.1の下で,公理 2.1~公理 2.3と定義 3.1に基づいて合理的に選択する限り,定理 3.3.1によって,プレイヤー全員がナッシュ均衡N1を選択するはずであるということはすでに指摘した.従って,たとえ u2(N1) < u2(N2) = b5の場合であって,Player 2が qN2を選択したくともそれはPlayer 1に対する「信ぴょう性のない脅し」である,といわれているのである.

88本節は河野 (2013, [37])で発表した内容の一部である.

56

Page 61: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

しかし,仮定 5.3.1の下で,いついかなる場合でもPlayer 2の qN2は「信ぴょう性のない脅し」なのだろうか?という疑問が本節の問題意識である.本節において,利得 (ak, bk) ; k = 1, . . . , 5に関する一定の条件の下に,Player 2にも

積極的にMaximin原理(公理 2.1∗)に従ってMaximin戦略を採用する動機があり,さらに Player 1が仮定 5.3.1を認識している場合,両プレイヤー共に reasonable な選択の結果としてMaximin 戦略と一致しているナッシュ均衡 N2が実現される,という意味において Player 2の(Maimin戦略を採用するぞという)「脅し」89は信ぴょう性がある,ということを例証する.

以下では仮定 4.4.1,仮定 4.4.2および仮定 5.3.1が満たされるように利得 (ak, bk) ; k =

1, . . . , 5に次のような条件を課して考察を進める.

条件 5.3.1. (A-1) : a2 ∨ a3 ∨ a4 ∨ a5 < a1. (A-2) : a2 ∨ a4 < a5.

条件 5.3.2. b2 < b1.

条件 5.3.3. b3 < b4 ≤ b2 < b1.

条件 5.3.4. b3 < b4 < b2 < b1 < b5. 

まず,これらの条件と仮定との関係を明らかにしよう 90.

補題 5.3.1. 条件 5.3.1と条件 5.3.2の下で次のようなナッシュ均衡が存在する.

N1 : pN1 = (1, 0, 0), qN1 = (1, 0). u1(N1) = a1, u2(N1) = b1.

N2 : pN2 = (0, 0, 1), qN2 = (qN2α , qN2

β ). u1(N2) = a5, u2(N2) = b5.

ただし,a3 ≤ a4 ならば 0 ≤ qN2α ≤ (a5 − a2)/(a1 − a2).a3 > a4 ならば 0 ≤ qN2

α ≤(a5 − a2)/(a1 − a2) ∧ (a5 − a4)/(a3 − a4).

証明. Player 1については選択肢の集合が3点集合だから,定理5.1.1を適用し,Player2については選択肢の集合が 2点のみからなるので,ナッシュ均衡戦略であるための定義式,定義 5.3を直接チェックすることによって求められる.純戦略セットがナッシュ均衡戦略であることは定義式に当てはめてみれば容易にわかるが,混合戦略まで含めてナッシュ均衡戦略セットの組を残らず求めるためには慎重に場合分けをしてチェックする必要がある.これも多くのゲーム理論の教科書では,特に展開形ゲームの場合に混合戦略を省略してある場合があるので注意を要する.展開形ゲームの場合,ナッシュ均衡の経路上にない (off the equilibrium path, ギボンズ [16], 178頁)情報集合上のナッシュ均衡行動戦略をすべて求めるためにはきっちりと定義式ないし定理から導出しなければなら

89もちろん,前述したように非協力ゲームにおいてはプレイヤー相互で communicationを取ることはないから,現実に「脅す」ことは出来ない.あくまで比喩的表現である.59頁の脚注を参照されたい.

90従来の多くのゲーム理論の教科書や論文でさえ理論的説明を数値を用いた例で説明している場合が多いことにいつもフラストレーションを感じている.というのは,数値例からの考察ではそもそも数学的証明になっていない上,理論的な適用限界やどのような条件が理論の成立に本質的に関わっているかが見えてこないからである.実際,4.1.1節 (28頁)でも指摘したように,ナッシュ均衡の基になっている「最適応答」という概念は,混合戦略ないし行動戦略の空間(距離空間)上で不連続的に変化する(たとえば,ジャンケンゲームの場合,ナッシュ均衡戦略は 3つの手を等しい確率で出すことであるが,相手がほんの少しパーを出す確率が高いということが分かったときの最適応答は確率 1でチョキをだすことである).つまり,数値をほんの少し違えただけでナッシュ均衡ががらりと変わる可能性はあるのである.

57

Page 62: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ない 91.

次にMaximin 戦略を求める.Player 1に関しては頂点 (1.1)のみが情報集合だから標準形ゲームの場合と全く同様に定義できる.定義を書き下すと

v1 = maxp

minq{qα(a1pα + a3pβ) + qβ(a2pα + a4pβ) + a5pγ}

= maxp

{((a1pα + a3pβ) ∧ (a2pα + a4pβ)) + a5pγ}

であるが,条件 5.3.1を考慮するとmaximin戦略 pm は pm = (0, 0, 1) = pN2 で v1 = a5であることが容易に分かる.

Player 2のMaximin 戦略については情報集合 I2についてのみ求めればよいが,この情報集合は 2つの頂点,(2.1),(2.2)を含んでいるから,標準形ゲームの場合とは異なり若干の変更が必要である.パスが情報集合 I2に到達したと仮定したときのPlayer 2の期待利得 uI2

2 (µ, q) を次のように定義する.

uI22 (µ, q) = µ1(b1qα + b2qβ) + µ2(b3qα + b4qβ).

ここで,µ = (µ1, µ2) は SI21 ≡ {α, β} ⊂ S1 上の確率分布の集合P(SI2

1 ) の要素である92.

このとき,情報集合 I2上の想定値 vI22 とMaximin戦略 qmは次のように定義される.

vI22 ≡ maxq∈P(S2)

minµ∈P(S

I21 )

uI22 (µ, q), MI2

2 ≡ {qm ∈ P(S2) ; vI22 = min

µ∈P(SI21 )

uI22 (µ, q

m)}.

従って,vI22 = max

qminµ

{µ1(b1qα + b2qβ) + µ2(b3qα + b4qβ)}

= max0≤qα≤1

ℓ1(qα) ∧ ℓ2(qα).

ここで,ℓ1(qα) = (b1 − b2)qα + b2, ℓ2(qα) = (b3 − b4)qα + b4.

定義 5.5. qm ∈ MI22 を Player 2の,情報集合 I2 におけるMaximin戦略という.ただ

し,定義上からはMaximin 戦略は唯一とは限らないが必ず存在する.なお,このゲームの例ではPlayer 2の情報集合は I2 のみであるから,以後単にPlayer

2のMaximin 戦略という.

注意 5.4. 上記の定義からも分かる通り,ナッシュ均衡戦略はすべてのプレイヤーの利得表を知っていないと求められないのに対して,Maximin 戦略は自己の利得表のみを知っていれば求められるという点でも極めて現実的であり,かつリスクを伴わない安全な戦略であるという点でも妥当な戦略である 93.

91経路上にない均衡戦略を純戦略だけで済ませている教科書が如何に多いことか.なお,pN33 < 1 を満

たす第3のナッシュ均衡戦略(混合戦略)が存在する可能性はある.しかし,注意 3.3のところで注意したように必ず a5 = u1(N2) ≤ u1(N3) となる.さらに,条件 5.3.1の (A-1) から u1(N3) < a1 = u1(N1)となるから,以降の議論に影響しない.

92Player 2の,情報集合 I2 上の信念 (belief)と見なすことが出来る.ただし,完全ベイジアン均衡に登場するそれとは役割が異なる.

93相手の利得に関する不確かな情報をプレイヤーの「タイプ」を導入することによって完備情報ゲームとして定式化したベイジアンゲーム (Harsanyi, 1967-68, [20])のナッシュ均衡戦略とは原理的に異なるrationalityである.

58

Page 63: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ここで,Player 2のMaximin 戦略 qm が条件 5.3.3の下で qN2 の純戦略 (0, 1) と一致することを確認する.

補題 5.3.2. 条件 5.3.3の下で,vI22 = b4,Maximin 戦略 qm は qm = (0, 1) である.

証明. 2つの線分 {(qα, ℓ1(qα)) ; 0 ≤ qα ≤ 1} と {(qα, ℓ2(qα)) ; 0 ≤ qα ≤ 1} のグラフを描いて見ると容易に分かる.

以下,条件 5.3.1と条件 5.3.4を仮定して考察してみよう.注意 5.4 で指摘したようにリスクを伴わないMaximin戦略を選択することには一定の妥当性があるから,Player 1

がナッシュ均衡戦略を採用し,Player 2がMaximin戦略を選択した時の各プレイヤーの期待利得を比較してみる.なお,pm は pN2 と一致し,qm は N2 に含まれる純戦略であることに注意されたい.

u1(pN1 , qm) = a2 < v1 = u1(p

m, qm) = u1(pN2 , qm) = u1(N2) = a5 < u1(N1) = a1.

vI2 = b4 < u2(pN1 , qm) = b2 < u2(p

m, qm) = u2(pN2 , qm) = u2(N2) = b5.

ここで,Player 2がリスク回避的性格の持ち主であることが周知の事実であるとしよう 94.Player 2にとってはリスクを避けることが第 1の関心事であり,Player 1はPlayer

2 がMaximin 戦略 qmを選択する可能性があることを推測できる.ここで,Player 1がナッシュ均衡戦略 pN1 をプレイした場合のPlayer 2の期待利得は b2で.想定値の vI22 = b4よりましである.一方,Player 1にとっては pN1 を選択すると,u1(p

N1 , qm) = a2 しか得られず,u1(N1) = a1 は勿論,u1(N2) = a5すら得られず最悪である.従って,よりましな pN2 = pmつまり u1(N2) = a5 を選択する方が betterであるという判断をする動機が生じる.結果的に Player 2は利得 u2(N2) = b5が得られると合理的に予想できる.

最後に条件 5.3.4 の下では,u2(N1) < u2(N2) = b5が満たされて,Player 2にとって最も望ましい結果が u2(N2) = b5 となるから,Player 2が qm を積極的に選択する動機が生じる.かつ,そのことをPlayer 1も認識できる(公理 2.2,共有知識の原理).つまり「脅し」は信ぴょう性を帯びてくるのである.従って,Player 1としてもMaximin 戦略 pm = (0, 0, 1) = pN2 を採用せざるを得ない.このゲームの場合,後手番の Player 2

がMaximin 戦略を選択することによって,先手番のPlayer 1もMaximin 戦略を選択せざるを得ない,という新たな知見が得られたのである.

結論

従来のナッシュ均衡分析だけからは,理論として(現実の人間心理は別として)先手番のPlayer 1が期待利得最大化原理により,自己の期待利得を最大化するナッシュ均衡を選び,共有知識の原理により,Player 2はその結果を予測出来て,自己の期待利得最大化のためにPlayer 1の選択を受け入れざるを得ないという意味で展開形ゲームでは常に先手番のプレイヤーに主導権がある,ということを我々は定理 3.3.1(25頁)で示

94D.M.クレプス (1990=2000, [46], 5章,1つの均衡が選ばれるとき,それは何に基づくかについて)はプレイヤーが必ずしも理論的前提に従ってプレイするとは限らない理由,原因を「慣習」や「文化的背景」(109頁)に求めているが,理論としてのゲーム理論に取り入れることは出来ない.それに反して本講義録のMaximin原理(公理 2.1∗)は期待利得最大化原理(公理 2.1)とは別の原理を分析概念として理論に導入する試みである.個別のゲームについて,ケースバイケースに付け足す説明ではなく,一般的,普遍的原理から導出することができれば「信ぴょう性がない」と言われなくて済むのではなかろうか.

59

Page 64: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

した 95.しかし,新たにMaximin 原理を分析概念として導入することにより,必ずしも先手番のプレイヤーが主導権を握るとは限らないゲームが存在する,ということを我々は主張しているのである 96.

注意 5.5. クレプス (1990=2000, [46]. 116頁の図 5.4(b) および 192頁の図 6.7 97)にある例は仮定 4.4.1,仮定 4.4.2,仮定 5.3.1を満たしているが,条件 5.3.4を満たしていない.つまり,Player 2のMaximin 戦略が qm = (0, 1) ではなく, qm = (1/2, 1/2) である.しかし,u1(p

N1 , qm) = −7/2 < u1(N2) = 2 であるからやはり Player 2のMaximin 戦略は Player 1にとっては信ぴょう性のある「脅し」となる.しかし,クレプス,116頁(↑ 6)には,Player 2が qN2 を選ぶことは「通常,信憑性がないとされます」との説明があり,qN1 を選ぶのが妥当である理由を縷々説明しているが,最終的に,Player 1の選択肢 γが選択肢 βを支配していることを援用している,つまり,Player 2はPlayer 1が選択肢 βを選ぶことは有り得ないことが合理的に推測できるはずだ,ということを用いている.しかし,本講義録で繰り返し強調しているように,仮定 4.4.1,仮定 4.4.2,仮定5.3.1 さえ満たされている限り,さらに同時手番ゲームである標準形ゲームとは異なり,展開形ゲームが逐次手番ゲームであること(定義 3.1)さえ認めれば,従来のゲーム理論の枠内で,Player 1がまず最初に期待利得最大化原理によってナッシュ均衡 N1 を選択し,共有知識の原理によりPlayer 2もそのことを合理的に推測できるから,最適応答としてPlayer 2もナッシュ均衡 N1 を選ぶのが reasonable であるという結論(定理 3.3.1)は導かれるのである.また,ヒープ・ファロファキス (1995=1998, [22], 142頁, 図 3.9)

の例も同様である.

注意 5.6. 本節でとりあげた例は,Maximin原理に基づくゲーム理論の再構築を試みた河野 (2013, [38])の論文では取り上げなかった例である.期待利得最大化原理とMaximin

原理を融合させたゲーム分析はまだ十分研究されていないように思われる.理論的,現実的に検討すべき課題は多々あると思われる.多くの研究者に関心を持ってもらいたいと切に願うものである.

なお,本節の議論は展開形ゲームを対象にしているのであるが,ナッシュの交渉問題でナッシュ(1953, [60])が導入した negotiation process における threatsの概念と何らかの関連がありそうに思うのであるが,まだ解明されていない.詳しくはHouba-BoltのCredible Threats in Negotiations. A Game-theoretic Approach(2002, [23]) を参照されたい.

5.4. ナッシュ合理性 vs.Maximin合理性

前節ではプレイヤーどうしが期待利得最大化原理(公理 2.1)に従うのか,Maximin

原理(公理 2.1∗)に従うのか予め決めて議論した.本節では各プレイヤーがどちらの原理に従うのかを選択肢として戦略の中に取り込み,2 × 2の標準形ゲームとして定式化して標準的ゲーム理論の枠内,つまり期待利得最大化原理(公理 2.1)の下でMaximin

戦略を選択することが合理的かどうかを検討する.なお,本節で用いる記号は特に断ら

95ただし,Player 1に最大期待利得を与えるナッシュ均衡戦略が複数個ある場合は別途考察しなければならない.つまりナッシュ均衡の精緻化が必要である.

96この主張を内外の 3つの学術誌に投稿してみたが,残念ながら理解して貰えなかった.詳しくは「あとがきにかえて」(70頁)を参照されたい.

97これら 2つのゲームはまったく同じ数値例であるが,説明が異なる.

60

Page 65: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ない限りすべて前節と同じ意味である.最初に本節における 2× 2標準形ゲームの枠組みを説明する.両プレイヤーの選択肢

はともに期待利得最大化原理(公理 2.1)に従う(選択肢 I)か,Maximin原理(公理2.1∗)に従う(選択肢 I∗)かの 2択である.Player 1が選択肢 Iを選択し,Player 2が同じく選択肢 Iを選択した場合,前節の結果では,Player 1はナッシュ均衡戦略 pN1を選択し,Player 2はその戦略に対する最適応答である qN1 を選択する.その時の各プレイヤーの利得は u1(N1) = a1, u2(N1) = b1である.同様に,Player 1が選択肢 Iを選択し,Player 2が選択肢 I∗を選択した場合,Player 1はナッシュ均衡戦略 pN1を選択するが,Player 2はMaximin原理(公理 2.1∗)に従って,qmを選択すると考えられる.その時の各プレイヤーの利得は u1(p

N1 , qm) = a2,u2(pN1 , qm) = b2である.さらに,

Player 1が選択肢 I∗を選択した場合,Player 1の選択肢は pm = pN2と考えられるから,Player 2の選択肢にかかわらない利得を得る.すなわち,u1(p

m, qN1) = u1(pN2 , qN1) =

u1(N2) = a5,u2(pm, qN1) = u2(p

N2 , qN1) = u2(N2) = b5.u1(pm, qm) = u1(p

N2 , qm) =

u1(N2) = a5,u2(pm, qm) = u2(p

N2 , qm) = u2(N2) = b5.

以上の結果を通常の 2× 2の双行列ゲームで表現すると次のように表される.

Player 2

Player 1

I I∗

I (a1, b1) (a2, b2)

I∗ (a5, b5) (a5, b5)

ここで,4.5節(40頁)と同様に,Player 1の戦略は選択肢 Iを選択する確率 p1,選択肢 I∗を選択する確率 p2 = 1 − p1で表す.同様に Player 2の戦略は選択肢 Iを選択する確率 q1,選択肢 I∗を選択する確率 q2 = 1− q1で表す.Player 1の戦略が p1,Player 2

の戦略が q1のときの Player 1,2の期待利得 u1(p1, q1),u2(p1, q1)は

u1(p1, q1) = p1(a1q1 + a2q2) + a5p2,u2(p1, q1) = p1(b1q1 + b2q2) + b5p2

である.

さて,前節から引き継いだ条件は a2 < a5 < a1と b2 < b1 < b5であったから,この条件の下でこのゲームのナッシュ均衡は次の 2組N1とN2であることが容易にわかる.

N1 : pN11 = 1, qN1

1 = 1. u1(N1) = a1, u2(N1) = b1,

N2 : pN21 = 0, 0 ≤ qN2

1 ≤ (a5 − a2)/(a1 − a2), u1(N2) = a5, u2(N2) = b5.

この分析結果を眺めると,確かに両プレイヤーがともにMaximin原理を採用する(p1 = 0, q1 = 0)戦略セットがナッシュ均衡になっている,という意味で合理性があることがわかる.ただし,これら2つのナッシュ均衡にはナッシュ均衡の精緻化の観点からの問題はある.

つまり,N2は完全ナッシュ均衡ではない.実際,Player 1の手が少 「々震えて」(Selten,

1975 [69]) p1 = ϵ > 0だったとしよう.そのときのPlayer 2の最適応答は容易にわかるように q1 = 1である.しかし,この議論には欠陥があることはすでに 4.1.1節 (28頁)で述べた.つまりこのとき,Player 1の利得は u1(ϵ, 0) = a5− ϵ(a5−a2) < a5だから,できるだけ手の「震え」は抑える必要があり,Player 2の利得は u2(ϵ, 0) = b5 − ϵ(b5 − b2) > b1

61

Page 66: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

(ただし,ϵは十分小さいとする)だから,Player 2にとって慌てて qN11 = 1にスイッチ

する動機はないのである.なお,両プレイヤーが共にMaximin戦略を採用した場合,必ずしも一般的にナッシュ

均衡の 1つと一致するとは限らないことはすでに河野 (2013, [38])でチキンゲームの場合に示した.チキンゲームの場合,両プレイヤーのMaximin戦略は共に「協力」を選択することであるが,この場合はナッシュ均衡ではなく,相手がMaximin戦略を確実に採用することが推測されるならば自分は「非協力」を選択するのが最適応答であり,かつ結果として一番望ましいナッシュ均衡が実現する.従って,Maximin 原理(公理 2.1∗)をあえて導入する理由は,従来の標準的ゲーム理論における公理 2.1~公理 2.3が強すぎる仮定である(完全合理性)という批判に対して現実の人間行動とも親和性があり,ゲーム理論の大前提として「理論」に取り入れることが可能な「原理」としてMaximin原理を提案し,種々検討を加えてきたのである.まだ,検討すべきことは多々ある 98がこの方面に興味のある研究者に問題提起することが本講義録のひとつの大きな目的でもあることをここに強調しておきたい.すでに 4.5節(40頁)でも指摘したが,個別のゲームについてリスク回避的感覚を引き合いに出してあれこれ議論するのではなく,Maximin

原理に基づく公理 2.1∗を分析手段として正面から「理論」に導入すればたとえば,伊藤(2012, [24])のように折角経済学の分野以外でもゲーム理論を活用しようとしている意欲的研究者が単なる「鹿狩りゲーム」という物語の紹介に終わってしまうことなく,「法哲学」という本題にMaximin原理を活用することは可能だったのではないだろうか.その機会を逃してしまったのは残念である.「理論家」に責任の一端はあるのではなかろうか.

5.5. 超ナッシュ均衡について

前節までの議論では期待利得最大化原理(公理 2.1,ナッシュ合理性)とMaximin原理(公理 2.1∗,Maximin合理性)をどちらかといえば対立的,二者択一的概念として扱ってきた.本節では両者のコラボレーションともいうべき協力関係もあり得るという例を紹介する 99.

Aumann-Maschler(1972, [6])は 1つの 2 × 2双行列ゲームについて,両プレイヤーとも唯一の混合ナッシュ均衡戦略セットを選択した場合に得られる期待利得が,ともにMaximin戦略を採用した時に得られる期待利得に等しい例を示して,その場合はリスクのないMaximin戦略を採用する方がリスクのあるナッシュ均衡戦略より合理的な選択ではないのだろうか,と問題提起している.彼らの例は双行列ゲーム一般に,一定の条件下で成立する現象であることが証明されている 100.本節では Aumann-Maschler Paradoxが発生している 2 × 2双行列ゲームについて,

Player 1がナッシュ均衡戦略を選択し,Player 2がMaximin戦略を選択した場合,Player1は,双方がナッシュ均衡戦略セットを選択した場合より大きい期待利得が得られ,Player2はそれでも自身の戦略を変更する動機を持たないゲームが存在することを証明する.

98たとえば,河野 (2015, [41])では期待利得最大化原理とMaximin原理をプレイヤーのタイプであるとみなし,チキンゲームをベイジアンゲームの枠組みで分析した.その結果,期待利得最大化原理の立場に立つべきか,Maximin原理の立場に立つべきか,チキンゲームの混合戦略と同じ確率分布で選択するのが合理的である,という知見を得た.一般に 2つの原理をプレイヤーのタイプとみなしてベイジアンゲームの枠組みで考察した場合の成果についてはまだ十分な蓄積は得られていない.

99本節は河野 (2015, [42])の報告要旨に基づいている.100河野 2013, [38] 定理 5.この現象を Aumann-Maschler Paradoxと名付けた.

62

Page 67: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

♡ 定式化

次のような 2× 2双行列ゲーム を考察する.

Player 2

Player 1

α β

α (a1, b1) (a2, b2)

β (a3, b3) (a4, b4)

ここで,Player 1の戦略は選択肢 α をとる確率 pα, β をとる確率 pβ = 1− pαによって一意に表される.同様にPlayer 2の戦略をそれぞれ qα, qβ = 1− qαで表す.このとき,両プレイヤーの戦略セットを (pα, qα)で表し,各々の期待利得を u1(pα, qα), u2(pα, qα)で表す.すなわち,

u1(pα, qα) = a1pαqα + a2pαqβ + a3pβqα + a4pβqβ,

u2(pα, qα) = b1pαqα + b2pαqβ + b3pβqα + b4pβqβ,

本節では両プレイヤーの利得に次のような 2つの条件を課す.条件 5.5.1はナッシュ均衡が混合戦略ただ 1つしかないための十分条件である.条件 5.5.2は同じくMaximin

戦略が混合戦略ただ 1つしかないための十分条件である.

条件 5.5.1. (N-a) a3 < a1, a2 < a4 (N-b) b1 < b2, b4 < b3

条件 5.5.2. (M-a) a2 < a1, a3 < a4 (M-b) b4 < b2, b1 < b3

補題 5.5.1. 条件 5.5.1の下で,ナッシュ均衡戦略セットは次のような混合戦略セット(pNα , q

Nα ) に限る.

(1) pNα = (b3 − b4)/B, ただし,B = b2 + b3 − b1 − b4.

(2) qNα = (a4 − a2)/A, ただし,A = a1 + a4 − a2 − a3.

補題 5.5.2. 条件 5.5.2の下で,Player 1, 2の想定値 v1, v2とMaximin 戦略 pmα , qmα は次

の通りである.

(1) v1 = (a1a4 − a2a3)/A, pmα = (a4 − a3)/A,

(2) v2 = (b2b3 − b1b4)/B, qmα = (b2 − b4)/B.

補題 5.5.3. 条件 5.5.1と条件 5.5.2の下で次の関係式が成り立つ.

(1) v1 = u1(pmα , q

mα ) = u1(p

Nα , q

Nα ) = u1(p

mα , q

Nα ) = u1(pα, q

Nα )

= u1(pmα , qα) 0 ≤ ∀pα ≤ 1, 0 ≤ ∀qα ≤ 1.

(2) v2 = u2(pmα , q

mα ) = u2(p

Nα , q

Nα ) = u2(p

Nα , q

mα ) = u2(p

Nα , qα)

= u2(pα, qmα ) 0 ≤ ∀pα ≤ 1, 0 ≤ ∀qα ≤ 1.

なお,補題5.5.3は混合戦略がただ1つのナッシュ均衡戦略セットであり,かつMaximin

戦略もまた混合戦略ただ 1つである場合に一般的に成り立つことが知られている (河野2013, [38] 定理 5).

63

Page 68: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ここで,補題 5.5.3をよく見ると,u1(pNα , q

mα )と u2(p

mα , q

Nα ) についての関係式だけが

ないことに気が付く.その関係式が次の定理である.

定理 5.5.1. 条件 5.5.1と条件 5.5.2 の下に,次の関係式が成り立つ.

(v1 − u1(pNα , q

mα ))/A = −(v2 − u2(p

mα , q

Nα ))/B = (pNα − pmα )(q

Nα − qmα )

定理 5.5.1の含意.定理 5.5.1と同じ条件の下で,さらに (∗) ; (pNα − pmα )(qNα − qmα ) < 0を

仮定する(> 0 の場合はPlayer 1 と 2 の役割を逆にする).このとき,Player 1がナッシュ均衡戦略セット pNα を選択し,Player 2がMaximin戦略 qmα を選択した場合,Player

1はナッシュ均衡戦略セットで得られる期待利得 v1 より大きい利得が期待でき,かつPlayer 2は pNα に対する最適応答は qNα であるが,Maximin 戦略 qmα でも同じ期待利得v2が得られてかつ,ナッシュ均衡戦略はリスクを伴うのに対して,Maximin 戦略は相手の戦略如何に関わらず同じ期待利得が得られるから,あえて戦略 qmα を変更する動機をまったく持たない.その上,Player 1と対称な戦略,(pmα , q

Nα )は Player 2にとっては

却って期待利得の減少を招くから,戦略セット (pNα , qmα )は均衡状態であることが認識で

きる.つまり,Player 2が (pmα , qNα ) を求める理由がない,どちらのプレイヤーの立場か

らみても戦略セット (pNα , qmα )を変更する動機を持たない,という意味で一種の均衡状態

が得られる.

♡ 我々はこの場合,戦略セット (pNα , qmα ) を 超ナッシュ均衡戦略セット と呼びたい.

注意 5.7. よく知られているように,ゼロサムゲームの場合は必ず pNα = pmα , qNα = qmα と

なるから,仮定 (∗)が成り立たない.なお,2× 2双行列ゲーム以外の一般の標準形ゲームに対しても超ナッシュ均衡現象が起こり得るのかどうかは未解明である.

 数値例

Player 2

Player 1

α β

α (1,−1) (0, 0)

β (0, 0) (2,−1)

pNα = 1/2, qNα = 2/3, pmα = 2/3, qmα = 1/2.従って,

v1 = 2/3, u1(pNα , q

mα ) = 3/4, v2 = −1/2, u2(p

Nα , q

mα ) = −1/2, u2(p

mα , q

Nα ) = −5/9

だから,Player 1の利得関係は,

v1 = u1(pmα , q

mα ) = u1(p

mα , q

Nα ) = u1(p

Nα , q

Nα ) = 2/3 < 3/4 = u1(p

Nα , q

mα )

であるのに対して,Player 2の利得関係は,

u2(pmα , q

Nα ) = −5/9 < −1/2 = v2 = u2(p

mα , q

mα ) = u2(p

Nα , q

mα ) = u2(p

Nα , q

Nα )

となって,Player 1がナッシュ均衡戦略を選択し,Player 2がMaximin戦略を選択する戦略セット (pNα , q

mα )はPlayer 1にとってはナッシュ均衡より大きい期待利得が期待でき

て,Player 2にとってはナッシュ均衡と同じ期待利得が期待でき,かつ互いにこれ以上戦略を変更する動機を持たない状態が実現している,という意味で公理 2.1~公理 2.3が

64

Page 69: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

満たされている均衡状態が得られている.

補題はナッシュ均衡戦略やMaximin戦略の定義から容易に導けるが読者の手間を省くために簡単に証明の筋道を述べておく.

補題 5.5.1の証明.戦略セット (pNα , q

Nα )がナッシュ均衡戦略セットであるための定義を書き直すと,選

択肢の集合が 2点集合だという特性を利用すると次のように書き直せる.

(1) 0 ≤ ∀ pα ≤ 1, u1(pNα , q

Nα )− u1(pα, q

Nα ) = (pNα − pα)(Aq

Nα + a2 − a4) ≥ 0,

(2) 0 ≤ ∀ qα ≤ 1, u2(pNα , q

Nα )− u2(p

Nα , qα) = (qNα − qα)(−BpNα + b3 − b4) ≥ 0 .

これらの不等式から,条件 5.5.1の下では純戦略の範囲ではナッシュ均衡戦略セットは存在しないことが分かる.混合ナッシュ均衡戦略セットは (1),(2) の左辺が恒等的にゼロとなる場合である.

補題 5.5.2の証明.想定値とMaximin戦略の定義を具体的に書き下すと,

v1 = max0≤pα≤1

min0≤qα≤1

u1(pα, qα)

= max0≤pα≤1

{((a1 − a3)pα + a3) ∧ ((a2 − a4)pα + a4)} (ただし,a ∧ b = min{a, b})

= max0≤pα≤1

{ℓ1(pα) ∧ ℓ2(pα)}, (ℓ1(pα) ≡ (a1 − a3)pα + a3, ℓ2(pα) ≡ (a2 − a4)pα + a4)

= (a1a4 − a2a3)/A when pmα = (a4 − a3)/A.

v2 = max0≤qα≤1

min0≤pα≤1

u2(pα, qα)

= max0≤qα≤1

{((b1 − b2)qα + b2) ∧ ((b3 − b4)qα + b4)}

= max0≤qα≤1

{ℓ3(qα) ∧ ℓ4(qα)}, (ℓ3(qα) ≡ (b1 − b2)qα + b2, ℓ4(qα) ≡ (b3 − b4)qα + b4)

= (b2b3 − b1b4)/B when qmα = (b2 − b4)/B.

HHHHHHHH��������

a4

a3

a1

a2

pmα

ℓ2(pα)

ℓ1(pα)

0 1

HHHHHHHH��������

b2

b4

b3

b1

qmα

ℓ3(qα)

ℓ4(qα)

0 1

  補題 5.5.3は河野 2013, [38]定理 5(332頁)で一般的に証明されている.もちろん直接計算して確かめるのも容易である.また,定理 5.5.1は単純に計算すれば得られる.

以上の通り,幾つかの例について,期待利得最大化原理(公理 2.1)に代って,あるいは併せてMaximin原理(公理 2.1∗)をゲーム理論の「理論的」枠組みに組み込んで分析することの有効性を例証してきたつもりである.もとより,いまだ十分検証されたとは言い難い状態である.もっと複雑で意味のある展開形ゲームたとえばシグナリングゲームやベイジアンゲームについても多少の考察はしたのであるが 101,本講義録では取101河野 2014, [40] および 2015, [41]

65

Page 70: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

り上げることができなかった.この方面に興味を持たれた読者には是非さらなる検討をして頂きたいと切に願うものである.

参考文献

[1] Aumann, R. J.: Subjectivity and Correlation in Randomized Strategies. Journal of

Mathematical Economics 1(1974), 67–96.

[2] ————-: Agreeing to Disagree. The Annals of Statistics 4(61) (1976), 1236–1239.

[3] ————: Correlated Equilibrium as an Expression of Bayesian Rationality. Econo-

metrica 55(1)(1987), 1–18.

[4] ————: Lectures on Game Theory.(Westview Press, 1989)丸山徹・立石寛訳ゲーム論の基礎 (勁草書房, 1991).

[5] ————: Backward Induction and Common Knowledge of Rationality. Game and

Economic Behavior. 8(1995), 6–19.

[6] Aumann, R. J. and M. Maschler: Some Thoughts on the Minimax Principle. Man-

agement Science 18(5)(1972), 54–63.

[7] —————: Response to Taylor’s “Resolution of a Paradox: Mini-Max Rehabili-

tated.” Management Science 20(9)(1974), 1316.

[8] Basu, K.: Strategic Irrationality in Extensive Games. Mathematical Social Sci-

ences15(1988), 247–260.

[9] ————: On the Non-Existence of a Rationality Definition for Extensive Games.

International Journal of Game Theory. 19(1990), 33-44.

[10] Binmore, K.: A Note on Backward Induction. Games and Economic Behavior

17(1996), 135–137.

[11] ————–: Game Theory: a very short introduction. (Oxford University Press,

2007) 海野道郎・金澤悠介訳 ゲーム理論 (岩波書店, 2010).

[12] Davis, M.: Some Further Thoughts on the Minimax Principle. Management Science

20(9)(1974), 1305–1310.

[13] Fudenberg, D. and J. Tirole: Game Theory. (The MIT Press, 1991).

[14] 船木由喜彦: ゲーム理論講義. (新世社, 2012).

[15] グレーヴァ香子: 非協力ゲーム理論 数理経済学叢書 1 (知泉書館, 2011).

[16] Gibbons, R.: Game Theory for Applied Economists.(Princeton University Press,

1992). 福田正夫・須田伸一訳 経済学のためのゲーム理論入門, (創文社, 1996).

[17] Gintis, H.: The Local Best Response Criterion: An Epistemic Approach to Equilib-

rium Refinement. Journal of Economic Behavior & Organization. 71(2009), 89–97.

[18] ————-: The Bounds of Reason. (Princeton University Press, 2009) 成田悠輔他訳 ゲーム理論による社会科学の統合 (NTT出版, 2011).

[19] Govindan, S. and Wilson, R. B.: Nash Equilibrium, Refinement of. Blume, L.E.

and S.N. Durlauf(eds.) , Game Theory. (Palgrave Macmillan, 2008) 240–255.

[20] Harsanyi, J. C.: Games with Incomplete Information Played by “Bayesian” Players.

I-III. Management Science, 14(1967), 159–182, 14 (1968), 320–334. 14(1968), 486–

502.

66

Page 71: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

[21] Harsanyi, J. C. and R. Selten: A General Theory of Equilibrium Selection in Games.

(The MIT Press, 1988).

[22] Heap, S. P. H. and Y. Varoufakis: Game Theory: a Critical Inroduction. (Routledge,

1995). 荻沼 隆訳 ゲーム理論 [批判的入門] (多賀出版, 1998).

[23] Houba, H. and W. Bolt: Credible Threats in Negotiations: A Game Theoretic Ap-

proach. (Kluwer Academic Publishers, 2002).

[24] 伊藤泰: ゲーム理論と法哲学(新基礎法学叢書 2)(成文堂 2012).

[25] Kohlberg, E. and J-F. Mertens: On the Strategic Stability of Equilibria. Economet-

rica, 54(1986), 1003–1037.

[26] 河野敬雄: ゲーム理論アラカルト―確率論の立場から―. Rokko Lectures in Mathe-

matics, 13.(神戸大学, 2003). http://www.math.kobe-u.ac.jp/ home-j/rokko.html

[27] ————: 愚か者の合理性 人環フォーラム 京都大学大学院人間・環境学研究科13(2003), 48–51.

[28] ————: Nash equilibria of randomly stopped repeated Prisoner’s Dilemma.

T.Tokimasa et al.(Eds), Applied Economic Informatics and Systems Sciences.

31(2005), 81-93. (Series of Monographs and Advanced Studies Produced by Hi-

roshima Shudo University).

[29] ————: A Formal Theory of Triads Based on Non-Cooperative Games. S.Hiraki

et al.(Eds), Systems Sciences for Economics and Informatics. 39(2007), 1-16. (Se-

ries of Monographs and Advanced Studies Produced by Hiroshima Shudo Univer-

sity).

[30] ————: Noncooperative Game in Cooperation: Reformulation of Correlated

Equilibria. The Kyoto Economic Review 77(2)(2008), 107–125.

[31] ————: Noncooperative Game in Cooperation: Reformulation of Correlated

Equilibria (II). The Kyoto Economic Review 78(1)(2009), 1–18.

[32] ————: ゲーム理論アラカルト(続)―確率論の立場から― .Rokko Lectures

in Mathematics, 21.(神戸大学, 2011).http://www.math.kobe-u.ac.jp/ home-

j/rokko.html

[33] ————: Evolutionarily Stable Strategies Based on Bayesian Games.

Scientiae Mathematicae Japonicae 73(1)(2011), 41–58: e-2010, 553-570.

http://www.jams.or.jp/notice/scmjol/

[34] ————: ナッシュ均衡の精緻化 ― A New Approach ―.第 52回数理社会学会自由報告. (信州大学,2011.9).

[35] ————: ゲーム理論再考 ― 協力ゲームと非協力ゲームは異なる出自のゲーム理論である ―.第 54回数理社会学会萌芽的セッション報告. (関東学院大学,2012.8).

[36] ————: 自明なゲームをどう理解するべきか ― ナッシュ均衡に代る合理的選択基準 ―.第 55回数理社会学会自由報告. (東北学院大学,2013.3).

[37] ————: 展開形ゲーム再考 ― ナッシュ均衡戦略を一意に決定する原理について―.第 56回数理社会学会自由報告. (関西学院大学,2013.8).

[38] ————: Maximin原理に基づくゲーム理論構築の試み.理論と方法 (数理社会学会機関誌) 28(2013), 319–336.

67

Page 72: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

[39] ————: Nash Equilibrium vs. Maximin Strategy – Extensive Game Revisited – .

確率論シンポジウム. (数理解析研究所講究録 1855,2013), 82–103.

[40] ————: シグナリング・ゲーム再考 ― Maxiimin合理性の立場から ―.第 57回数理社会学会萌芽的セッション報告. (山形大学,2014.3).

[41] ————: Nash合理性 vs. Maximin合理性 ― チキンゲームの場合 ―.第 59回数理社会学会自由報告. (久留米大学,2015.3).

[42] ————: 超ナッシュ均衡について ― ナッシュ合理性とMaximin合理性のコラボレーション.第 60回数理社会学会自由報告. (大阪経済大学,2015.8).

[43] ————: 後向き帰納法再考 ― 部分ゲーム完全均衡は真に妥当な均衡概念か?―.第 61回数理社会学会自由報告. (上智大学,2016.3).

[44] ————: 展開形ゲームの新しい定義とその帰結.理論と方法.(数理社会学会機関誌)31(1)(2016), 138–150.

[45] ————: 公理的確率論の立場から見たゲーム理論の問題点.数理解析研究所講究録 2030(2017).

[46] Kreps, D.M.: Game Theory and Economic Modelling. (Oxford University Press,

1990). 高森寛他訳 ゲーム理論と経済学 (東洋経済新報社, 2000).

[47] Kreps, D. M. and R. Wilson: Sequential Equilibria. Econometrica 50(4)(1982),

863–894.

[48] Kuhn, H. W.: Extensive Games. Proceedings of the National Academy of Scienes,

U.S.A. 36(1950), 570–76.

[49] ——————: Extensive Games and the Problem of Information. Khun, H. W. and

A. W. Tucker(eds). Contributions to the Theory of Games II, (Princeton University

Press, 1953) 193–216.

[50] Khun, H. W. and A. W. Tucker(eds): Contributions to the Theory of Games II,

(Princeton University Press, 1953).

[51] Laplace, P. S.: Essai Philosophique sur les Probabilites. (1814,初版)内井惣七訳 確率の哲学的試論 (岩波文庫青 925-1, 1997). 

[52] Luce, R. D. and H. Raiffa: Games and Decisions: Introduction and Critical Survey.

(John Wiley & Sons, Inc. New York, 1957).

[53] Luce, R. D. and A. W. Tucker(eds.): Contributions to the Theory of Games IV. (

Princeton University Press, 1959).

[54] McLennan, A.: Justifiable Beliefs in Sequential Equilibrium. Econometrica

53(1985), 889–904.

[55] Myerson, R. B.: Refinements of the Nash Equilibrium Concept. International Jour-

nal of Game Theory 7(2)(1978), 73–80.

[56] ———— : Nash Equilibrium and the History of Economic Theory. Journal of

Economic Literature. .XXXVII,(1999), 1067-1082.

[57] Nash, J. F.: Equilibrium Points in n-Person Games. Proceedings of the National

Academy of Sciences, U.S.A. 36(1950), 48–49.

[58] ———— : The Bargaining Problem. Econometrica. 18(2)(1950), 155–162.

68

Page 73: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

[59] ———— : Non-cooperative Games. Annals of Mathematics 54(1951), 286–295.

[60] ———— : Two-Person Cooperative Games. Econometrica. 21(1)(1953), 128–140.

[61] ———— : Essays on Game Theory. (E. Elgar , 1996).

[62] 大浦宏邦: 社会科学者のための進化ゲーム理論:基礎から応用まで. (勁草書房, 2008).

[63] 岡田 章: ゲーム理論・入門 ー 人間社会の理解のためにー.(有斐閣, 2008).

[64] ——— : ゲーム理論(新版).(有斐閣, 2011).

[65] Owen, G.: A Discussion of Mimimax. Management Science 20(9)(1974), 1316–

1317.

[66] Poundstone, W.: Prisoner’s Dilemma. (Doubleday, 1992) 松浦俊輔他訳 囚人のジレンマ―フォン・ノイマンとゲームの理論 (青土社, 1995).

[67] 佐藤 嘉倫: ゲーム理論ー人間と社会の複雑な関係を解くー. (新曜社, 2008).

[68] Selten, R.: Spieltheoretische Behandlung eines Oligopolmodells mit Nachfraget-

ragheit. Zeitschrift fur die Gesamte Staatswissenschaft 12(1965), 301–324.

[69] ———— : Reexamination of the Perfectness Concept for Equilibrium Points in

Extensive Games. International Journal of Game Theory 4(1975), 25–55.

[70] Sen, A. K.: Collective Choice and Social Welfare. (Holden-Day, 1970) 志田基与師監訳 集合的選択と社会的厚生.(勁草書房, 2000).

[71] Shubik, M.: Perfect or Robust Non-cooperative Equilibrium: A Search for the Pi-

losopher’s Stone? Aumann, J. et al.(eds) Essays in Game Theory and Mathematical

Economics in Honor of Oskar Morgenstern.. (Bibliographisches Institut, 1981).

[72] 鈴木光男: 新ゲーム理論.(勁草書房, 1994).

[73] ————: ゲーム理論の世界.(勁草書房, 1999).

[74] Taylor, P. T.: Resolution of a Paradox: Mini-Max Rehabilitated. Management

Science 19 (1972), 466–467.

[75] van Damme, E.: Stability and Perfection of Nash Equilibria. Second, Revised and

Enlarged Edition. (Springer-Verlag, 1991).

[76] Vega-Redondo, F. : Economics and the Theory of Games. (Cambridge University

Press, 2003).

[77] von Neumann, J.: Zur Theories der Gesellschaftsspiele. Mathematische An-

nalen, 100(1928), 295–320. English translation by S. Bergmann in R.D.Luce and

A.W.Tucker, eds., Contributions to the Theory of Games, IV (Princeton University

Press, 1959), 13–42.

[78] von Neumann, J. and O. Morgenstern. Theory of Games and Economic Behavior,

3rd ed. (Princeton University Press. [1944]1953). 阿部修一, 橋本和美訳 ゲームの理論と経済行動 I, II, III. (筑摩書房, 2009. ちくま学芸文庫).

[79] ——————: Theory of Games and Economic Behavior. Sixtieth-Anniversary

Edition. (Princeton University Press. 2004). 武藤滋夫訳 ゲームの理論と経済行動刊行 60周年記念版.(勁草書房, 2014).

[80] Weibull, J. W.: Evolutionary Game Theory. (The MIT Press. 1995). 大和瀬達二監訳,三澤哲也 (他)訳 進化ゲームの理論.(文化書房博文社, 1998).

69

Page 74: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

―あとがきにかえて―

(I) 「序にかえて」でも触れたが,本講義録の 3.1節(19頁),3.2節(22頁),3.3

(25頁),4.1.1節(28頁)と 5.3節(56頁)の結果を国際的に有名なゲーム理論の雑誌に投稿したが見事に desk reject されて査読にも回して貰えなかった.co-editor のコメントは下記の通りであった.⋆以下は私のコメント(反論)である.(以上)

You propose an approach to game theory that solves the equilibrium se-

lection problem, about much has been written, by letting the first player

decide which Nash equilibrium to choose, and justify this by means of ex-

amples. In addition, you make a number of assumptions without further

justification, for example assigning fixed times to players’ decisions, which

cannot take account of situations where the players do not know their order of

play. You also need to make your paper self-contained without referring your

own previous articles in Japanese, which are inaccessible to most readers.

⋆ 1. 展開形ゲームが動学ゲームであって(ギボンズ 1992, [16])時間発展を表していることは周知の事実だと思われる.私は投稿論文でも new definition として定義 3.1(20頁)でそのことを明示した.察するに,Nash equilibriumの refinementの問題ないし一意選択の問題 (equilibrium selection problem)は今までに山のように論文が出ていて,今さら無名の新人の提案などに興味はない,主張の根拠が簡単すぎて何かは暗黙の内に仮定しているに違いないがそれ以上考える気がしない,ということではなかったろうか.実は私自身驚いているのであるが,展開形ゲームについて,順序構造を保存するように,従来の標準的ゲーム理論の理解,認識を変更して考察してみたら,殆ど自明に展開形ゲームに関しては equilibrium selection problemの問題が解決してしまったのである.“a number

of assumptions without further justification” とあるが,我々の定義 3.1 (20頁)で特徴づけられる展開形ゲームに対して成り立つ定理 3.3.1(25頁)は further justification無しに公理 2.1(期待利得最大化原理)のみで成立するのである.ところが,たとえばHarsanyi-

Selten(1988, [21])の risk dominanceは従来の標準的ゲーム理論の大前提である公理 2.1

とは両立しないにもかかわらず何故 further justificationが要求されないのだろうか 102.もし,投稿論文の論拠が不十分ないしおかしいと感じるならば,では従来の標準的

ゲーム理論では展開形ゲームをどう認識しているのか,その論拠を反省してみるよい機会だったのではないだろうか.せめて複数の査読者の意見を聞いてほしかったと思うのだが,実はこの後でも縷々説明するように,日本の大学の経済系の欧文学術雑誌へ投稿した際も,複数の査読者から結局同様の指摘を受けた.しかし,細かくチェックしてみるとそこに従来の標準的ゲーム理論の問題点も逆に浮き彫りにされてくるような気がする.以下順を追って説明したい.

2.日本語の論文を引用するな,という最後の指摘は「ご尤も」なのだが,もちろんそのことは意識していたのでMaximin戦略はきちんと定義して引用論文中の定理等は一切用いてはいない.ただ,こういう言いがかりをつけられるから本来学術論文はすべて英語で書くしかない,というのは悲しいかな日本の置かれた現状だ.因みに数学のオリ102risuk dominanceの定義自体は公理的に導出されている.しかし,結論が公理 2.1から自然に導かれる payoff dominance(標準形ゲームに対する定理 3.3.2, 26頁)とは両立しない以上,直感的説明ではないfurther justificationが必要であるという意味である.なお,risk dominanceについては注意 4.4(42頁)も参照されたい.

70

Page 75: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ジナルな結果は原則英語で発表するが,査読の共通了解として英語表現には(意味が通る限り)コメントしないし,された経験もない.以前イギリスの雑誌にゲーム理論の論文(繰り返し囚人のジレンマのナッシュ均衡の数学的定式化と TFT戦略がナッシュ均衡であることの厳密に数学的な証明について)を投稿したら,1年もかかってもどって来た査読報告書には,そんなに「ソフィスティケイト」に考えなくてもこうすれば証明できる,と極めて直感的な「証明」を示されて rejectされたが,最後のダメ押しは英語表現に問題がある,という指摘だった 103.(以上)

それで思い出すのが,メイナード=スミス 104のことである.彼はESS(進化的安定戦略)という新しい均衡概念(標準形ゲーム理論におけるナッシュ均衡の 1つの精緻化,必ずしも常に存在するとは限らない)を導入して生物界に大きな貢献をし,その後経済学等にも逆輸入された進化ゲームの理論は最近の標準的ゲーム理論の教科書でも必ずと言ってよいほど1章をさいて解説してある.ところで,文献を読んでいるとたまにメイナード=スミス・プライスによって導入された ESSは,,,という記述に出くわし不思議に思っていた.確かに最初の論文はNature 1973,vol.246,p.15–p.18.に載っている J.

Maynard=Smith and G.R. Priceの “The Logic of Animal Conflict”という論文がいわゆるオリジナルな論文であることがわかる.実は(これはメイナード=スミス自身の回想だったと思うが)この論文は原論文の投稿者が Priceで査読者がMaynard=Smithだったらしい.ところが,投稿論文がその雑誌の定める制限紙数を超えていた上に(にもかかわらず desk rejectされなかったのは編集担当者が投稿論文に何らかの意義を認めて査読に回したのだろう)内容が not clearであったために結局投稿者とやり取りして共著ということになったらしい.このような場合,ある段階で編集委員会が投稿者に査読者の名前を公開する.その後,Priceは事情があったらしく研究生活から遠ざかり,メイナード=スミスがアイディアを発展させて今日の進化ゲームの隆盛を招いたわけで,確かにメイナード=スミスの功績は大きいのだが,「一将功なりて万骨枯る」という感じがしないでもない(このことはすでに河野(2011, [32] 2頁)で述べた).研究者の宿命だろう.実は私にも経験があって,私が査読者で私も名前は知っていたあるアメリカの数学者の投稿論文の査読を頼まれて,内容を少し改良して採択可の報告をしたところ,投稿者の方から共著にしたい,との申し出があり,編集委員会が認めて直接やりとりをして結局共著の論文になった.ただ,余計なことをしないで単純に acceptの報告をしておけば良かったなと若干の後悔はある.いまだに直接会ったことはない.

(II) 次に,友人のゲーム理論家のアドバイスも受けて他の海外の雑誌に投稿することも検討したが,英語と米語を混用してはならない等数学の論文しか海外に投稿した経験のない私には到底語学力が及ばないので諦めて,英語表現についてもチェックしてくれる国内の大学の経済学系の欧文誌に投稿した.しかし.これは 2人の査読者から以下のようなコメントを頂いて結局 acceptされなかった.投稿論文が不採択となった場合は査読報告書のコメントに対する弁明の機会が与えられないのでここで私の言い分を述べておきたい.なお,公平を期すため査読報告書もほぼ全文をそのまま引用させて頂く.

(II-1) 第 1の査読報告書の要旨と私の反論

103やむなく河野 (2005, [28])に発表させて貰った.104彼は進化ゲームに関する業績で 2001年の京都賞を受賞した.京都会館で行われた講演会には私のところにも招待券が来たので院生とともに聴きに行った.

71

Page 76: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

Although the motivation in Section 2105 is good, the approach is quite

unclear for readers. Section 2 is motivated by refinement or selection of ap-

propriate Nash equilibria. In order to achieve this aim, the author considers

a reformulation of extensive games that provides a unique Nash equilibrium.

According to Example 1106, my understanding on the result related to The-

orem 1107 is that the player who makes a decision first in the game can pick

up a Nash equilibrium that is the best for her. However, since Definition

1108is not formally defined (and the related material in the footnote can-

not be accessed at all), it is impossible to find what kind of difference from

the standard extensive game implies the uniqueness of Nash equilibrium.

In particular, since the result is derived without formulation, definition, or

proof, it seems that the first player makes a decision as described in The-

orem 1109almost due to assumptions in this game rather than implication

from the axioms. The author must formally define an extensive game and

clearly points out the difference of the axioms in order to clarify the logic of

the implication.

⋆ 投稿論文でも展開形ゲームの理解の仕方が従来の標準的ゲーム理論のそれとは異なることを強調してはっきり「再定義」をして,標準形ゲームとは排反的であることも主張しておいたのだがどうして “not formally defined”で “without formulation, definition,

or proof” と読めるのか理解に苦しむ.私の投稿論文の結論が従来の標準的ゲーム理論の結論と違うことから混乱をきたしているのだろうが,投稿論文の推論が unclearなのは何故なのか,逆に従来の標準的ゲーム理論の推論の仕方の根拠は何か反省してみる良い機会だったのではないだろうか.本当に従来の標準的ゲーム理論の approachが “quite

clear”なのかどうか明白になってくるはずだからである.思うに,査読報告書が not formally definedとか without formulation, definition or

proofと述べていることは投稿論文に対してよりむしろ従来の標準的ゲーム理論について言えるのではないだろうか.だから展開形ゲームについてはっきりと新しい定義を与えているにもかかわらずそれに対する具体的反論がない.単にどうもおかしい,納得出来ない,証明がないという感覚的な反論にしかなっていない.たとえば,本講義録の定理 3.3.1(25頁)(展開形ゲームにおけるナッシュ均衡の一意選択)について,almost due

to assumptions in this game rather than implication from the axiomsという指摘こそ実は従来の標準的ゲーム理論による推論が如何に公理系からではなく,感覚に頼った推論しかしてこなかったかという明白な証拠でもある.何故ならば,従来の標準的ゲーム理論がしっかりした公理系に則った「理論」ならば,おかしな推論に対してはどこが間違っているか具体的かつ論理的に指摘できるはずだからである 110.ところで,もし査読者が投稿論文で取り上げたチキンゲームをゲームの木で表現し

105展開形ゲームに対する新しい定義を与えている.本講義録 19頁参照.1063.2節 (22頁)の 2× 2 双行列標準形ゲームをゲームの木で表現した展開形ゲーム.107本講義録の定理 3.3.1, 25 頁と同じ内容.108本講義録の定義 3.1, 20頁と同じ内容.109本講義録の定理 3.3.1, 25頁と同じ内容.110定理 3.3.1は決していわゆる論点先取りの推論ではない.公理系と展開形ゲームに対する「新しい」認識に基づいている.尤も almost due to assumptionsではないが,almost trivial theorem from the axiomsではある.

72

Page 77: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

た場合,almost due to assumptionsによってナッシュ均衡が一意に選択される,と感じられたとするならばそれは私の展開形ゲームに対する再定義が如何に自然な定義であるかという何よりの証拠でもある.何故ならば,有名なチキンゲームには,よく知られているように 2つの純ナッシュ均衡と 1つの混合ナッシュ均衡が存在するが,既知の如何なるナッシュ均衡の精緻化概念を用いてもこれらを一意に絞り込むことは出来ないうえに,従来の標準的ゲーム理論ではこのゲームをゲームの木で表現しても双行列で表現しても区別をしないで同じゲームであると認識しているからである.さらにいえば,almost due

to assumptionsというときの assumptionsを展開形ゲーム一般に対してどう普遍的に定式化できるのか具体的な表現を試みてみれば,投稿論文の再定義と従来の展開形ゲームの理解とがどう違うのか違わないのか明確になって来たはずである.(以上)

Section 3111 discusses credible threat, which has been discussed in a well-

known example. The author demonstrates by Example 3112 that under differ-

ent rationality (called maximin rationality, which assumes that the players

chooses a strategy to maximized the minimum payoff), the second mover

can credibly threat the first mover and receive higher payoff, which cannot

be supported under the author ’s axiom with Nash rationality. However, a

strategy profile of the credible threat is also supported by a usual subgame

perfect equilibrium.

⋆査読報告書の指摘は少々従来の標準的ゲーム理論の解説とは異なるように思われる.本文 4.4節 (37頁)でも縷々説明したように多くの標準的ゲーム理論の教科書や論文ではこの例(4.4.1節, 37頁の「信ぴょう性のない脅しゲーム (II)」) も市場参入ゲーム (4.3.1

節, 34頁)と同様に incredible threatと呼ばれている.つまり,投稿論文ではMaximin

rationalだと主張しているナッシュ均衡は incredibleだ,irrationalなナッシュ均衡だと通常は理解されている.ただし,図4.4.1のゲーム(37頁)には真の部分ゲームは存在しないから,すべての(この場合は 2組の)ナッシュ均衡がいずれも定義上は形式的に部分ゲーム完全均衡にはなっている.だからといって,by a usual subgame perfect equilibrium.

によってすでに credible threatであることは supportされている,という指摘が従来の標準的ゲーム理論の理解だとは思われない.そもそもこの例は真の部分ゲームが存在しないゲームだから,部分ゲーム完全均衡という概念は有効ではなく,別のナッシュ均衡の精緻化概念が必要である,というコンテクストで標準的ゲーム理論の教科書や論文で取り上げられている例である.この例に対して subgame perfect equilibrium.を根拠にしたのでは,Maximin合理性が理論的根拠として 1つのナッシュ均衡精緻化概念になり得て,かつその結論が従来のナッシュ合理性の立場からの精緻化概念の結論を否定しているという投稿論文の積極的主張に対する積極的論駁にはまったくなっていない,ということである.(以上)

Hence, it is not clear why the author must consider a totally different axioms

(Definition 1 and Maximin rationality) to argue the credible threat. More-

over, the result that the credible threat is supported by Maximin rationality

is demonstrated only by an example and there is no intuitive and reason-

able explanation whether or why this argument is generally valid in other

111本講義録の 4.4節, 37頁,5.3節, 56頁と同じ内容.112図 4.4.1(37頁)のゲームの木で表される展開形ゲーム.

73

Page 78: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

extensive games.

⋆the credible threat 1例のみ,と書いてあるが,Maximin rationality については河野(2013, [38])の論文を引用してあるのだから,Maximin rationalityを広い範囲のゲーム理論に適用しようと試みていることは明らかなはずだ.また,展開形ゲームについての再定義 (Definition 1)について積極的に originalityを主張したつもりだ.そのために投稿論文では 4.1.1節(28頁)の Selten(1975, [69])の例も取り上げて Seltenとは異なる結論を導いているにも拘わらず言及がない.従来の理論と原理的に異なる結論が導かれることを示すためには反例を 1つ挙げれば十分である.尤も「ゲーム理論」は「理論」ではないのだから多くの例と intuitive explanationが必要なのだ,という主張であればそれなりに理解は出来る.そのために本講義録では可能な限りの例を紹介した.ただ,投稿論文にしろ,本講義録にしろ intuitive explanationはむしろ出来るだけ避けた.理由は「理論」を「理論」として理解するためには,intuitive explanationはむしろ有害だと信じるからである.intuitive explanation が「理論」としての「ゲーム理論」の発展を如何に歪めてきたか,という思いを強くするのである.くどいようだが van Damme(1991,

[75], p.1)が指摘するように “Game Theory is a mathematical theory which,,,” ということを忘れてはならない.intuitive explanationが数学的推論に取って代わることは出来ないのである.なお,only by an example,,,について,1例だけから何故主張が正しいと言えるのか,他の展開形ゲームに対してはどうなのか,という査読報告書の指摘については,もともと「信ぴょう性のない脅しゲーム」という説明がついているゲームは従来の標準的ゲーム理論の枠内でも本例や類似したゲームに限られていて左程一般性,普遍性のある話ではない.しかし,Maximin原理の適用例については標準形ゲームに対してはすでに河野 (2013, [38])で種々論じているし,展開形ゲーム一般に対しても有効であろうと信じて,その 1例として論文にしているわけで,もし 1例だけで極めて特別な例にすぎず一般性がない,という査読コメントならばその根拠を示して貰わなければ投稿者が納得するわけはない.(以上)

Overall, the author should explain that whether this example offers a general

implication on the credible threat.

On the whole, the argument of the article is not consistent throughout the

article. Although the first part tries to refine Nash equilibria by modifying

the standard extensive game, the second part argues that the uniqueness of

equilibrium, which is beneficial for prediction of the outcome, is deteriorated

by considering a different kind of rationality, which seems to be less reason-

able than the standard Nash rationality. As the model in this article deviates

from the standard extensive game, the author must carefully discuss which

axioms are reasonable in order to justify the deviation from the standard

extensive game axiom.

Finally, the author must carefully read the manuscript again. There are

many misspelled words and grammatical errors. Some numbers of the equa-

tions are garbled. Most of these errors can be corrected before submission.

⋆結局以上の査読報告書を読むと,天動説を固く信じている人に,火星の運行の不規則性を簡潔に地動説から説明してもそれは 1例に過ぎないでしょ,と言われているような印象である.ガリレオの時代の理論レベルでは天動説でもさしたる不都合は無かったら

74

Page 79: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

しいが,科学的好奇心があればひとつの不思議な観察事実,既存理論に疑問を呈する 1

例だけからでも新しい理論発展の端緒は掴めるのではないだろうか.ただ,逆に言うと投稿論文では 2つの重要な主張,1. 展開形ゲームに対する新しい再定義を与え,複数のナッシュ均衡から原則として一意選択が可能であること,2. Maximin原理を導入することによって従来 incredible threatと見なされていたナッシュ均衡にも合理的根拠があること,を 1つの論文にしてしまった 113.結局,この指摘を踏まえて投稿論文の上記の内容 1,2を別々の論文にして特に 2の部分はどうしても数式が多くなるので工学系の学会の和文学術誌に投稿した.その結果についてはこの後に詳述するのでそちらを参照されたい.なお,1の部分は当初原著論文として「理論と方法」誌に投稿したが結局「研究ノート」として河野 (2016, [44])で日の目を見た.最後に投稿前に論文を読み直して十分チェックしろ,というご指摘はまったくその通

りで言い訳できない.主観的には何度もチェックしているのだが思わぬところを見過ごしてしまう.スペルチェック機能も自由に使いこなせなかった.今からの研究者はハイテク技術の習得が必須でアイディアのひらめきだけでは論文は書けないということを痛感した.いずれにしろ,十分チェックされていない投稿論文に対して査読者が心証を害するのは当然で心すべきことである.(以上)

(II-2) 同じ雑誌の第 2の査読報告書は第 1のそれに比べてもっと詳細なコメントをしてもらったが判定はやはり rejectであった.

A Referee Report on “The Credible Threat Based on the Max-

imin Principle in Extensive Games” by Norio Kono

This paper offers a new methodology to analyze general (finite) exten-

sive games. A key fact is that, by adding trivial decision opportunities if

necessary, we can reformulate any finite extensive game as a finite-period

extensive game such that (i) in the course of any possible play of the game,

at any period exactly one player is given an opportunity to move, and (ii) at

any period, the all decision nodes at the period belong to one player. The

crux of this reformulation is that the players can be ordered uniquely and

unambiguously, according to the order of their moves. Based on this fact,

this paper defines an extensive game with this particular order structure as

the one where the players sequentially decide their strategies, according to

their order. Consequently, while the first mover just chooses his strategy,

any subsequent player decides his strategy given his predecessors’ strategies

and therefore chooses a meta-strategy. (I must admit that I am not 100%

sure of this summary, because the exposition of this paper is not so clear.

For example, what I call “strategy” here is actually called “decision” in this

paper. I interpret it as a strategy in the usual sense, because the author’s ar-

gument makes the most sense under that interpretation. The meta-strategy

interpretation is not stated in the paper, but again, it makes the most sense.

113自分の頭の中ではほぼ同時に到達した結論だったためにごく自然に 1つの論文にまとまった.特に,展開形ゲームにMaximin原理を適用する場合,前半のナッシュ均衡の一意選択を前提にすると従来の結果とのより積極的な比較が出来る(と思った)が,not consistentと言われてしまった.

75

Page 80: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

Also, the order of players’ strategy choices is loosely defined, when some

players move more than once. Here I suppose that if the order of moves is

1 → 2 → 3 → 2 → 1, the corresponding order is 1 → 2 → 3. This point is

not explicitly discussed in the paper, however. In any event, while I may be

wrong, I am 100% sure that a nonnegligible number of experts would inter-

pret the framework of this paper as I do. In case I am wrong, the author

should have avoided such confusing exposition.)

⋆従来の標準的ゲーム理論の教科書に紹介されている展開形ゲームは殆どすべてゲームの木表現からプレイヤーがプレイする順番が一意に決まっていることが認識できる.ただ,途中のプレイヤーがプレイすることなく後続のプレイヤーがプレイする場合や他の可能なプレイより早くプレイが終了する場合がある.しかし,一般的に定式化するためには,vN-Mの本にあるように必要ならばダミーの頂点を挿入し 114各時刻では同一のプレイヤーがプレイすると仮定して,プレイの長さもすべて同じとして定式化する方が後々の説明と推論がすっきりし,かつゲームの本質的内容は何ら変化しない,と考えて投稿論文ではまずそのことから記述した.しかし,知り合いのゲーム理論家からも本質的変更を加えたことにならないか,という疑義を持たれたので以後の論文(本講義録を含む)ではすべて従来通りのゲームの木を採用した.ただ,たとえば Selten(1975, [69])

の有名な例(4.1.1節,28頁)の図 4.1.1のゲームの木に痕跡が残してある.折れ線の折れ目のところにダミーの頂点を挿入してPlayer 2がここでプレイをパスする,と理解しても何ら本質的変更を加えたことにはならないのではないだろうか 115.投稿論文は殆ど従来の標準的ゲーム理論の枠内で定式化しているにもかかわらず結果

が標準的ゲーム理論の結論と大きく異なることから,その主たる原因を定式化の曖昧さに求めているふしがある.逆にいうとその原因こそが投稿論文のオリジナルな部分であることは当然である.意味のある展開形ゲームとして多くの教科書に取り上げられているゲームの木を眺めると各プレイヤーがプレイする順番は自然に表現されている.投稿論文はそれを明文化しただけなのだが査読報告書を読むとどうもプレイヤー集合に順序構造を仮定したのではないか,と誤解されたようだ.プレイの順番が 1 → 2 → 3 → 2 → 1

のような場合も許容されていると解釈した場合,以後の展開に不都合が生じた場合のみ,反例を挙げて,定式化が曖昧だ,と理解すべきであって,可能な限り一般化,普遍化を追求するのは「理論」の常識である.次に,decisionと strategyの区別が曖昧だとの指摘であるが,確かにそう受け取られ

ても仕方がない表現が多々あった.もちろん,正確には「戦略を決定する」のだが,プレイする順番を強調したいために「戦略の順番」ではイメージがしっくりこないので「決定の順番」,というニュアンスで使ってしまった.ただ,投稿論文で用いている「戦略」は従来の標準的ゲーム理論で用いられている「戦略」と同義であってmeta-strategyではない.プレイする順番を強調した途端にmeta-strategyではないか,という疑問を抱くのは実はもっともだと思われる.何故ならば,従来の標準的ゲーム理論における展開形ゲームに関する intuitive explanationを読んでいると,しきりに先手番プレイヤーが後

114ダミーの頂点に属するプレイヤーがその時点でプレイする,とは 1つの選択肢を確率 1で選択するという行動戦略であると理解する.従って,ゲームの結果に何ら影響を及ぼさないことは明らかであるが,当該プレイヤーに属する行動戦略の組としては異なってくる.115ただし,Player 2の行動戦略セットは,ダミーの頂点での行動戦略を余分に付け加えるという意味で,形式上異なる.しかし,期待利得と戦略についての数学的構造はまったく不変である.

76

Page 81: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

手番の戦略(意思決定)をあれこれ推察して悩んでいる.これこそmeta-strategyではなかろうか.自然を相手にした 1人ゲームの場合を戦略と呼ぶならば,相手の戦略をも考慮しつつ自己の最適戦略を決めようという 2人以上の非協力ゲーム理論の「戦略」はすべてmeta-strategyと呼ぶべきではないのだろうか.むしろ,投稿論文は展開形ゲームについての認識を改めることによって従来の標準的ゲーム理論があれやこれやと先手番,後手番の意思決定を推測し合うというmeta-strategy的悪循環を断ち切って 1人ゲーム的戦略だと割切ってよい,という定式化を行っているのである.(以上)

Now I present my comments below.

Main Comments.

(1) I usually buy strange ideas, and this paper seems strange to me. First of

all, this approach admits multiple representations as extensive games with

different player orders, when the original strategic situation involves simul-

taneous moves. That is, a situation where three agents make decisions at

the same time may be formulated as either 1 → 2 → 3 or 3 → 2 → 1, etc.

Although the author emphasizes that his/her extensive game usually selects

a unique Nash equilibrium (outcome), this uniqueness result is somewhat

disguising. For a “Battle of the Sexes” type normal-form game where each

player has his favorite equilibrium, there are corresponding extensive games

in this paper’s sense each of which selects each player’s favorite.

⋆この点こそ投稿論文の最も本質的なところで,かつ最も簡単な 2×2の双行列ゲームをゲームの木による展開形ゲームとして表現した場合に従来の標準的ゲーム理論との違いが鮮明に現れるところなので詳細に説明したつもりであった.従来の標準的ゲーム理論では確かに「標準形ゲーム」と「展開形ゲーム」は区別しない.同じゲームで異なる表現でしかない,という理解である.しかし,投稿論文では 2× 2の双行列ゲームは 2通りの展開形ゲーム表現が出来てそれぞれ別のゲームであると主張したはずである.「男女の争いゲーム」の展開形ゲーム表現において「男」が先手となる表現ならば「男」の,「女」が先手となる表現ならば「女」に有利なナッシュ均衡戦略が選ばれるのであってどこにも矛盾は生じない.この点についての歴史的検討は本講義録の 3.1節(19頁)で調べた限りの文献を紹介した.投稿論文で用いた例はいわゆるチキンゲームであったが,「両性の闘い」ゲームとナッシュ均衡の構造(2つの純ナッシュ均衡と 1つの混合ナッシュ均衡)には代わりがなく,かつ 2つの純ナッシュ均衡の利得が 2人のプレイヤーにとって利益が反するところも同一なので,「コメント」に指摘してある “Battle of the Sexes”に対しても全く同様に投稿論文の定理は成立する.ただ,心理的に “Battle of the Sexes”

ゲームの方が分かり易いようだと気がついて「理論と方法」誌に投稿(2016, [38])した時は「男女の争い」ゲームに取り換え,本講義録 3.2節(22頁)でも引き継いだ.結局投稿論文のメインの意図,つまり従来の標準的ゲーム理論における「戦略形ゲー

ム」と「展開形ゲーム」は本質的に異なるゲームだ,という新しい ideaを strange idea

としか認識してもらえなかった.従来の標準的ゲーム理論に立つ限り以下のようなコメントになるのはけだし当然であろう.(以上)

(2) There is no a priori reason to believe that the order of strategy choices

must coincide with the order of physical moves. If we allow a different or-

der of strategy choices, then a different Nash equilibrium may be uniquely

77

Page 82: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

selected. Again, the uniqueness result of this approach is undetermined by

this multiplicity about the order of choosing strategies.

⋆確かに,展開形ゲームを表現しているゲームの木の頂点でプレイヤーはmoveするのであるが,その時に初めて戦略を choiceするわけではない.そのために,本講義録では公理 2.3(15頁)116(戦略の事前選択の原理)として明示的に表現した.実は,従来の標準的ゲーム理論でも,たとえば有限完全情報ゲームにおいて後向き帰納法を適用する時はごく当然のように各頂点にプレイヤーが到達した場合にその時点で初めて choiceを行う(出来る)という前提で推論している.では,実際のプレイに際して到達しない頂点における choiceはどうするのか,という問題が生じる.この点について従来の標準的ゲーム理論自体混乱しているように思われる.ゲームの木はすでにプレイヤーが choice(move

はもちろん)する orderを表現している,という投稿論文の主張 (Definition 1, 本講義録の定義 3.1, 20頁)に対して There is no a priori reason という指摘が何を根拠になされているのか理解に苦しむ.従来の標準的ゲーム理論における展開形ゲームは physical

movesと strategy choicesは ad hocに決めている,ということだろうか.確かに教科書によくある intuitive explanationを読むといつ最終的に戦略を決めるのか判然としない説明は多々見受けられる.しかし,少なくとも投稿論文が問題提起をしている,ということは明らかだろう.その結果投稿論文では有名な Selten(1075, [69])の結果に反する結論を導いてもいるのだから,従来の標準的ゲーム理論の立場から何故投稿論文のそれが間違った推論であるのかもっと積極的根拠に基づくコメントをしてほしかった.(以上)

(3) Why are results of the paper so different from standard game theory?

This is because of the additional assumption that the players choose their

strategies in order. But then, a standard game theorist just reformulates the

original extensive game so that the stages where they choose their strate-

gies are added. More concretely, player 1 starts the play with selecting a

“machine,” which automatically implements a strategy of his choice. Then

player 2, knowing player 1’s machine, decides his machine, and so on. If all

players select their machines, the game is virtually over. The play reaches

to an endpoint where they receive the payoffs when their machines play the

original extensive game.

In summary, while the author claims that the extensive game in this paper

is very different from the standard game theory, the game can actually be

represented in the standard way. Analyzing the new game in the standard

way would prove the same results. But then, what is the real contribution

of this paper?

⋆ちょっと信じ難いがゲーム理論で登場するプレイヤーは「戦略」を “machine”で決めているわけではない.投稿論文でも公理として掲げたが,ゲーム理論の大前提である「期待利得最大化原理」(公理 2.1)に従って意識的に選択するのである.ちょっとコメントの論旨がよく理解できないが, the players choose their strategies in orderは展開形ゲームの本質であって,そのこと(順序構造を持っていること)はゲームの木で表現されて

116投稿論文ではこの公理を明示しなかった.査読報告書を読み改めて文献を読み直してみて,従来の標準的ゲーム理論の枠内で陰に陽にこの公理が前提とされていると確信したために,論旨をより一層明確にするために改めて公理として明示した.

78

Page 83: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

いると主張(再定義)しているのであって,additional assumption を加えているわけではない.強いて言えば,従来の標準的ゲーム理論では,折角表現されている順序構造を無視して同時手番ゲームであるかのごとき考察をしているのではないだろうか.コロンブスの卵なのである.(以上)

(4) Another concern about the contribution of this paper is relevance of the

results. A key result is Theorem 1117, although I do not like lack of its proof.

In order to explain my view on the result, let me consider the following

three-player game. In period 1, player 1 chooses either α or β. In period 2,

player 2 chooses either α or β, without knowing player 1’s action. Finally

in period 3, player 3 chooses either α or β, without knowing any player’s

action. Then the game ends, and each player’s payoff is represented by the

following matrices.

player 3 player 3

player 2

α β

α (0, 0, 0) (1, 1, 1)

β (3, 0, 0) (0, 0, 0)

player 2

α β

α (2, 2, 2) (0, 2, 0)

β (0, 0, 2) (0, 0, 0)

player 1’s choice = α player 1’s choice = β

Note that I have written the matrices in a bit strange way, so that player 1

(not player 3) chooses matrices. The payoff vectors order the players’ pay-

offs in the standard way. In the normal game with these payoff matrices,

(α, β, α) is the best Nash equilibrium for player 1. Hence in the extensive

game where player 1 makes a decision first, Theorem 1 implies that player

1 should play α. However, whether α is really good for player 1 depends on

the other players’ actions. Indeed, given that player 1 decides to choose α,

players 2 and 3 may want to play (α, β) because this forms a better Nash

equilibrium for them. If player 1 anticipates that, he may rather want to

play β in order to secure the payoff 2. Therefore, this example casts some

doubts about validity of the theorem.

I simply suggest the author attempt to prove Theorem 1, sentence by sen-

tence. By doing so, the author would notice some implicit assumptions and

understand the problem better in the end.

⋆投稿論文でははっきりと展開形ゲームと標準形ゲームに対して exclusive definitionを与えている,と主張している.その違いは「順序構造」の有無である.その構造をゲームの木で表現するか,言葉で表現するかは問わない.この査読報告書の例示しているゲームは従来の標準的ゲーム理論でいえば,3人同時手番ゲームに新たな仮定,period 1ではplayer 1が意思決定し,period 2で player 2が player 1が選んだ戦略を知ることなく意思決定し,period 3で player 3が player 1, player 2の戦略を知ることなく意思決定すると言葉で記述されているが,容易に player 1,2,3がこの順序でプレイすゲームの木で表現できるから,明らかに投稿論文の definition 1(本講義録の定義 3.1 20頁)でいう逐次

117本講義録,定理 3.3.1(25頁)

79

Page 84: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

手番の展開形ゲームである.従って,当然Theorem 1(本講義録,定理 3.3.1 25頁)が成立する.しかし,査読報告書のコメントが指摘していることは,period 1, 2, 3で player

1,2,3が順にプレイしたという自らが決めたルールを忘れて,従来の標準的ゲーム理論において,3人同時手番の標準形ゲームに対してナッシュ均衡を一意に絞り込むことが出来ない,というよく知られている事実を縷々述べているだけで投稿論文の主張とは何の関係もない.自らが課した explicit assumptionsを無視して貰っては困るのである.確かにゲーム理論における戦略の選択の根拠を問うことは難しい.ここで,査読報

告書のコメントが解説している内容は自らの前半でコメントしているように (while the

first mover just chooses his strategy, any subsequent player decides his strategy given his

predecessors’ strategies and therefore chooses a meta-strategy.)まさに “meta-strategy”

について述べているのではないだろうか.特に展開形ゲームについてこの難点を克服しないと「理論」としてのゲーム理論が完成しない,という印象を強くするのである.投稿論文の definition 1(本講義録の定義 3.1 20頁)が適切であるかどうかは(勿論投稿者本人はオリジナルな結果だと信じて投稿しているわけであるが)ともかくとして,多くの研究者による検討を期待したい.何度も指摘するが,従来の標準形ゲーム理論では本講義録で明示している公理 2.1~

公理 2.3および定義 3.1以外の根拠に基づく説明が多すぎるのである.査読報告書のコメントが指摘するように標準形ゲームに対しては投稿論文のTheorem 1が保証するような優先的選択権がないために各プレイヤーの利害が対立するような複数のナッシュ均衡から一つのナッシュ均衡を選び出す(ゲームの「解」概念)ためには additional assumption

が必要である.たとえば,査読報告書が指摘する If player 1 anticipates that, he may

rather want to play β in order to secure the payoff 2. のような心配を「理論」として取り入れたいならば,本講義録で解説したような(5節,48頁)Maximin原理に基づく公理 2.1∗が必要である.なお,投稿論文には「On a Game Theory Based on the Maximin

Princilpe」という表題の論文(河野 2013, [38])は引用文献として挙げてあった(査読者が日本語文献にアクセスできたかどうか定かではないが).なお,I simply suggest the author attempt to prove Theorem 1, sentence by sentence.

の部分は第 1の査読報告書の it seems that the first player makes a decision as described

in Theorem almost due to assumptions in this game rather than implication from the

axioms. に対応していると思われる.その場所での脚注に almost trivial theorem from

the axioms だとコメントしたが,投稿論文のTheorem 1に対して違和感を持ったとしたら,その原因は展開形ゲームに対する新しい定義(本講義録の定義 3.1 20頁,投稿論文では re-defineという言葉を使った)にある (ということをまず認識しなくてはならない).その上で,従来の標準的ゲーム理論による展開形ゲームの認識と投稿論文の re-defineした展開形ゲームがどう違うのか,投稿論文のTheorem 1を受け入れない以上,投稿論文の re-defineがおかしい,間違った認識をしているはずである.そのことを根拠を示して指摘しなくては査読した意味がない.(以上)

(5) One section of this paper compares the author’s solution concept (called

Nash rationality) and the maximin behavior (called maximin rationality).

Again, the analysis is strange (recall that I usually buy strange ideas!). Ap-

parently in the game in this section the players can choose either Nash or

maximin rationalities. Then, a standard game theorist just adds decision

80

Page 85: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

nodes about the choice of rationalities and analyzes the extended game in

the standard way. I guess this approach yields the same result. Not a big

departure from the standard theory.

(6) The author argues that a player sometimes chooses maximin rationality,

in order to force the other player to adopt it. Further, the second-mover can

use his action as a credible threat under this maximin-rationality solution,

despite the fact that the action is an incredible threat under Nash rationality.

Well, these findings are hard to evaluate. I just remark that nothing should

be wrong if the equilibrium action is credible under the rationality criterion

the player actually adopts. Credibility under the criterion not selected (an

off-path criterion) would not be an issue.

⋆この部分は本講義録の 5.3節(56頁)で取り上げた内容で,標準的ゲーム理論では「信ぴょう性のない脅し」として合理性がない,とされるナッシュ均衡戦略も後手番のプレイヤーがMaximin原理に立つ原理主義者だということが周知されている場合(公理 2.2,共有知識の原理)は,Player 1も定理 3.3.1によって行使できるはずの優先的選択権を行使するのは得策ではなく(最大利得が保証されないから)後手番のPlayer 2に従って自身のMaximin戦略(実はナッシュ均衡戦略の 1つではある)を選択せざるを得ない,という意味で Player 2がMaximin原理に立つことは信ぴょう性のある脅しとして実現できる,ということを論じている.Player 2が何故ナッシュ合理性ではなく,Maximin合理性の立場にたつのか,という問いは愚問であってPlayer 2にとってはその方がより高い自己の期待利得が期待できるからである.なお,我々の公理 2.3(戦略の事前選択の原理)を認める限り rationality criterionの適用に際して off-pathであるかどうかは関係ない.確かに,コメントも指摘する通り,Maximin合理性(本講義録では公理 2.1∗,48頁)

とナッシュ合理性(同,公理 2.1,14頁)の関係は本講義録でも十分には解明できていない 118.あくまで,1例をあげることによって従来の標準的ゲーム理論に対する問題提起が出来ればよいと思ったのであるが,せっかく(I usually buy strange ideas!)と主観的に自己規定している査読者を十分納得させることができなかったことは何としても残念である.(以上)

My Evaluation.

This paper attempts to develop new ideas, which is very nice. Never-

theless, it is hard for me to find real contributions in this paper. My main

concerns are that (i) the standard theory also can represent the author’s main

points, (ii) a core result, Theorem 1, needs much more work, and (iii) most of

all, the results are not so striking. I am highly reluctant to recommend this

paper to this Journal . I believe the journal seeks to publish papers with,

though tiny, definite contributions.

118河野(2015, [41])において,ナッシュ合理性の立場に立つか,Maximin合理性の立場に立つか,プレイヤーのタイプとして定式化した上でベイジアンゲームの枠組みで分析する試みを発表した.チキンゲームの場合,チキンゲームの混合ナッシュ均衡戦略と同じ確率分布でナッシュ合理性に立つか,Maximin合理性に立つかを決めるのがナッシュ合理性の立場からみて合理的である,という知見を得たが本講義録には再録していない.ちょっと一般性がない例のように思えたからである.ただ,2つの立場をベイジアンゲームとして分析することは一般に有効ではあると思う.

81

Page 86: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

⋆なお,Minor Commentsとして投稿論文のナッシュ均衡戦略セットの同一視の条件が不適切である,と反例を挙げて指摘してあったのは有難かった.つまり,私は位相的に連結したナッシュ均衡戦略セットは利得関数の連続性から自動的に全プレイヤーの期待利得は不変であると(頭の中で証明して)信じていたが,自明ではない簡単な 2× 2の双行列ゲームですべての混合戦略がナッシュ均衡戦略セットでありながら期待利得が異なる例を示された.従って,以後の私の論文(本講義録を含む)ではすべて,「各プレイヤーの期待利得が不変で」かつ位相的に連結したナッシュ均衡戦略セットは同一のナッシュ均衡とみなす,というように同一視の定義の条件を強めた.このように変更しても実際の応用上においては,特に展開形ゲームでは絶えず出現するこのようなケースについては何ら支障は来さない.(以上)

両査読報告書ともに共通して私の論文の前提,定式化がしきりに not clearと指摘されるのだが,実は standardなゲーム理論における展開形ゲームの定義とゲームの前提そのものが not clearなのだと思う.not clearな理論をもとにして standardでない理論をnot clearと批判してもあまり生産的ではない.私の問題意識は standardな理論とは違う結論が導かれる例を提示することによって,standardな理論そのものをより clearにする議論のきっかけにしてほしい,という願いも込めていたのだが hard for me to find

real contributions in this paperと言われてしまった.従来の標準的ゲーム理論に微塵も疑いを持たない査読者に標準理論から外れた結論を理解してもらうのは難しいことがよく理解できた.

(III) やむなく,すでに口頭発表はしている学会の機関誌に本講義録の 3.1節の内容を,工学系の和文誌には 5.3節の部分をと,分けて投稿した.英文論文に対する査読報告を読んで,こちらが自明視している論理展開が他分野の研究者には自明ではないことに気が付いて(そのために公理 2.3,(15頁)を明示的に加えた),丁寧に解説を加えて数理社会学会の学会誌に投稿することを考えて準備を始めたところ,文系の学会誌には大抵紙数制限があり,内容的に 2つの重要な主張を合わせてしまうと制限紙数を大幅に超えることが判明.また,内容的にも後半はどうしても数式を多く用いざるを得ない.実際に,前半の展開形ゲームについての新しい定義を説明した部分にも当学会の読者のために数式を使わないで説明してくれ,と要請された(主観的には一切数式は使っていなかったのだが).工学系の雑誌には紙数制限はなかったし,少なくとも数式アレルギーはない.ところが,こちらは学会員ではないため論文を掲載するためには頁数に応じた掲載料が必要で,そのためにも紙数を出来るだけ抑える必要があった.もうひとつの理由として,全滅を避けたかった.結果として,展開形ゲームに対する新しい定義の部分は,原著論文としてではなく,研究ノートとしてではあるがともかく何とか編集委員会,査読報告書の指摘を受け入れる形で採択された (2016, [38]).しかし,後者はやはり以下のような査読報告書のコメントつきで不採択となった.投稿論文が不採択となった場合は弁明の機会が与えられないのでここで私の言い分を述べておきたい.

(III-A) まず,A氏の査読報告書から.

論文の要約この論文では、「信ぴょう性のない脅しゲーム」として知られている図

2.1(本講義録のゲーム例 4.4.1, 37頁)の不完全情報を持つ展開形ゲーム(以

82

Page 87: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

下、脅しゲーム)の解について考察されている。脅しゲームには、利得に関する条件 A と B の下で 2 つのナッシュ均衡N1とN2 (N1は純戦略の組、N2は純戦略の組を含む集合)が存在する(補題 4.1,本講義録の補題 5.3.1,

57頁)。数々の先行研究において、このような 2つのナッシュ均衡が存在する脅しゲーム(利得は具体的な数値)が扱われているが、各プレイヤーが期待利得最大化原理に従う限り、先手番であるプレイヤー 1にとって有利であるN1がゲームの解として妥当と考えられ、後手番のプレイヤー 2 にとって有利なN2における戦略は「信ぴょう性のない脅し」として解釈されてきた。この論文では、不完全情報を持つ展開形ゲームに対してmaximin戦略を

定義し、脅しゲームにおいてプレイヤー 1とプレイヤー 2のmaximin 戦略が、それぞれN2に含まれる純戦略の各戦略に一致するための利得に関する十分条件を出している(補題 4.2,本講義録の補題 5.3.2, 59頁)。そして、「信ぴょう性のない脅しゲーム」が「信ぴょう性のある脅しゲーム」となる可能性があることを論証している。

⋆ この要約を読む限り査読報告書は投稿論文が言わんとしていることを理解しているように思われた.しかし,である.(以上)

全体的評価「信ぴょう性のない脅しゲーム」が「信ぴょう性のある脅しゲーム」と

なる可能性があるという主張は興味深いが、論証・体裁(特に第 4 章 119に問題があると考える。

(1) 4 章には補題が 2 つあるが、これらの補題が証明で用いられている命題(主定理)がなく、主張・結論が「考察」(p.8, 下から 2 行目)という形式で論述されている。そのため、仮定や結論が明示的に記述されていない。(2) プレイヤー 2が期待利得最大化原理に従って qN1 = (1, 0) を採用するのではなく、maximin 戦略 qm = (0, 1) ( N2 に含まれる純戦略)を採用するためには仮定や条件が必要である。「プレイヤー 2 がリスク回避的性格の持ち主であることが周知の事実であるとしよう」(p.9, 6 行目)という仮定が議論の出発点と読める。(3) 「プレイヤー 2がリスク回避的性格の持ち主であることが周知の事実である」(p.9, 6 行目)と仮定して「プレイヤー 2 がmaximin 戦略 qm を選択する可能性があることを推測できる」(p.9, 8 行目)と結論し、さらに条件B**を仮定して「プレイヤー 2が qm を積極的に選択する動機が生じる」と結論している。(4) 「プレイヤー 1もmaximin 戦略を採用せざるを得ない」(p.9, 22 行目)とあるが、プレイヤー 1がmaximin戦略を計算して戦略 (0,0,1)を選択するという印象を受ける。プレイヤー 1に関しては何も仮定がされていないので、プレイヤー 1は最大期待利得を計算して戦略 (0,0,1)を採用する。それゆえ補題 4.2 は議論において不要である。

⋆ (1) 補題はあくまで途中の推論過程を簡潔明瞭にするためにまとめてあるのであって,

119Player 2がMaximin戦略を採用した場合に,Player 1が予想される最大期待利得のナッシュ均衡戦略を選んだ場合とそうでない方を選んだ場合の得失を論じた,いわば論文の心臓部.

83

Page 88: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

投稿論文の要約でも「定理」を証明するとは主張していない.実は,(4) 補題 4.2(本講義録の補題 5.3.2, 59頁)では,プレイヤー 2のmaximin戦

略が (0,1)であることの証明をで行っている.プレイヤー 1はmaximin戦略を採用せざるを得ないのであって,その根拠がプレイヤー 2がmaximin戦略 (0,1)を採用した時のプレイヤー 1の得られるであろう期待利得の合理的予測が,戦略 (0,0,1)を選んだときの期待利得を下回る,という事実がこの投稿論文のポイントなのであって,「議論において不要」という理解は理解に苦しむ.また,「プレイヤー 1は最大期待利得を計算して戦略(0,0,1)を採用する。」は事実に反する.戦略 (0,0,1)はプレイヤー 1にとっては最大利得のナッシュ均衡ではない.そこがまさに「信ぴょう性のある脅しゲーム」の肝の部分である.(以上)

(5) この論文には注釈をはじめ著者以外のコメントを元に改訂された(と思われる)箇所が少なからずあるが、下記にも数点指摘した通り十分な改訂がなされていない。

(1)~(3)で指摘した論証・体裁は科学論文に採択される基準であるか疑問である。

⋆論証・体裁が学術論文としての基準に達していない,という意味かと思われるが,具体的にどのような基準に達していないのか明確でない.肝心な投稿論文の「主張」に対する評価はなされていない.ひとつ思い当たる理由は,経済系の雑誌に投稿した欧文論文を前半(展開形ゲームの新しい定義)と後半(「信ぴょう性のある脅しゲーム」)に分けて別々の和文雑誌に投稿したことである.この工学系の雑誌には前半部分の展開形ゲームに対する新しい定義,理解についてはもちろん触れてはいるのだが,定理として強調はしていないので(論文は投稿中としか書けなかった)査読報告書は従来の標準的ゲーム理論による理解,認識に基づいている可能性が高い.(以上)

その他コメントp.1, 論文タイトル「maximin 合理性」という用語が(注釈 17 を除いて)論文タイトルのみに用いられているが、合理性に関する用語は本文中で丁寧に扱われたい。p2, 下から 2 行目「動議」は「動機」p.2, 注釈 4 の 3 行目「.」は「,」p.3, 3 行目「qN1

1 = 1」は「 qN1α = 1」p.3, 下から 4 行目「次節」では

なく 4 章に書かれている。p.3, 下から 3 行目~「自己の期待利得を最大化させる」と「maximin 原理に従って」とあり、期待利得最大化原理とmaximin

原理を同時に用いて論じられているが、注釈 21に両者は「別の原理」と明示されている。p.5, 補題 2.1 の 1 行目「平衡」は「均衡」p.6, 下から 5 行目~各プレイヤーは情報を交換できないので「脅し」を相手に伝えることができないという先行研究に対する批判は、「脅しに信ぴょう性がある可能性がある」という論文の主張に対して諸刃の剣であるように感じる。p.7, 定義 3.2

の 1 行上「u2(µ, q)」は「uI2(µ, q)」,「u2(µ, q

m)」は「uI2(µ, q

m)」p.7, 注釈 17

の 4行目「maximi」は「maximin」p.8, 下から 11行目「vI1」は「vI2」p.8, 下から 11 行目「{(µ1(b1qα + b2qβ) + . . .」は「{µ1(b1qα + b2qβ) + . . .」p.8, 下から 2 行目「注意 3.1 指摘したように」は「注意 3.1 で指摘したように」p.9,

10 行目「.」は「,」p.9, 注釈 22 の 2 行目「精緻化が必要がある」は「精緻化が必要である」または「精緻化の必要がある」p.9, 注意 5.1 注意 5.1 の必

84

Page 89: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

要性が(特に結論の章において)感じられない。「本稿で繰り返し強調しているように」と書かれている通り、2 章や 5 章にも書かれている内容であり、(本論文と本質的に関係のない)クレプス [10] の批判とも思える。

⋆随分懇切丁寧に校正をしてくれて有難いのであるが,掲載不可を答申している報告書にここまで丁寧に校正してくれた意図・動機は何なのだろうか.ひょっとして,「体裁は科学論文に採択される基準であるか疑問である。」を論証しているつもりなのかもしれない 120.なお,「各プレイヤーは情報を交換できないので「脅し」を相手に伝えることができないという先行研究に対する批判は、『脅しに信ぴょう性がある可能性がある』という論文の主張に対して諸刃の剣であるように感じる。」の部分は,展開形ゲームについての新しい定義(先手番プレイヤーの優先的選択権)を意識しないとまさしくご指摘の通りなので,展開形ゲームについての新しい定義とその意義に気づいてくれない限りやむを得ない指摘である.もちろん,「信ぴょう性のある」と命名したのはよく知られた「信ぴょう性のない」を意識した一種のキャッチフレーズとして用いているから「脅し」をどうやって相手に伝えるかまでは考慮していない.(以上)

(III-B) 次の B氏による査読報告書も結論は不採択なのだが,懇切丁寧なコメントの他に今後の研究方針までご指導頂いた.ただ,投稿論文をどう評価しているのか上げたり下げたりも一つ意味のよく分からない査読報告書ではある.

Title: 信ぴょう性のある脅しゲーム” Author: 河野敬雄

1. 論文概要日常的には先手、後手に分かれた 2人のプレイヤーの意思決定状況におい

て、この 2 人とも合理的な選択する場合(例えば、ナッシュ均衡戦略など)、先手番の方が選択主導権を握っている分だけ、後手番プレイヤーより有利になると考えられる。しかし、この状況を展開型ゲームで定式化してみると、必ずしもそうはならない場合があること、即ち、先手番プレイヤーが自分では大きな利得が得られないだけでなく後手番プレイヤーにはより大きな利得が行くような戦略を先手番が選ぶことがあるという状況が存在する。通常、そのようなナッシュ均衡戦略は「不合理」であるとして排除すべきものとしてきた。当該論文では、そのような「不合理なナッシュ均衡」を「maximin

戦略」として合理的に解釈可能な場合があることを指摘する。

成果. 当該論文における具体的な成果は以下になる。主張1: 不完備情報 121展開型ゲームにおいて新たに「maximin 均衡解」

という概念を導入した。(テキスト p.7 第 3 節maximin 戦略)

主張2: Figure 1 の展開図で与えられる 2人プレイヤー不完備情報展開型ゲームGame 1で次の2つの性質

120ミスプリが多い論文は査読者の心証を害するのは当然で何度も読み返したつもりなのだが.この点は十分自覚しているので入試を担当したときは寿命が縮む思いをした.あるいは,上記 (5)に指摘してある「著者以外のコメントを元に改訂された(と思われる)箇所が少なからずあるが、,,」を例証しているつもりかもしれない.実は,この雑誌に投稿するにあたって,前記経済系欧文雑誌に投稿した論文を日本語に書き換える時に記号も変更した.ところが,変更し損ねた部分があったところを目ざとく見つけられてしまったようだ.「著者以外の」というのは濡れ衣である.121以下何か所かで「不完備情報」という言葉が用いられているが「不完全情報」の誤りではないだろうか.「完備」と「完全」は取り違えやすいので注意が必要である.両者はまったく異なる概念である.

85

Page 90: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

(1) 2つの部分ゲーム均衡解—「合理的」な均衡解 (1, α) と「非合理的」な均衡解 (3, β)のみが存在し、かつ

(2) 後者の「非合理的」均衡解 (3, β)は「maximin 均衡戦略」として実現されるている」を満たすものが存在する。(テキスト p.7 Line: +4 – +8 )主張3: この「maximin 均衡戦略」 は「信ぴょう性のある脅し」という

解釈ができる。(テキスト p.9 Line: +17 – +20)従って、このゲームは「必ずしも先手番のプレイヤー1が主導権を握るとは限らない例になっている。(テキスト p.9 Line: −6 – −3)

⋆ 投稿論文の概要は正しく理解してもらっているように思えるのだが,結局その導出方法が納得できない,ということだろうか.しかし,査読報告書を読み進むとだんだんと投稿論文の論理からはずれて従来の標準的ゲーム理論のパラダイム内の論理的枠組みから一歩もでていないように感じられる.たとえば,投稿論文では「主張 1」にあるような「maximin均衡解」という概念は導入していない.確かに発表済の論文(河野 2013, [38])を引用してmaximin原理,maximin合理性とは呼んでいるが「均衡」概念とは認識していないし,いわゆる「ナッシュ均衡の精緻化」の一環だとも主張していない.というより展開形ゲームの場合,先手番のプレイヤーの優先的選択権によって原理的に「ナッシュ均衡の精緻化」は不要な概念である,ということを主張しているのである.ただ,投稿論文は前半の展開形ゲームに対する新しい定義とその帰結の部分については分離して別の論文にしたため,投稿論文では現在投稿中として内容を簡潔に示唆することしかできなかった.しかし,展開形ゲームについて,「先手番が選択主導権を握っている分だけ」と理解しているのだから,この部分が「中級レベルの教科書」とは明らかに異なる認識をしている論文だ,ということは理解出来たはずなのにどうして以下のような評価になるのだろうか.(以上)

手法. 当該論文で扱われているモデル及び分析手法は、1980 年代に「ナッシュ均衡の精緻化」の研究で用いられてきたもので、現在ではゲーム理論やミクロ経済学の中級レベルの教科書において「完全均衡解」の項で紹介されている標準的なものである。ただし、当該論文では「maximin 均衡戦略」においてプレイヤーが得られる利得値はそのプレイヤーの情報集合上で定るもので、通常の展開型ゲームで用いる利得値とは異なっている。例えば、下のFigure 1 のゲームにおいてプレイヤー 2が戦略P = (p1, p2, p3). Q = (qα, qβ)

を選択した時の利得値に関して言えば、通常は

(1.1) u2(P ;Q) = p1qαb1 + p1qβb2 + p2qαb3 + p2qβb4 + p3b5,

where 0 ≤ pi ≤ 1 (i = 1, 2, 3) with p1 + p2 + p3 = 1, 0 ≤ qi ≤ 1 (i =

α, β)with qα + qβ = 1 により考えるが、当該論文では

(1.2) uI22 (P ;Q) = µ1qαb1 + µ1qβb2 + µ2qαb3 + µ2qβb4,

where 0 ≤ µi ≤ 1 (i = 1; 2) with µ1 + µ2 = 1

で定める利得値を採用している。しかし、この状況でナッシュ均衡、maximin

戦略を考える場合に両者の間には本質的差異は生じない。

86

Page 91: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

1

2

3

p1

p2

p3

• I2

•����

bbbbb

α

β

(a1, b1)

(a2, b2)��

���

bbbbbb�����

bbbbb

•◦

α

β

(a3, b3)

(a4, b4)

プレイヤー 1

プレイヤー 2

FIGURE 1, Game 1

JJJJJJJJJJ◦ (a5, b5)

⋆ このあたりから風向きが変わってくるように感じるのだが,投稿論文でもmaximin

戦略は各情報集合毎に定義しなくてはならないことを指摘しているにもかかわらず,情報集合が 1つの簡単な展開形ゲームの例だけから両者の間に本質的差異は生じない,という結論を導くのは短絡的過ぎる.maximin原理,maximin戦略は普遍的概念であることは明らかであるにもかかわらず,簡単な例を根拠にして従来の標準的ゲーム理論の枠内で理解しようとする限り以下の評価に見られるように新規性を否定する結論が導かれるのはけだし当然ではある.(以上)

2. 評価

以下に述べるように明晰性、新規性、完成度の点から当該論文はまだ公表段階には達していないと判断する。

意義. 従来の「ナッシュ均衡の精緻化研究」では「合理的なナッシュ均衡」に光を当て、それを明確化することで理想とする「精緻化された均衡解」概念に近づこうとの方針で研究を進めてきた。その視点を変えて、「不合理なナッシュ均衡解」に新たな「解釈」という光を与えることで、逆に「合理的なナッシュ均衡」の姿を浮き彫りにし、「精緻化された均衡解」概念に達しようとする壮大な研究構想を示唆している所に当該研究の意義を見出すことが出来る。しかし、実際には当該論文の成果とされる主張2~3では、『「不合理な

ナッシュ均衡解」に対して、別の新たな合理的「解釈」を与える』と言う課題の妥当性を示しているのみで、上述の当該研究が内包する壮大な野心の実現に向けた歩みを始める遥か手前の所で当該論文が終わってしまっている。従って、もっと詳しく展開できるはずの幾つかの重要な論点がはっきりさせないまま残されてしまい、事の本質が全く見えなくなってしまった。次節でこれについて少し詳しく論じる。

⋆「壮大な研究構想を示唆している」とはいささか過大評価ではないだろうか.具体的な例を挙げて例証しているのだからもう少し具体的に評価してほしかった.(以上)

明晰性. 当該論文はその内容、構成共によく整理されておらず、またその議

87

Page 92: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

論においても明晰さに欠けており、当該研究の本質的重要性を表現しているには程遠い。残念ながら学術論文としての完成度は低いと言わざるを得ない。実際、論文全体で展開されている議論はその論旨や流れが分かり難く、何

よりも、主結果がそれ自身の成り立つ条件とともに定理としてきちんと明示されていないため、何が証明されていて何が示されていないのかが不明確になっている。例えば、この論文の第2節~3節における中心となる成果(主張2)は、

以下のような簡単な例を与えることで十分示せるにもかかわらず、6ページ以上にわたる冗長な議論を行っているところにも明晰性の欠如が見て取れる。

1

2

3

p1

p2

p3

• I2

•����

bbbbb

α

β

(4, 3)

(0, 2)��

���

bbbbbb�����

bbbbb

•◦

α

β

(1, 1)

(2, 2)

プレイヤー 1

プレイヤー 2

FIGURE 2, Game 2

JJJJJJJJJJ◦ (3, 4)

例 1. Figure 2 で与えられる 2人プレイヤー不完備情報展開型ゲームにおける2つの部分ゲーム完全均衡解(この例では部分ゲームが存在しないので全て「部分ゲーム完全均衡解=ナッシュ均衡解」になる。)(1, α), (3, β) のうち、「信憑性のない」不合理な解として知られている均衡解 (3, β)が実は「maximin 均衡解」になっている。

⋆ 投稿論文には要旨としてはっきりと何か新しい定理を証明するのではなく従来の標準的ゲーム理論の枠内では「不合理」だとみなされていたナッシュ均衡が実は別の視点からは「合理的」に選択され得ることを論証する,と述べているので,必ずしも定理を証明しているわけではない.なお,論証は例示をもって行っているので,確かに,数値例を1例挙げれば足りる,という考え方はある.しかし,数値例では別のところでも指摘したことだが,一般的にどこまで普遍的に成り立つ事柄なのかが見えてこない.実際,投稿論文で論証していることは,『「信憑性のない」不合理な解として知られている均衡解が実は「maximin 均衡解」になっている。』ということではなく,プレイヤー 2がmaximin

戦略を採用し,プレイヤー 1が従来の標準的ゲーム理論に従って「合理的均衡解」を選ぶとプレイヤー 1が「不合理な均衡解」を選ぶより大きな損失を被り,プレイヤー 2は想定内の利得を得ることができる,だからプレイヤー 2はmaximin戦略を採用する「合理的」根拠を持ち,それをプレイヤー 1が理解すればプレイヤー 2からみて最大利得が得られる「不合理な均衡解」が実現するという意味で「信ぴょう性のある脅し」であると言える(この表現はもちろん,「信ぴょう性のない」脅しという従来のゲーム理論にお

88

Page 93: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

いてよく知られた用語を意図的に借用している)ということを可能な限り普遍的推論形式を用いて論証したつもりである.これらの含意をより説得的に,普遍的に成り立つ事実として主張するためには数値例だけでは到底説得的ではないだろう,という気持ちに基づいている.将来的に本講義録の主張がゲーム理論の標準理論となった暁には,数値例で説明すれば事足りる,というのはその通りである.

新規性. 主張2ないしは例 1そのものは単独の成果としては特段の興味を引くものではなく、中級レベルの標準的教科書の練習問題の域を出ない。また、主張3において与えた「解釈」も、最近のアルゴリズム・ゲーム理論及び認識論的ゲーム理論の側面から与えられるものならば兎も角、実際は上述の標準的教科書における説明に止まっているため、そこに新規性を認めることはできない。

⋆経済学関係のゲーム理論家は曲がりなりにも“Why are results of the paper so different

from standard game theory?”と少なくとも新規性(珍奇性?)は認めてくれたように思うのだが,察するに工学系のゲーム理論家はすでに確立したと思われている理論的基礎にはあまり関心がないのだろうか.(以上)

3. 当該研究の再検討

この節では当該論文における研究が持つ意義について再検討を行いたい。特に、詳しく展開できるはずでありながらはっきりさせないままの状態で残している事柄とは何か、当該論文の研究構想はどのようなものであるべきか、という所に焦点を当てることにする。最初に、研究史的背景を確認しておく。

歴史背景. 1960 年代中期に Harsanyi 及び Selten により展開型ゲームにおけるナッシュ均衡解の「適合性」に関しての疑義が提起され、その後この課題は大きな関心を呼び盛んに研究が行われてきた。そに中でも Selten (1965,

1975)による部分ゲーム完全均衡解及びそれに関係する種々の戦略概念(完全均衡,行動戦略,逐次均衡解など)の発見と相まって、「ナッシュ均衡の精緻化問題」としてゲーム理論研究の中心課題となり、その成果はHarsanyi-Selten

による大著「General Theory of Equilibrium Selection in Game (1988)」により一応の到達点に達した。1990年代にはいるとこの理論はミクロ経済学において盛んに応用され、この分野での基本的手法の一つにまで普及している。

⋆投稿論文は前述したように,経済系欧文誌に投稿した内容の後半部分だけで,そのことをあまり意識しないまま,論文の冒頭に「ナッシュ均衡の精緻化に関して新たな知見を加えるものである.」と書いてしまったために誤解されたのも無理からぬ点はあるのだが,欧文論文の前半では前述したように展開形ゲームに新しい定義を与えてその結果,展開形ゲームに関しては原則として複数のナッシュ均衡があっても全員合意の下で一意に選択されて,ナッシュ均衡の精緻化は不要である,という否定的再検討をベースにして,投稿論文では新たにMaximin合理性を導入して従来の基準とは別の意味のナッシュ均衡の精緻化が有り得ることを論証するというのが投稿論文の要旨だったので,旧来のナッシュ均衡の精緻化には触れていないしその方向を目指していたわけではない.

89

Page 94: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

なお,私はHarsanyi-Seltenの大著を完全に理解しているとは言い難いが,少なくとも基本的認識の部分で本講義録におけるそれとは異なっていることを指摘した.(11頁,19頁,44頁を参照されたい.)(以上)

しかし、この部分ゲーム完全均衡解の概念でも「不合理」なナッシュ均衡解を完全に排除することができないことが、この研究の初期段階からよく知られており、以下のFigure 1 は部分ゲーム完全均衡解の中に不合理な解を持つ簡単な実例を与えるものとしてよく知られている。実は、この弱点をいかに克服するのか、即ち、「不合理」なナッシュ均衡

解を完全に排除することができるような更なる適正な解概念を提示することが「ナッシュ均衡の精緻化研究」の中心問題である。この問題に取り組むために、そのような不合理な解を持つ展開型ゲームの具体例を「再検討」することは、大きな意味を持つものと考えられる。当該論文の研究もこの問題意識の上に位置付けられるのが自然である。一方、1990 年代には入ると数理論理学及び計算機科学理論の発展と相

まって、プレイヤーの意思決定プロセスのアルゴリズムやその合理性を計算理論・様相論理学の側面から解明しようとする研究(ゲーム理論基礎研究)が始まった。これらは現在、アルゴリズム・ゲーム理論及び認識論的ゲーム理論としてそれぞれが独立した研究分野へと成長を続けており、近時はこれら2つの研究分野の成果を応用して新たな視点から「ナッシュ均衡の精緻化問題」の分析研究が行われている。

再検討. 従来の「ナッシュ均衡の精緻化研究」において「合理的なナッシュ均衡」に光を当てそれを明確化することで理想とする「精緻化された均衡解」概念に近付こうと研究を進めてきた。その視点を変えて、「不合理なナッシュ均衡解」に新たな「解釈」という光を与えることで、逆に「合理的なナッシュ均衡」の姿を浮き彫りにし、「精緻化された均衡解」概念に達しようとする研究戦略思想を示唆している所に当該研究の意義がある。

⋆ 投稿論文で示したことは標準的ゲーム理論で「不合理なナッシュ均衡解」として排除されてきた均衡解がmaximin原理に基づくmaximin合理性の立場からは「合理的な戦略」として両プレイヤーに選択されるようなゲームが有り得る,ということを例証したのであって,標準的ゲーム理論の枠内でさらなる「ナッシュ均衡の精緻化」を追及しようとした論文ではない.従来の標準的ゲーム理論のパラダイム内で理解しようとするから投稿論文には書いてない意義を見出してしまうのではないのだろうか.以下ますます投稿論文の意図した方向とは「ずれた」方向に研究が発展してゆく気がする.(以上)

当該論文においては明示されていないが、著者が示そうとしていることは「条件 (1), (2) を満たすFigure 1 型のゲームを全て決定する」ことではないかと想像する。即ち、

定理1. Figure 1の展開図で与えられる 2人プレイヤー不完備情報展開型ゲームGame 1 が次の性質 (1), (2)

(1)2つのナッシュ均衡解(部分ゲーム均衡解)–「合理的」な均衡解 (1, α)

と「非合理的」な均衡解 (3, β)– のみが存在し、かつ

90

Page 95: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

(2)後者の「非合理的」均衡解 (3, β)は「maximin均衡解」になる ( ママ )

を満たす部分ゲーム均衡解を持つための必要十分条件は、そのゲーム (Game

1) の利得値 {(ai, bi)} i = 1, 2, 3, 4, 5に関する条件A, B を満たすことである。A: Max{a2, a3, a4, a5} < a1 かつMax{a2, a4} < a5B: b1 < b4 ≤ b2 < b1 < b5

1

2

3

p1

p2

p3

• I2

•����

bbbbb

α

β

(4, 3)

(0, 2)��

���

bbbbbb�����

bbbbb

•◦

α

β

(1, 2)

(2, 1)

プレイヤー 1

プレイヤー 2

FIGURE 3, Game 3

JJJJJJJJJJ◦ (3, 2)

また、この定理の適用限界を以下の例は示している。

例 2. 上記の展開型ゲーム 3 (Game 3) は次の性質を持つ。(1)2つのナッシュ均衡解(部分ゲーム均衡解)–「合理的」な均衡解 (1, α)

と「非合理的」な均衡解 (3, β)– のみが存在し、かつ(2) 後者の「非合理的」均衡解 (3, β)のプレイヤー2の戦略は弱支配戦略

であり、「maximin 均衡解」にはならない。(3) 「maximin 均衡解」は (3, α)になる。

この例2は、「非合理」なナッシュ均衡解のプレイヤー2の成分がmaximin

戦略ではない場合でも、もちろんこれはプレイヤー2の利得最大化という合理性には矛盾する「弱支配」という戦略になるが、プレイヤー1の戦略選択とは独立にプレイヤー2が実際に選択できる範疇の戦略概念で解釈することが可能であることを示唆している。

⋆ 投稿論文でも本講義録でも何度も指摘しているのだが,maximin戦略は自己の利得値だけで決まるので相手もmaximin戦略を選択しても「均衡戦略」であるとは限らない.その点についてはすでに河野(2011, [38])で論じたし,投稿論文にも引用して主張したはずである.さらに投稿論文ではmaximin戦略が混合戦略となる場合でも「信ぴょう性のある」脅しになり得ることは既存の論文の例で示した.なお,「弱支配戦略」は投稿論文(本講義録についても)の内容とは関係しない上,maximin戦略と絡めて議論することで何か一般的で意味のある定理が生まれるとは現在の所考えていない.(以上)

研究構想の再構築. 以上の観察から研究プログラムを以下のように再構築する。

91

Page 96: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

ナッシュ均衡の精緻化問題の研究の究極的目的は、目的: ナッシュ均衡解を精緻化し、「不合理なナッシュ均衡解」を含まな

い新しい解概念を見つけよ。である。この目的に向かっての従来の研究方針は、その理想とする「精緻化された均衡解」概念に近付くために「不合理なナッシュ均衡」を削除していき、そして最終的に残った解が求める「合理的」なものになるとの見立てから、その削除過程の分析に研究の興味を集中することであった。一方で、「合理的なナッシュ均衡」の姿を浮き彫りにするためには、逆に

「不合理なナッシュ均衡解」を特定できれば、その補集合が求める「不合理なナッシュ均衡解を含まない新しい解概念」になるという研究方針で、上の目的に接近しようという戦略も考えられる。これは即ち「不合理な均衡解」とは何かを解明することに他ならない。そこで、後者の立場を採用した場合、その目標は目標: 「不合理な均衡解」の定式化或いはその定性的な解釈を求めよ。と

なる。そして、この目標を具体化しより明確な形で問題を把握するために取り組むべき最初の課題は以下になる。即ち、課題: 「不合理な均衡解」を持つ良い例を見つけ出し、そこに現れる全て

のナッシュ均衡を調べ、求める「定式化」及び「解釈」を明確化する。この課題を解決するための良き導き手を探す意味で、当該論文のように

Figure 1 型のゲームを取り上げる意義はこのゲームが求める導き手になり、その詳しい分析が我々の課題解決に向かう道筋を与えてくれるのではないかという期待が出来る所にある。そこで、その期待が現実となるのかを見るために、最初に最も簡単な「2

つのナッシュ均衡解 (1, α)と (3, β)のみを持つ」ゲームの考察から始めるのが妥当であり、これが当該論文の研究目標に他ならないと考える。具体的には、以下の問題の考究である。

問題 1. Figure 1 型ゲームについて、以下を調べよ。(1) 「2つのナッシュ均衡解 (1, α)と (3, β)のみを持つ」ための利得値

{(ai, bi) ; i = 1, 2, 3, 4, 5}の条件を求めよ。(2) 更に、この場合のプレイヤ-2の戦略 の解釈を利得値 {(ai, bi) ; i =

1, 2, 3, 4, 5} の条件で分類せよ。

注意 2. この分類について補足する。(1) この (2)で意図する解答の形は、以下のようなものである。I: {(ai, bi) ; i = 1, 2, 3, 4, 5} が条件A, B を満たすとき、βはmaximin 戦

略に限る(定理1)II: {(ai, bi) ; i = 1, 2, 3, 4, 5}がコレコレのとき、βはプレイヤー2の弱支

配戦略に限るIII: {(ai, bi) ; i = 1, 2, 3, 4, 5}が XXXXX のとき、β はプレイヤー2の

YYYY 戦略に限るIV: · · · , · · ·· · · , · · ·

92

Page 97: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

· · · , · · ·X: その他(2) 分類 [I] のクラスに入るゲームが存在することを示しているのが当該

論文の主成果であること、そして分類 [I] のクラスについてのそれは例 2 が示している。

(3) 分類 [I]–[IV] の戦略分類では、プレイヤー2の期待利得関数として u2

でなく uI2を用いる真の意味が表出するような形で、プレイヤー2が自らの

利得情報のみから戦略を選び、プレイヤ-1のそれとは独立になる形で定る戦略概念を導ければ素晴らしい。

(4) 分類 [X] には、プレイヤー間での他のプレイヤーの選択及び利得などに関する仮想信念の相互共有に基づいた意思決定戦略などで、様相論理モデルなどを用いて記述される戦略などもこの分類に入るかもしれないことを想定している。

⋆ 研究指導をして頂けるのは有難いのだが,目的として『ナッシュ均衡解を精緻化し、「不合理なナッシュ均衡解」を含まない新しい解概念を見つけよ。』とのご指摘,しかし,ゲーム理論の専門家の説 122を考慮するとどうもすでにこの「精緻化」の問題は行き詰まっている可能性があり,リスクの大きい研究目標ではないだろうか.これから学位を取らせる大学院生には勧められない(私は失うものがないから良いだろう,というのはその通りだが).しかし,その後の「問題1」は頂けない.理由のひとつは,ナッシュ均衡概念にしろmaximin戦略にしろ,利得表の値の大小関係,特に等号のあるなしでデリケートに変化するために必要十分条件の定式化が難しい,という印象を持っている.かつ,そのようにして求めた条件の,特に期待利得が同じ場合,実用上の含意が説明しづらい.苦労して求める割には益が少なくて院生の研究課題としてもお奨め出来ない,というのが私の率直な感想である.もちろん私も研究意欲が湧かない.実際,先行研究の「ナッシュ均衡の精緻化」に関するもろもろの概念(部分ゲーム完全均衡,完全均衡,...)のすべてについて数値例で微妙に変化しどれ一つとして例外なく「合理的である」と判定できるような普遍的な精緻化概念は存在しないのではないだろうか.本文中でも引用したが (32頁),Basu(1990, [9])の論文を参照されたい.(以上)

4. 結語

当該論文の雑誌掲載は時期尚早というのが今回の査読結果である。しかし、第3節で見たように当該論文の研究はその方向性において示唆的であり、将来性を内包していると感じる。最後に当該論文が、「不合理な均衡解」の解明を通したナッシュ均衡解の精緻化という「約束の地」へと我々を導くモーセを救い育てた「パロの娘」123たることを希望して当報告を終りたい。

122本講義録(4.5節,40頁の最後)でも引用したようにビンモア (2007=2010, [11] 70頁)は「ゲーム理論の歴史の中で,この精緻化の議論は事実上終っている.ただし,応用経済学者は,どの精緻化の議論が自分の先入観に近いのかをいまだに探求し続けているが.」と皮肉っぽく述べている.一方,Govindan-Wilson(2008, [19] p.254)には “But so far none has obtained an ideal refinement of the Nash equilibria.”とある.123旧約聖書に出てくるらしい.国中の新生児を殺すように命じたファラオ(パロ)の命令に抗して,母親が生まれたばかりのモーゼをナイル川に流し,それをファラオの娘が拾い上げてわが子として育てた,と言われている.しかし,工学系学会誌の査読報告書に引用されても真意を測りかねる.おなじ例えられるならば,アンデルセンの有名な童話にあるように,華やかな行列をじっと眺める沿道の子供に例えられ

93

Page 98: ゲーム理論の数学的基礎 ―批判的再検討― - Kobe …目次 1. ゲーム理論再考―ゲーム理論の創設者は誰か? 1 1.1. 問題意識 1 1.2. 先行研究

⋆ 懇切丁寧な査読報告ならびにご指導,有難う御座いました.(以上)

最後にあらためて本講義録といくつかの査読報告書を読み比べて感じることは,von

Neumann(1928 [77], 1944 [78])と Nashの一連の論文 (1950 [57]; [58], 1951 [59]; 1953

[60])以後のゲーム理論の発展は今現在知られているような道筋しか有り得なかったのだろうか,本当は他にも発展の方向はあったのではないのだろうか,という想いである.特に本講義録で主として考察した展開形ゲームに関しては,ノイマンのゲーム理論に登場はするものの,「提携」を主要概念とする彼の協力ゲーム理論の研究対象ではないし,標準形ゲームに対して定義されるナッシュ均衡概念をそのまま展開形ゲームに適用した場合,展開形ゲームを特徴づける順序構造を反映させることが出来ない.順序構造を反映させた均衡概念,たとえば後向き帰納法や部分ゲーム完全均衡の概念を導入しようとするとゲーム理論の核心的公理である公理 2.1(期待利得最大化原理)との整合性に問題が生じる.そもそも,minimax値 (=maxmini値)が一意に定まるゼロサムゲームと提携を前提

とするノイマンの協力ゲーム理論の発想と,非ゼロサム非協力ゲーム理論であって,意味のある複数の均衡が存在する可能性のあるナッシュのゲーム理論のそれとを混同したことによって,その後のゲーム理論の発展に如何に不自然な歪みを生じさせたことか,と感じるのは私だけであろうか.(おしまい)

たいとは密かに願っている.

94