Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
不完全信息静态博弈
吴建设
不完全信息
一个寓言故事的启示:
有一次,伊索进城,半路上遇见一位法官。法官严厉的盘问:“你要去哪儿?”伊索回答说:“不知道。”于是,法官起了疑心,将伊索关进了监狱,严加审问。“法官先生,要知道,我讲的是实话。”伊索说,“我确实不知道我会来监狱。”
启示:我们不可能了事如神,更不可能预测未来,不确定性就像日出日落一样不可避免。
策略:我们没办法做到无所不知,也不止于一无所知,应尽可能利用所知的一切寻求最优行动。
例:不完全信息市场进入博弈
某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否
允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那
么,正如下表后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优
战略均衡——A阻挠,B不进入。如果阻挠的成本高,那么,正如下表前两列所表
示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡——A默
许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与
人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全
部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠
成本和低阻挠成本则是两种不同的类型。
高成本 低成本
默许 阻止 默许 阻止
进入 40, 50 -10, 0 30, 80 -10, 100
不进入 0, 300 0, 300 0, 400 0,400
A
B
例:不完全信息市场进入博弈
进入者不知道在位者的具体类型,但知道根据其阻止别人
进入市场的难度有两种类型“高成本”和“低成本”,并
且知道其为每一种类型的概率,也称为“信念”。
收益矩阵如图所示,分析它的纳什均衡。
均衡结果将依赖于在位者的信念。
高成本 低成本
默许 阻止 默许 阻止
进入 40, 50 -10, 0 30, 80 -10, 100
不进入 0, 300 0, 300 0, 400 0,400
不完全信息
信息的不对称:
博弈中一方往往拥有对方不知道的信息,称为不对称信息或不完全信息。
拥有完全信息的一方往往会占有优势,但不一定总是占有优势。
信息与收益:
博弈中研究的信息是能够影响参与人收益的信息。
完全或对称信息,意味着参与人的收益函数是共同知识。
不完全信息意味着不知道对方的收益函数,但可推断。而关于这种推断的概率分布是共同知识。
把拥有不同收益函数的参与人归为不同的类型。
海萨尼转换
参与人的收益函数类型是不清楚的。如果一些参
与人不知道另一些参与人的收益函数,或收益函
数不是共同知识,参与人就不知道他在与谁博弈,
博弈的规则是没有定义的。
因而在1967年以前,博弈论专家认为此时博弈的
结构特征是不确定的,无法进行分析。
海萨尼转换
海萨尼转换
海萨尼提出了一种处理不完全信息博弈的方法,即引入一个虚
拟的局中人——“自然”。自然首先行动,它决定每个参与人
的特征。每个参与人知道自己的特征,但不知道别的参与人特
征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈,
第一个阶段是自然N的行动选择,第二阶段是除N外的参与人的
静态博弈。这种转换被称为“海萨尼转换”,这个转换把“不
完全信息”转变成为完全但不完美信息,从而可以用分析完全
信息博弈的方法进行分析。
“不完美信息”指的是,“自然”作出了它的选择,但其他参
与人并不知道它具体选择是什么,仅知道各种选择的概率分布。
海萨尼转换
1967年,海萨尼(John Harsanyi),指出所有老定
义下具有不完全信息的博弈都可以在不改变其精
髓的情况下被重新模型化为一个完全但不完美信
息的博弈,这一切只需要添加一个由自然在不同规则集合中进行选择的初始行动即可。
老的定义是这样描述的:在完全信息博弈中,全
体参与人都知道博弈的规则,否则这一博弈就是一个不完全信息博弈。
在博弈中,其中有参与人也许对对方博弈的收益函数
并不十分清楚,可采用概率分布来表示其类型。也就
是基于概率对博弈进行分组建立博弈收益函数。
比如甲与乙选择策略时,可以这样考虑,甲选择某一
种策略时,乙选择策略有几种,乙的这些策略按发生
的概率进行分组。通常构建一个博弈树就可以较好地
表达这一切。
海萨尼的观点关键在于假定:对于策略选择发生的概
率是一个共同知识。先验概率是作为博弈规则的一部
分存在,因此,一个参与人必须是持有关于其它参与
人类型的先验信念,同时,在观察到他们的行动后,
就要假定他们遵循着均衡的行为,然后更新自己的信
念。
通过海萨尼转换,不完全信息博弈变成了完全但不完美
信息博弈(games of complete but imperfect information)。
这里的不完美信息,就是指其他参与人只知道某一参与
人某些方面类型的分布概率,而不知道该参与人在这些
方面的真实类型。
在上述转换的基础上,海萨尼提出了贝叶斯纳什均衡
(Bayesian Nash equilibrium)。对此,可以作如下解释:在
不完全信息静态博弈中,参与人同时行动,没有机会观
察到别人的选择。给定其他参与人的策略选择,每个参
与人的最优策略依赖于自己的类型。
由于每个参与人仅知道其他参与人有关类型的分布概率,
而不知道其真实类型,因而,他不可能知道其他参与人
实际上会选择什么战略。但是,他能够正确地预测到其
他参与人的选择与其各自的有关类型之间的关系。
因此,该参与人的决策目标就是:在给定自己的
类型,以及给定其他参与人的类型与策略选择之
间关系的条件下,使得自己的期望收益最大化。
贝叶斯纳什均衡是一种类型依赖型策略组合。在
给定自己的类型和其他参与人类型的分布概率的
条件下,这种策略组合使得每个参与人的期望效
用达到了最大化。
回到前面的例子:不完全信息市场进入博弈
某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否
允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,那
么,正如下表后两列所表示的,A企业的占优战略是阻挠,博弈有重复剔除的占优
战略均衡——A阻挠,B不进入。如果阻挠的成本高,那么,正如下表前两列所表
示的,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡——A默
许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与
人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全
部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠
成本和低阻挠成本则是两种不同的类型。
高成本 低成本
默许 阻止 默许 阻止
进入 40, 50 -10, 0 30, 80 -10, 100
不进入 0, 300 0, 300 0, 400 0,400
A
B
假定A企业阻挠的成本的概率分布是:
成本高:50%; 成本低:50%
企业B进入市场的期望收益是:
40 ×50% - 10 ×50% = 15
企业B不进入市场的期望收益是:
0×50% - 0 ×50% = 0
B的选择进入,A的期望收益是: 50 ×50% +100 ×50% = 75
贝叶斯均衡是(15,75)
按照海萨尼的方法,所有参与人的真实类型都是给定的。其他参与人虽然不清楚某一参与人的真实类型,但知道这些可能出现的类型的分布概率,而且这种概率是共同知识。用上例来说,共同知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率,而且意味着A也清楚B知道这一概率