书城经济历史上最具影响力的经济学名著32种
36691400000032

第32章 三十二、博弈论

梯若尔

【主要内容】

1.写作背景

本书虽然写作于20世纪90年代初期,但作为博弈理论的领军人物,两位作者吸收了最前沿的理论成果。十多年来,博弈论的进展不大,因而尽管出版11年来此书一直没有进行修订,但时至今日,它仍然是博弈论领域最前沿的教科书。

写作这本书时,让?梯若尔与朱?弗登伯格正师从于埃瑞克?马斯金(Eric Maskin)教授,马斯金在他办公室的多次讲授中将现代博弈论的文献不断介绍给梯若尔和弗登伯格,因此从那个时候起,两位作者就从与马斯金的合作中受益匪浅,并吸收了他思想的精华。

1994年,诺贝尔经济学奖颁给了纳什等三个人,主题自然是博弈论。纳什凭其开山之作获得诺贝尔奖当之无愧。但是,这只是一半。纳什的这篇“n人博弈的均衡点”开辟的思路现在被称为“非合作博弈”,这也是现在运用最广,研究最深入的一个方向。梯若尔与弗登伯格合著的名著《博弈论》就是全面总结非合作博弈的里程碑。

梯若尔认为:“博弈论是研究人与人之间、组织以及国家之间的相互作用。我们用博弈论这种工具把相互作用公式化,并由此开始思考政治学、经济学和社会学的许多问题。我们所做的工作是给出一些工具帮助我们了解一些情况的含义。我们假设人们按照自己的利益行事,当然有时人们从自身利益出发也会选择合作。我们来寻找系统的均衡,比如纳什均衡,即每个人从自身利益出发行动,看这样会有什么结果。”这种思想很重要,因为当你设计机制或者改革的时候,你必须考虑会发生什么情况,行动者在这样的情况下会怎样做,如果想把事情分析透彻,就必须用博弈论表述出来,这样就能知道改变游戏规则时会有什么样的结果。弗登伯格和梯若尔写的这本《博弈论》用数学方式表达,系统而全面,也有相当深度。其实我们每个人每天都在不自觉地用博弈论方法作出各种决策。博弈在生活中,博弈论也在生活中。

但是,在经济学文献中对博弈论最早的研究是古诺(Cournot,1838),伯川德(Bertrand,1883)和埃奇沃斯(Edgeworth,1925)关于垄断定价和生产的论文,但这些都被视为特例而没有改变经济学家对大多数问题思考的方法。约翰?冯?诺曼(John von Neumann)和奥斯卡?摩根斯坦(Oskar Morgenstern)在他们1944年著名的《博弈论和经济行为》一书中引进了通用博弈理论的思想,并提出大部分经济问题都应该用博弈来分析。他们介绍了博弈的扩展式和策略式的表示法,定义了最小最大解,并证明了这个解在所有两个参与人的零和博弈中存在。纳什(Nash,1950)提出“纳什均衡”的概念,这一概念把博弈论的分析扩展到非零和博弈,这也是古诺和伯川德所研究的特定模型均衡的一个自然推广,并且它是大多数经济分析的起点。

近年来,泽尔腾(Selten,1965)引入了“子博弈完美性”的概念,通过这个概念排除了纳什均衡中不合理的均衡解,即那些依赖于不可信威胁的均衡解。通过子博弈完美均衡可以分析一些动态博弈和重复博弈。海萨尼(Harsanyi,1967―1968)提出了使用标准博弈论技术来模型化不完全信息情形的方法,在不完全信息下,参与人对其他人的支付是不确定的,由此而引出的贝叶斯纳什均衡是很多博弈论分析的基础。但是当信息不完全和动态博弈同时出现时,贝叶斯纳什均衡就显得太弱了,这就好比纳什均衡在动态博弈中允许空洞威胁存在一样,不完全信息博弈的求解依赖于将子博弈完美性的思想扩展,这些求解思想按照限制性从小到大顺序分别是完美贝叶斯均衡,克瑞普斯和威尔逊(Kreps and Wilson)的序贯均衡以及泽尔腾(Selten,1975)的颤抖手完美均衡,这些思想在掠夺博弈和劳动力市场信号传递博弈中有广泛的应用。因此,1994年,诺贝尔经济学奖奖给了泽尔腾、海萨尼和纳什三人。梅尔森(Myerson,1978)给出适当均衡的概念,他对完美均衡进行了精炼,要求沿着被扰动策略的收敛序列上参与人在代价越高的“错误”上犯错的可能性越小。

《博弈论》的两位作者让?梯若尔和朱?弗登伯格正是对前人的非合作博弈进行了高度的总结,本书涵盖了非合作博弈的全部重要内容,不仅包括策略式博弈、纳什均衡、子博弈完美性、重复博弈以及不完全信息博弈等常规内容,而且还包括马尔可夫均衡这样的非常规内容。作为整个博弈理论中最为经典、与经济学中理性人假设最一脉相承、也是应用最为广泛的理论,非合作博弈是博弈理论中最为重要的部分,并且在相当一段时间里还将如此。此外,尽管对于一些研究者来说,该书可以作为一本参考书或者是部分文献的导读,两位作者写作本书的主要目的是将其作为一本博弈论课程的教材,因而该书集中介绍了一些概念和一般性的结论,案例的使用上也主要是“简化的例子”而不是具体的应用。

2.主要内容

《博弈论》一书写作于90年代初,但是至今仍然是经济学者和研究生的常备参考书。由于90年代之后博弈论的发展速度放缓,该书的内容基本上仍然处于前沿的位置。该书有以下几个特点:第一,覆盖面广,几乎涵盖了博弈论的各个领域;第二,关注博弈论发展的前沿,参考书目齐全;第三,深入浅出,既可以满足一般读者对博弈论的了解,也可以满足爱好技术性证明的读者对于博弈论精髓的把握;第四,本书的两位作者本人就是成就卓著的博弈论专家,他们在写作本书时因此能把握全局,将博弈论纷繁复杂的内容整理为逻辑严谨的章节,极大地方便了读者对博弈论整体的把握。

该书的整体布局从易到难,第1篇从两个猎人参与猎鹿还是猎兔的决策开始,介绍了最简单的参与人同时行动的博弈模型,这种模型可以通过策略式博弈和纳什均衡来研究;但是博弈论的应用对于有动态结构的情形更加感兴趣,这种动态博弈可以用“扩展式博弈”的概念把这种情形模型化。在第2篇完全信息的动态博弈中,讨论了扩展式博弈的的建模方法,扩展式博弈的求解方法早在斯塔克伯格的教科书中就有详细地论述,该书中引入泽尔腾的子博弈完美均衡的概念,使得逆向归纳的思想更加规范,可以延伸到扩展式博弈中。在动态博弈中,我们了解的最透彻的是重复博弈,在第5章中给出了系统处理重复博弈的一般方法。如果在一个博弈中,某些参与人不知道其他参与人的收益,那么这个博弈是不完全信息博弈,该书前两章的内容都是在完全信息假设下给出的,对于不完全信息博弈,该书重点讨论了一类特殊的不完全信息博弈――机制设计博弈,这大概与作者对产业经济学有特殊的兴趣有关吧。在完全信息中引入的子博弈完美性的概念对于不完全信息不起作用,不完全信息导致的复杂性表现在:即使每一期的期末参与人都观察到了别人的行动,由于参与人不知道别人的类型,所以从某一时期的开始并不能定义良好的子博弈,因此也就无法检验后续的策略是否是一个纳什均衡。在第4篇不完全信息的动态博弈中发展了两个概念:“完美贝叶斯均衡”以及克瑞普斯和威尔逊的“序贯均衡”,他们将子博弈完美性扩展到不完全信息博弈。在这一篇中所发展的完美贝叶斯均衡只限于带有可观察到的行动和不完全信息的多阶段博弈,与之相对照,序贯博弈是为一般的博弈定义的,它考虑了受扰动的博弈并对其加以精炼,同样的情形出现在泽尔腾的“颤抖手完美性”的概念中。尽管按照历史顺序“颤抖手完美性”出现在“序贯均衡”之前,但是该书中按照它们的历史顺序倒过来的情形加以介绍,目的是为了把更容易理解的“序贯均衡”放在前面。最后,在第8章结束,讨论了完美贝叶斯均衡、序贯均衡和颤抖手完美性均衡的精炼。接下来该书在第9章讨论了声誉效应,声誉效应主要是考虑如果一个参与人总是用一样的方式博弈,他的对手就会预期他在将来继续这样博弈,从而相应地调整自己的行为,问题是这个参与人是否以及何时能够建立或维持他所希望的声誉?直觉上声誉很像资产,当一个参与人有耐心并且他的计划比较长远时,他有可能愿意用短期的成本去建立他的声誉,因此,该书中主要关注的是长期关系中的声誉问题。同时这一章也是作者弗登伯格擅长使用的博弈分析工具,在该章中使用了很多弗登伯格在《博弈论学习理论》(The Theory of Learning in Games)中的案例。在第10章中讨论了不完全信息下的序贯议价,从20世纪80年代前期起,许多人都提出了不完全信息序列博弈的模型,尽管公理化的非合作博弈是议价问题主要解决方法,但是非合作博弈在解决议价问题上远未成功。这主要是由于两方面的困难:首先是在完全信息和不完全信息的模型中均衡的结果对于扩展型的选择非常敏感;其次由于信息的不完全,拥有私人信息的议价者如果提出协议,那么就可能出现非常多的完美贝叶斯均衡。那么,即使知道了博弈的扩展型,运用议价理论也未必可以给出唯一的预测。该书中对于“单边出价”议价博弈还是给出了某种很强的结果,对于议价过程更为复杂的博弈,作者将静态机制设计和序贯议价联系起来,并特别讨论了某种序贯议价博弈中的某种均衡会产生什么样的激励相容和个人理性的博弈结果。在该书的最后,作者提供了博弈论的高级专题,这些对于想深入研究博弈论的理论和应用的人都会受益匪浅。

【简要评述】

梯若尔教授是世界著名的经济学大师(1990―2000年世界经济学家排名第二),被誉为当代“天才的经济学家”。他曾发表过300多篇高水平的论文和11本专著,其研究领域几乎涉及经济学所有领域。梯若尔以他开创性的贡献赢得了国际盛誉:1993年欧洲经济学会Yrjo Jahnsson奖、1996年慕尼黑经济研究中心,1999年产业组织协会杰出成员奖;1998年被推选为世界经济计量学会主席,2001年当选为欧洲经济学会主席,并成为美国科学院外籍荣誉院士(1993)和美国经济学会外籍荣誉会员(1993),现担任法国图卢兹大学产业经济研究所科研所长,同时在巴黎大学,麻省理工学院担任兼职教授,并先后在哈佛大学、斯坦福大学担任客座教授,被认为在今后必将获得诺贝尔经济学奖的人物之一。

作为一本教科书,本书的优点非常突出。它深入浅出,语言流畅。在章节安排上,先易后难,符合人们的认识规律。虽然本书在定义和证明中使用了非常严格的数学语言,但作者往往能够化难为易,悟出数学证明后面的直觉和道理。对于需要特别复杂证明的定理,作者则略去证明,着重介绍定理背后的逻辑,而将文献列出,留给有兴趣的读者去进一步学习。两位作者都是博弈论的大家,同时有对数学工具的良好理解。他们用最简洁的方式介绍了高深的理论,这是一本易读又具有相当深度的教科书。

在该书中作者除了对非合作博弈进行高度的总结,也包含了他们的一些开创性的贡献,以下将这些贡献按照教科书的顺序展开:

第一,对逆向归纳法的批评。在经济学文献中,大部分的动态博弈分析仍然是毫无保留地使用逆向归纳法进行精炼,但是弗登伯格、克瑞普斯和莱维(Fudenberg,Kreps and Levine)建议参与人把意外的偏离解释成由于收益与原来最有可能的情况发生偏差。因为任何博弈结果都可以解释为对竞争对手收益的某种确认,这种方法就回避了在零概率事件发生时如何形成信念的困难,它把发生“偏离”后如何去预测博弈问题改变为在给定观察到的行动下,哪一个收益是最有可能的问题。弗登伯格和克瑞普斯把它进一步扩展上升为一种方法论:他们论证任何博弈理论应该在某种意义上是“完备”的,即给任何可能的博弈行动赋予严格正的概率。运用这一理论,参与人对后面博弈的条件预测总是有定义的。

第二,对子博弈完美的批评。因为子博弈完美是逆向归纳法的一种推广,它同样也受到上面的批评的攻击。此外,子博弈完美要求参与人在子博弈行动中达成意见一致,即使这种博弈行动不能通过逆向归纳法来预测得到。关键在于子博弈完美不仅假设参与人在所有子博弈中都预期到纳什均衡,并且还假设所有参与人都会预期到同一个均衡。这一点是否合理取决于参与人在开始的时候就出现均衡的理由所在。

第三,在非平稳消耗战的最终持续的博弈中,弗登伯格等人证明了对于离散时间模型,只要每期的时间间隔足够小(即当离散时间模型接近连续时间模型时),那么有如下结论:如果参与人i的对手准备在从t开始的子博弈中先停止,那么参与人i更愿意他的对手在时刻t立刻停止;如果参与人j在时刻t停止,参与人i可以一直等到τ>t,然后在τ才退出,从而提高收益。弗登伯格的研究还表明,如果可以成功的话,那么多拼抢一个时期是值得的;如果不考虑沉淀成本,那么参与人宁愿一直拼下去也不愿停止。这些结论应用到产业组织理论中就可以得出随着时间的发展市场成长或技术改进的情况。

第四,对无限重复博弈的无名氏定理完善。重复博弈的“无名氏定理”认为如果参与人足够有耐心,那么任何可行的个人理性收益都能在均衡中得以实施。这样,如果参与人极端有耐心的话,重复选择实质上允许任何收益都能成为均衡的博弈结果。但是,博弈阶段的可行收益集不一定凸,从而小贴现因子的重复博弈可行集也不必为凸,纯策略的凸组合和关联的策略相一致,因此不能通过独立的随机化得到。弗登伯格和马斯金(Fudenberg and Maskin)为了避开使用时间――平均路径,假定所有的参与人在每一期初观察到公共的随机装置的结果来凸化阶段博弈的可行收益集,继而证明了更强的结果,而且用这个结果将他们对完美无名氏定理的证明推广到无须公共随机化的博弈。弗登伯格、莱维和马斯金(Fudenberg,Levine and Maskin)推动了用动态规划求解均衡的方法,并用它来证明含有不完美公共信息的博弈的无名氏定理,他们的工作推广了弗登伯格和马斯金对重复委托―代理博弈所做的早期工作。

第五,对于知情的委托人问题,梅尔森(Myerson)从合作博弈的角度进行分析,马斯金和梯若尔(Maskin and Tirole)则按照三阶段的方法从非合作博弈的角度研究了这一问题,他们采用精炼贝叶斯均衡要求代理人在观察到委托人的合同报价后根据贝叶斯规则来修正其对委托人类型的估计。马斯金和梯若尔证明了机制设计博弈的任何均衡都可以视为一个虚拟经济的瓦尔拉斯均衡。他们证明了在虚拟经济系统中,对于“私人价值”问题,如果偏好是拟线性的,唯一的均衡与代理人知道委托人类型的均衡结果完全相同;如果偏好不是拟线性的,委托人就有可能通过代理人约束条件的松弛变量而获益,而且这样做严格由于当代理人知道委托人类型时得的结果。对于“共同价值”的情形,马斯金和梯若尔考虑了只有单一代理人且此代理人无私人信息的情形,并将结果推广到拟线性偏好,非对称信息的双边拍卖中。

第六,机制设计理论的贡献:1999年,著名的《经济研究评论》杂志在其66卷第一期以专辑形式掀起了不完全契约理论之争的高潮。以哈特和摩尔(Hart and Moore,1999)为代表的产权理论学派认为,当不确定性下的自然状态足够复杂时,从本质上不存在一个可行的机制来实现帕累托有效的资源配置,因而只有通过合理地配置产权等制度安排来恢复资源配置的效率。这就是Hart-Moore-Segal(1999)所证明的“不可能定理”。而以梯若尔和马斯金为代表的机制设计学派却对上述结论不以为然,他们在《不可预见的偶然性与不完全契约》论文中,运用机制设计理论的最新成果证明,不可预见的偶然性所造成的契约的不完全性,并不构成资源配置无效率的本质障碍,在当事人的效用函数不是非常限制性的情形下(即当事人没有很怪的偏好),我们可以设计出一个激励相容的机制,实现帕累托有效的配置。这就是马斯金―梯若尔(1999)(Maskin-Tirole)所提出并证明的“可能定理”。某些学者指责“Maskin-Tirole机制过于复杂因而无法在现实中应用”,梯若尔则针锋相对地指出,所谓机制的复杂与否必须放到具体的应用范围中去讨论,如果机制的设计与实施的成本低于它所带来的收益,这种机制就可行。

事实上,在现实运用中,涉及大规模项目的招标与拍卖机制往往设计得非常复杂,以至于只有少数专家才能掌握。另一方面,产权配置,作为一种强制性的制度安排,它所带来的交易成本往往非常高昂,并且容易被低估甚至忽略,而制度安排的锁定效应会导致长期交易的无效率。与此相比,机制作为一种自持的契约安排,其交易成本显然要低得多。

第七,弗登伯格和莱维把声誉效应放到无限期模型中,他们把从连锁店例子中得到的直觉扩展到一般的单个长期参与人面对短期对手序列的博弈中,得到声誉效应不必然决定唯一的均衡。同时多个均衡也并不表明声誉效应没有作用,反而多种均衡的存在意味着,描述均衡集的特性而不是明确的将每一均衡都确定下来可能更方便。

弗登伯格和梯若尔教授合著的《博弈论》是高级的教科书,里边的模型包括很多经济学家的模型(包括他们自己的模型),他们对这些模型进行高屋建瓴的概括。作者在教科书中加入了这些丰富的实例并精心构思了匹配的习题,该书中很多的实例和习题都来自于经典的文献,经过作者的简化,使得它们可以被初学者所理解,这对于学生掌握知识重点并学会运用书本知识无疑提供了很大的帮助。而且,这些实例和习题的结论同时也是很重要的定理,可谓一举两得。在扩展性方面,本书非常注重引导学生的进一步阅读,列出了非常详细的文献,一个对文献不熟悉的学生完全可以沿着本书提供的线索去继续阅读和学习。

《博弈论》是一本任何希望全面了解博弈论的人的必备书,即使是对一个博弈论的研究者而言,它也是一本重要的参考文献。在过去的十年间,演化博弈已经取得了一定的进展,但目前还处在百家争鸣的阶段,尚没有出现被广泛接受的理论体系。因此,本书没有涉及演化博弈并不是一件值得遗憾的事。相信当演化博弈理论完善之后,两位作者会对《博弈论》进行更新。总之,《博弈论》可以称做是博弈论的集大成之作。该书从出版之日起便成为博弈论领域最具权威性和最精深的研究生教材,为美国各个高校经济学系的博士课程所采用。博弈论专家宾莫尔(Ken Binmore)对该书的评价是“如果看好这本书,你可以在Econometrica上发表论文了”。

(潘敏)

参考文献:

[1]Fudenberg D.Tirole J.,“The Fat-Cat Effect,the Puppy-Dog Ploy,and the Lean and Hungry Look”,American Economic Review,74(1984),361-366.

[2]Fudenberg D.Tirole J.,“Preemption and Rent Equalization in the Adoption of New Technology”,Review of Economic Studies,52(1985),383-402.

[3]Fudenberg D.Tirole J.,“Trade-Ins,Upgrades,and Buy-Backs”,Rand Journal of Economics 29(1998),235-258.

[4]Fudenberg D.Tirole J.,“Customer Poaching and Brand Switching”,Rand Journal of Economics 31(2000),634-657.

[5]Fudenberg D.Tirole J.,“Pricing Under the Threat of Entry by a Sole Supplier of a Network Good”,Journal of Industrial Economics 48(2000)373-390.

[6]Jean Tirole,“The Theory of Industrial Organization”,Cambridge,MA:MIT Press,1988.

[7]朱弗登伯格、让?梯若尔,博弈论[M],北京:中国人民大学出版社,2002.

[8]戴维?克雷普斯,博弈论与经济模型[M],北京:商务印书馆,2006.