1.优势在谁手中
冯·诺伊曼认为:在一个二人零和游戏中,总会找到一种有一个明确而合乎理性的方法以获得个人的最佳收益,而这个“明确而合乎理性的方法”就是“极小极大原理”。诺伊曼的这一发现可能是博弈论最重要的核心内容。
什么是“极小极大原理”呢?用通俗一点儿的话说就是,你想赢得竞争,可能有几种选择,你当然愿意选择受益最大的一种;但是你的选择不能不考虑对方的对策,因为他跟你一样,也是这样想的,所以你就必须把对方的选择也考虑清楚。比如你有两种选择,对方也有两种选择,如果你的一种选择无论在对手作出何种对策时效果都比另外一个好,这通常被称为“优势策略”。另一方面,对手也明白你的优势策略所在,知道你会照此实行,所以也会在自己的两个对策中选择效果最好的一种——这也是他的优势策略。显然,如果双方都选择优势策略。那么这个博弈就是有迹可循、可以预测的,也就是所谓“理性的解”,并形成某种“定式”,即均衡。
比如在“囚徒困境”中,招供就是“理性的解”,因为就单方面来说,无论对方招不招供,你招供都是最佳策略,于是结果就是双方招供,这个结果其实并不好,但最可能出现,这就是“均衡”。
为什么会出现这个不好的结果呢?因为对任何一方来说,这个结果还不是最坏的一个,无论如何比自己独自受过要好。著名作家卡尔维诺一语道破:“有时候,你能指望的最佳结果就是避免最坏情况。”
我们还可以用“分蛋糕”的故事说明这个均衡:给两个小孩分一块蛋糕,谁都希望自己分到大的一块,如何解决这个矛盾呢?当然,大人可以作为仲裁者,帮助他们分,但是就算你切得再仔细,也不可能做到完全公平;而且,就算你做到完全的公平,恐怕还会有人觉得吃了亏。那么,有没有更好的办法呢?
当然有,这就是你制定一个规则——由一个人来分,而由另一个人先选择要哪一块。显然前者知道,后者的优势策略就是选择较大的那一块,所以尽可能分得公平就是他的优势策略,只有这样才可以把自己的损失降到最小。
当你身处类似“囚徒困境”这样的同时行动的博弈时,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择住往是有迹可循的,并形成某种“定式”,即均衡。为了说明博弈如何达到“均衡”的结果,我们可以通过两份杂志,美国的《时代》和《新闻周刊》为例来演示这一过程。
每个星期,《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。
他们这么做的时候,很清楚在此时《新闻周刊》的编辑们也在开会,选择下一个封面故事;反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情……这两家新闻杂志投入了一场博弈。由于《时代》与《新闻周刊》的行动是同时进行的,双方都在毫不知晓对手的决定的情况下采取行动。不过他们都知道双方在博弈中的期望是什么,所以可以预料对方的策略选择。
要注意,这种同时进行的博弈与相继(一先一后)行动的博弈所要用到的策略思维和行动是完全不同的。对于像下棋这样的一人一步的相继行动的博弈,每个参与者都必须向前展望,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:假如我这么做,他就会那么做,若是那样,我会这么反击,依此类推。也就是说,你怎么走,完全取决于对手的上一步行动。
而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时扮演两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”诀窍在于怎样破解这个循环。
我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略,就是“向前展望,倒后推理”。在这里,事情不会那么简单。
不过,关于同时行动不可少的思维方式的思考可以总结为指导行动的三个简单法则。这些法则又基于两个简单概念:优势策略与均衡。举一个简单的例子,你是一名足球前锋,你和队友形成了二打一的局面,你面对着对方的后卫,你可以选择带球突破,也可以选择传球给队友。一般情况下,传球过人的成功率更大,那么传球就是你的优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。假如一个球员拥有这么一个策略,他的决策就会变得非常简单,他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。
回到《时代》对《新闻周刊》的例子,假定本周有两大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑在选择封面故事的时候,首先考虑的是哪一条新闻更能吸引报摊前的买主(假设无论采用哪一则新闻做封面故事,消费者都会买这本杂志)。在报摊前的买主中,假设30%的人对预算问题感兴趣,76%的人对艾滋病新药感兴趣,这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志。假如两本杂志用了同一则新闻做封面故事,那么感兴趣的买主就会分为两组,一组买《时代》,另一组买《新闻周刊》。
现在,《时代》的编辑可以进行如下推理:假如《新闻周刊》采用“艾滋病新药”作封面故事,那么,假如我采用“预算问题”作封面故事,我就会得到整个“预算问题市场”(即全体读者的30%),假如我采用“艾滋病新药”,我们两家就会平分‘艾滋病新药市场’(即我会得到全体读者的35%),因此,“艾滋病新药”为我带来的收入就会超过“预算问题”。假如采用“预算问题”,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用“艾滋病新药”,就会得到70%的读者;这一次,第二个方案同样会为我带来更大的收入。因此,我有个优势策略,就是采用“艾滋病新药”作封面。无论我的对手选择采用上述两个新闻当中的哪一个,我采用这一策略都会比我采用其他策略更胜一筹。
在这个博弈里,双方都有一个优势策略,也就是都选择“艾滋病新药”作为封面新闻。采用这个策略的最佳结果是获得70%的读者,最差的结果是35%,都比选择“预算问题”的30%要好。
从策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈,虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。
在“囚徒困境”中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得一个更好的结果?
有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者都偏向于选择《时代》,假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。对于《时代》,“艾滋病新药”仍然是优势策略,但对于《新闻周刊》就不再是了,因为《时代》的优势策略是选择“艾滋病新药”这条新闻,如果它也作同样选择,那么只能得到28%的读者,小于选择“预算问题”的30%。
换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择“艾滋病新药”,《新闻周刊》选择“预算问题”就能得到更大的销量。《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此《新闻周刊》的编辑们可以很有把握地假定《时代》已选了“艾滋病新药”,并据此选择自己的最佳策略,即“预算问题”。
由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。
现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可以用来确定什么不是优势策略。人们很容易就会弄错,不知道优势策略的优势究竟是对什么而言的。“优势策略”的“优势”是说,无论你的对手采用什么策略,你的这个策略与你的其他策略相比都占有优势,而不是与你的对手的策略相比占有优势。
某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾“封面大战”的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。
另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略好。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用“艾滋病新药”作封面故事,最坏的结果是得到35%的市场份额;他们若采用“预算问题”作封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。
现在让我们想象一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元,且售价只有两个可能的选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;如果杂志价格降到2美元,因为价格便宜,市场会有一定扩展,读者总数将升到800万。这时你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果双方杂志价格都是3美元,利润都是500万;一方降价至2美元,则独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。
有点像“囚徒困境”是不是?的确,在“囚徒困境”中,双方的优势策略都是招供,在这里则都是降价。
《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800万美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。即:假如你有一个优势策略,请照办,不要担心你的对手会怎么做。
假如你没有一个优势策略,但你的对手有,那么就权当他会采用这个优势策略,相应选择你自己最好的做法。
提醒一句:我们已经确立了同时行动的博弈的优势策略的概念,若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好;若是相继行动,而你的对手先行,你就应该一直选择自已的优势策略。
正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时作出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。
2.追求最好的
不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。
一个优势策略优于任何其他策略,同样,一个劣势策略则劣于任何其他策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。