这是一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果。它的另一个好处,就是使得未来的计划明晰化,使你不再徘徊。
做任何事情的时候,你都可以从目标出发,根据目标的要求,规划实现目标的路径,明了实现目标的条件,并在实际工作中努力去发现、借助和创造实现目标的条件,按照路径一步步推进,最终实现目标。
逻辑和直觉的悖论
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
合作 合作 合作 合作 … 合作 合作
A B A B …… A B (100,100)
合作 合作 合作 合作 … 合作 背叛
A B A B …… A B (98,101)
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
现在的问题是:A、B是如何进行策略选择的?
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。
不难看出,在该博弈的推理过程中,运用的是逆推归纳法。从逻辑推理来看,逆推归纳法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取100,当然A一开始采取合作性策略有可能获得0,但1或者0与100相比实在是太小了。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。是逆推归纳法错了,还是直觉错了?人们在博弈中的真实行动“偏离”了运用逆推归纳法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。
对蜈蚣博弈进行实验的结果也表明,在绝大多数任意选择的博弈方之间进行该博弈,一般都不会出现逆推归纳法预测的博弈方A在一开始就选择结束博弈时双方收益为1的结果。蜈蚣悖论对逆推归纳法的有效性提出了严重的质疑:逆推归纳法是否失效了?
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验(目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者),实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的。对此,许多学者进行了研究,结果认为双方开始时将选择合作性策略,虽然这违反博弈中的倒推分析方法的逻辑,但的确要好于最初就选择背叛所带来的收益。只不过理性的人会出于自身利益的考虑,在某一步选择背叛,即虽然最初选择了合作,但这种合作却不可能坚持到底。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
在蜈蚣博弈中,根据逆推归纳法,博弈方在一开始就应该选择结束博弈,即博弈双方的得益均为1。这是不符合双方的长远利益的。逆推归纳法的路径与博弈方的长远利益相悖,因而博弈方不会按逆推归纳法的逻辑推理去决策。在该博弈中,如果博弈的双方彼此信任、默契,彼此相信对方是理性的,彼此相信对方会追求自身的长远利益与整体利益,那么双方选择合作策略的可能性会更大。而且在现实生活中,如果博弈双方相互信任、从长远利益与整体利益出发去进行策略选择,结果往往是双赢。
下面我们来举一个生活中的恋爱故事来说明这个博弈:
爱情就其本质来说是一种交往,人交往的目的在于个人效用最大化,不管这个效用是金钱,还是愉快的感觉、幸福的感觉。只要追求个人效用,就必定存在利益博弈,因而,我们的爱情交往是一个典型的双人动态博弈过程。爱情博弈不等同于其他动态博弈的一个重要点是:爱情的效用随着交往程度的加深和时间推移有上升趋势。
假定茱丽叶(女)和罗密欧(男)是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是甩。他们的博弈展开式如下:
■
在上图中,博弈从左到右进行,横向连杆代表继续交往战略,向下的连杆代表甩掉她(他)战略。每个人下面对应的括号代表相应的人甩了对方,爱情结束后,各自的爱情效用收益,括号内左边的数字代表茱丽叶的收益,右边代表罗密欧的收益。可以看到,罗密欧和茱丽叶甩战略对应的括号数字每个都不同,这是因为爱情效用在不断增加,这里假设爱情每继续一次总效用增加1,如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由于选择甩战略的人不同,而在两人之间进行分配。由于男女生理结构和现实因素不同,茱丽叶甩战略只能使效用在二人之间平分,即两败俱伤,罗密欧选择甩战略则能占到3个便宜。显然,甩战略对于被甩的一方来说是一种欺骗行为。
请看,首先,交往初期茱丽叶如果甩了罗密欧,则两人各得1的收益,茱丽叶如果选择继续,则轮到罗密欧选择,罗密欧如果选择甩了茱丽叶,则茱丽叶属受骗,收益为0,罗密欧占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的收益,为圆满爱情结局——总体效益最大。遗憾的是这个圆满结局很难达到!
大家注意,当罗密欧到达甩了茱丽叶可得收益是10的时候,他很难有动力继续交往下去,继续下去不但收益不会增长,而且有被茱丽叶甩掉反而减少收益的风险。茱丽叶则更不利,因为她从来就没有占先的机会,她无论哪次选择甩罗密欧,二者都是两败俱伤,而且还有可能被罗密欧欺骗减少收益的危险,在爱情过程中,女人总体来讲处于不利地位。因此,每一次交往,无论罗密欧还是茱丽叶都有选择甩来中止爱情的动机,更详细的数学可以证明,如果他们是极端个人主义的话,爱情圆满的结局不可能达到。个人效益最大与总体效益最大之间有矛盾。
怎样才能达到圆满结局呢?有三个因素决定,一是罗密欧和茱丽叶之间的爱情信念,即追求两个人的爱情效用最大,而不是单方面的,相信坚持下去会有好的结果;二是选择充分信任对方的行为,不要摆明了猜忌对方;三是最终结局的可能性,在博弈论中这个叫贴现因子,也就是未来的收益对于现在的收益来讲,哪个更大,比如对罗密欧来讲,最终结局的收益10肯定不会等于当前甩了茱丽叶得到的10,哪个更大,罗密欧就选择哪个。两人对于爱情未来的观念和信念真的很重要。
通过这个恋爱的分析,你可以发现,遵循于逻辑倒推的蜈蚣博弈在某些条件下,不一定会成立,并且有很大的局限性。倒推法的成立是需要一定条件的,不适于分析所有动态博弈。不过,只要条件容许,被分析的问题符合客观成立的要求,倒推法绝对是一种分析动态博弈的有效方法,我们可以通过这种方法来改善我们的生活,解决遇到的难题,甚至是帮助自己走向成功。
倒推法的智慧
不管叫它“倒推法”还是“逆推法”,说的都是同一样事物。下面以市场进入博弈为例,来看如何运用逆推归纳法。
假定有甲、乙两个企业,甲企业一直独占某城市的市场,每年的垄断利润是10亿。乙企业为了进入这个市场,需要4亿元的投资。当乙企业准备进入的时候,甲企业必须决策:或者“容忍”进入,就是收缩产量维持高价,利润降为5亿元,这时乙企业的利润也是5亿元,减去投资费用,实得1亿元;或者展开商战“对抗”,就是加大产量,降低价格,力图把进入者挤出去,这时甲企业的利润降到2亿元,乙企业得到2亿元还抵不过投资的4亿元,亏损2亿元。对于甲而言,一旦乙进入,利润会受损很多,乙最好不要进入。因此,甲向乙发出威胁:如果你进入,我将打击。
但是这个博弈的最终结果是,乙选择“进入”,甲选择“容忍”。为什么呢?在这个博弈中甲的威胁是不可信的。
乙是这样推理的:假定我(乙)进入,甲如果“打击”,它的得益为2;“容忍”的得益为5。甲是理性人,它将选“容忍”的策略。既然我预测到甲将“容忍”,我在“进入”和“不进入”间进行选择时,“进入”的得益为1,“不进入”的得益为0,作为理性人我将选择“进入”。当乙选择“进入”策略时,
甲的推理是:如果采取“打击”,我的得益为2;“容忍”的得益为5,选择“容忍”是理性的策略选择。
通过以上分析,可以看出逆推归纳法的逻辑基础是这样的:动态博弈中先行为的理性的博弈方,在前阶段选择行为时必然会考虑后行为博弈方在后面阶段将会怎样选择行为,只有在博弈的最后一个阶段选择的、不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。
由于逆推归纳法确定的各个博弈方在各阶段的选择,都是建立在后续阶段各个博弈方理性选择的基础上的,因此排除了不可信的威胁或承诺的可能性,因此它得出的结论是比较可靠的,确定的各个博弈方的策略组合是有稳定性的。
但是不可否认,逆推归纳法在逻辑上是严密的,然而它存在着“困境”;蜈蚣悖论恰好反映了这种“困境”。许多学者试图克服这些理论困难。不过这已经不在我们的考虑范围之内了,我们关注的是逆推法怎样可以为我所用。
微软有一道特别著名的面试题,说的是有5个海盗抢得100枚金币后,讨论如何进行公正分配。他们商定的分配原则是:
(1)抽签确定各人的分配顺序号码(1,2,3,4,5);
(2)由抽到1号签的海盗提出分配方案,然后5人进行表决,如果方案得到超过半数的人同意,就按照他的方案进行分配,否则就将1号扔进大海喂鲨鱼;
(3)如果1号被扔进大海,则由2号提出分配方案,然后由剩余的4人进行表决,当且仅当超过半数的人同意时,才会按照他的提案进行分配,否则2号也将被扔入大海;
(4)依此类推。
这里假设每一个海盗都是绝顶聪明而理性,他们都能够进行严密的逻辑推理,并能很理智地判断自身的得失,即能够在保住性命的前提下得到最多的金币。同时还假设每一轮表决后的结果都能顺利得到执行,那么抽到1号的海盗应该提出怎样的分配方案才能使自己既不被扔进海里,又可以得到更多的金币呢?
请问,如果你是最先分金币的A,怎么样分才能既保住自己的性命,又得到最多的金币?
此题是蜈蚣博弈范畴内的推导。由于从第一个强盗(强盗A)开始推导产生的各种分支可能情况过于复杂,因此,应从后面开始向前倒推,从而得出结果。
此题公认的标准答案是:1号海盗分给3号1枚金币,4号或5号2枚金币,自己则独得97枚金币,即分配方案为(97,0,1,2,0)或(97,0,1,0,2)。现在来看如下各人的理性分析:
首先从5号海盗开始,因为他是最安全的,没有被扔下大海的风险,因此他的策略也最为简单,即最好前面的人全都死光光,那么他就可以独得这100枚金币了。
接下来看4号,他的生存机会完全取决于前面还有人存活着,因为如果1号到3号的海盗全都喂了鲨鱼,那么在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号去喂鲨鱼,以独吞全部的金币。哪怕4号为了保命而讨好5号,提出(0,100)这样的方案让5号独占金币,但是5号还有可能觉得留着4号有危险,而投票反对以让其喂鲨鱼。因此理性的4号是不应该冒这样的风险,把存活的希望寄托在5号的随机选择上的,他唯有支持3号才能绝对保证自身的性命。
再来看3号,他经过上述的逻辑推理之后,就会提出(100,0,0)这样的分配方案,因为他知道4号哪怕一无所获,也还是会无条件的支持他而投赞成票的,那么再加上自己的1票就可以使他稳获这100金币了。
但是,2号也经过推理得知了3号的分配方案,那么他就会提出(98,0,1,1)的方案。因为这个方案相对于3号的分配方案,4号和5号至少可以获得1枚金币,理性的4号和5号自然会觉得此方案对他们来说更有利而支持2号,不希望2号出局而由3号来进行分配。这样,2号就可以高高兴兴地拿走98枚金币了。
不幸的是,1号海盗更不是省油的灯,经过一番推理之后也洞悉了2号的分配方案。他将采取的策略是放弃2号,而给3号1枚金币,同时给4号或5号2枚金币,即提出(97,0,1,2,0)或(97,0,1,0,2)的分配方案。由于1号的分配方案对于3号与4号或5号来说,相比2号的方案可以获得更多的利益,那么他们将会投票支持1号,再加上1号自身的1票,97枚金币就可轻松落入1号的腰包了。
这道题给我们的最大的启示就是,当你面对一个棘手的问题时,可以考虑通过倒推的方式去解决它。从结果出发,一步一步从后向前倒推,你会清晰地找到问题解决的关键所在。