书城哲学一看就懂的博弈论
45081000000017

第17章 人际交往中的博弈术——众人拾柴未必火焰高(1)

在人际交往中,往往存在着很多悖论:宽大为怀不一定会有好结果,人多未必力量就大,狭路相逢赢者也未必就是强者,装傻未必就是真的傻,放弃未必得不到。在为人处世的时候,要想与人合作而不是彼此争斗,希望飞得更高、更远、更快,就要学会用博弈理论来解读人与人之间的关系。

走出囚徒困境,要助人如助己

在博弈中,要想走出“囚徒困境”,最终获取最大化的利益,最有效的策略就是双方通力合作,通过共同的努力,来实现长久的最大利益。

囚徒困境是一个非常经典的博弈案例,在这个案例中,嫌犯甲和乙都面临着两个选择——坦白或抵赖。如果双方都坦白的话,将会被各判15年;如果一方坦白而另一方抵赖的话,坦白的人将无罪释放,而抵赖的人将判30年;如果双方都抵赖的话,将会被各判1年。显然最好的策略是双方都抵赖,结果大家都只被判1年。但是由于两人处于隔离的情况且无法串供,所以每一个人都会从利己的目的出发,选择坦白交代的最佳策略。因为如果自己坦白交代,而对方抵赖的话,还可以期望得到无罪释放。即使对方也坦白交代,至多也只判15年。而如果自己选择抵赖,对方选择坦白的话,那么自己就得坐30年牢,而对方却会被无罪释放,这显然是最不划算的。出于同样的心理,双方都会考虑到对方选择抵赖的可能性是很小的,所以谁也不会去冒这个险。所以,两人合理的选择都是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这就是经典的囚徒困境。

囚徒困境的一个重要结论是,人的理性行为可能会导致与其愿望背道而驰的结果,这也是人类天性的悲剧所在。在囚徒困境中,要想避免每人各判15年的尴尬结局,除非出现以下三种情况:

一是达到双方信息对称、信息充分共享的局面。具体地说,也就是共谋,两个囚犯设法串通一气,这样实现双赢的概率会大大增加。

二是重复博弈。如果这两个囚徒是搭档,总是一起被捉住的话,情况会好很多。因为双方都知道,如果只从自己的利益考虑,就算一次侥幸碰到了最好的结果,长远来看也不会有什么好结果。

三是信息在外部环境中能够充分传播。假设两个囚徒不是搭档,但他们总有机会和别的囚徒搭档。如果某人的坏名声传出去,长远来看对他是不利的。这种情况其实和重复博弈的情况是类似的,只不过是对象不断更换的重复博弈。

囚徒困境给我们的启示就是它并非不可能被打破,人们之间也并非不可能合作,但前提是你不能只考虑自己一个人的利益,而是必须以你希望别人对待你的方式去对待别人。

有这样一个小故事。有两个饥饿的人,但很幸运的是,一位智者分别给了他们一根渔竿和一篓鲜鱼。得到鲜鱼的人马上就在原地把整篓鱼都煮熟吃掉了,这下子他肚子不再饿了。但过了不久,他又感到肚内空空,但这时他已经没有什么可以吃的了,于是最终被饿死在了空空的鱼篓旁。那个得到渔竿的人提着渔竿坚定地向遥远的大海走去,他知道他到了海边就可以钓鱼,这样他就有吃的了。但是当他终于来到了大海边的时候,他已经筋疲力尽,只好倒在大海边死去了。不久之后,又有两个饥饿的人,智者也给了他们同样的一根渔竿和一篓鲜鱼。不同的是这两人并没有分开行动,而是选择共同合作去寻找遥远的大海。每次饥饿的时候,他们就会从鱼篓中拿出一条鱼煮了一起吃。最后他们成功地来到大海边,靠那根渔竿一起开始捕鱼。后来,他们在海边一起幸福地定居了下来。

从博弈的角度来看,这四个饥饿的人就像“囚徒困境”的“囚徒”一样。所不同的只是前两个人就像那两个相互背叛的囚徒一样,最终选择了各自为政,以至于一直困在“囚徒困境”中走不出来。而后两个人则合作起来,一起行动,最后成功地克服了困难。可见在博弈中,要想走出“囚徒困境”,最终获取最大化的利益,最有效的策略就是双方通力合作,通过共同的努力,来实现长久的最大利益。不过,双方要想达成合作,就要先设身处地地替对方着想。否则,合作就不可能实现。

在一个大沙漠的两边有两个村庄。如果要绕过沙漠从一个村庄走到另一个村庄,最快也要20多天;如果横穿沙漠,只要三天就够了。但问题是横穿沙漠是一件很危险的事,曾经有很多人尝试过这样做但都没有成功。

后来,一个智者看到了这个情况,就让村里人买来很多胡杨树苗,让村人每隔30米就栽一棵,一直栽到沙漠对面的那个村庄里去。智者说,不管这些胡杨树能不能成活,它们都可以成为路标,使人们在沙漠中行走的时候不至于迷路。但每一个人经过的时候都要将这些树苗重新再插一下,以免它们被那些流沙给淹没了。

就这样很多年过去了。有一年夏天,一个僧人要从这个村子到对面的村庄化缘。村民告诉他在经过这些枯树的时候,一定要把那些要倒的或者快要被淹没的路标插好。僧人爽快地答应了,然后便带上水和干粮踏进了沙漠向对面的村庄走去。僧人在沙漠中走了一天一夜后,疲惫得两腿发软,浑身一点力气也没有。后来当他遇到那些快要被淹没的枯树路标的时候,就懒得再动手去把那些树苗插好了。他心想,无所谓了,淹没就淹没吧,反正我只走这一次。

等僧人走到沙漠深处的时候,突然刮起了狂风,狂风过后,很多原本已经快要被淹没或被卷走的路标都消失了,他根本就无法再往前走了。这时,他想到了后退,但由于之前他没有重新插好那些路标,它们都被风吹走了,所以他连退路都没有了,只能在沙漠中等死。气息奄奄的那一刻,僧人十分懊悔,他想,如果自己当初没有自作聪明,而是按村民的吩咐去做,即使没有了进路,也还有一条可以退回去的路。

美国人埃·哈伯德说:“聪明人都明白这样一个道理,帮助自己的唯一方法就是去帮助别人。”在为人处世之中,帮助别人就是帮助自己,为别人留路,就是为自己留路。所以在生活中,我们要能够走出一己之私,站在更高的角度去看待自己的得与失。

一报还一报还是宽大为怀

“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人。但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚。惩罚过后,又回到起点,继续善意待人。这种行为规则中,永远只需记忆最近一次对方的行为,宽容看待对方的过往行为,除了上一次背叛。

佛家讲究慈悲为怀,基督教的《圣经·新约·马太福音》中有“有人打你的右脸,连左脸也转过来由他打”的话,印度“圣雄”甘地也主张非暴力不合作。在人际交往中,也常常有人劝我们对他人要宽容,不要斤斤计较。但有时候我们难免会遇到这样的情况:你越让步,对方越会进一步欺负你,直到弄得你无路可退;或者对方会从你的“宽容”中得到鼓励,去欺负其他人。结果是,人人都生活在一个欺善怕恶的世界里。

所以,并不是所有的时候都要宽大为怀,有时候“以牙还牙,以眼还眼”的方式反而更能解决问题。

这种策略在博弈论里有一个专门的名词,叫做“一报还一报”。提出这一策略的是美国密歇根大学的学者罗伯特·爱克斯罗德。他是一个政治家,研究方向是人与人之间的合作关系。

在开始研究合作之前,爱克斯罗德设定了两个前提:第一,每个人都是自私的;第二,个人决策不受权威干预。也就是说,个人可以完全按照自己利益最大化的目标来进行决策。在此前提下,要研究的问题是:第一,人为什么要合作;第二,人什么时候是合作的,什么时候是不合作的;第三,如何使别人与你合作。

在研究的过程中,爱克斯罗德组织了一场计算机模拟竞赛。任何参加这个竞赛的人都扮演囚徒困境案例中的一个囚犯的角色,把自己的策略编成计算机程序,进行捉对博弈,在合作与背叛之间作出选择。但与囚徒困境案例的不同之处是:参与者不止玩一次这个游戏,而是以单循环赛的方式玩上200次。

第一轮游戏有14个程序参加,在捉对厮杀中,程序运转了10多万次,最后按照总得分排出名次。胜出的程序是一个被称为“一报还一报”的策略。

“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人。但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚。惩罚过后,又回到起点,继续善意待人。这种行为规则中,永远只需记忆最近一次对方的行为,宽容看待对方的过往行为,除了上一次背叛。

很快,爱克斯罗德又组织了第二轮游戏。这次有62个程序参加,其中还有不少程序针对上一次的策略做了专门改进。一场混战之后,结果是“一报还一报”再次排名第一。

这两次游戏竞赛充分证明了“一报还一报”策略的威力。爱克斯罗德后来曾公开征集可能打败它的策略程序,但20多年过去了,还没有程序能做到这一点。

战斗中逃不逃跑的选择就是对此最好的证明。在战斗中,如果别人都在战斗,只有你逃跑往往是保住性命的最好的办法。如果别人都跑了,你逃跑也是最好的策略。也就是说不管别人跑不跑,对你而言逃跑都是最好的策略。但问题是如果每个人都逃跑的话,最后就很有可能会全军覆没。而且一旦有一个人逃跑,却又没有受到惩罚,那么很快就会引发更大规模的逃跑。在这种情况下,囚徒困境就会出现。因此,与其每个人都逃跑,每个人都留下来可能对你们比较有利。总结起来说就是,就个人而言,懦弱一点对你比较有利。就集体而言,勇敢一点对大家都好。

在部队中用于打破这个囚徒困境的方法就是,一旦有士兵在战斗中逃跑,这个士兵就会被惩罚。也就是说,这种一报还一报、对团队中的个人行为都给予及时有效回报的方式也可以破解囚徒困境。但问题是,如果对任何人的所有行为都“一报还一报”,其结果很可能会造成一些不良的后果,因为对方也会全力反击,最终陷入冤冤相报何时了的困境中去。这个时候,即使有一方想要退出,即使双方都不想再继续对抗下去,最后都很可能咬牙坚持。所以,在采取一报还一报的方式时要遵循以下四点要求:

1.不要忌妒

人们习惯于考虑零和博弈,倾向于采取相对的标准,常常把对方的成功与自己的成功对立起来。这种标准导致了忌妒和企图抵消对方已经得到的优势。在囚徒困境中,抵消对方优势只能通过背叛来实现,但是背叛又会招来更多的背叛及对方的惩罚,因此忌妒别人无异于自我毁灭。

“一报还一报”策略之所以能够胜出不是靠打击对方,而是靠由对方引出对双方都有好处的行为。“一报还一报”坚持对双方都有利的结果,从而获得了比其他任何策略都高的总分。

2.不要首先背叛

虽然一开始选择背叛能获得一定的利益,但由于能被它占便宜的傻瓜越来越少,它最终也会消亡。因此,只会占别人便宜的人是没有什么好下场的,不断选择被叛只是一个自我毁灭的过程。不善良的策略在最初看来似乎是很有希望的,但长期下去会毁坏自己成功所必需的根基。

3.对合作与背叛都要给予回报

“一报还一报”策略的超常成功给出了一个简单又很有实效的建议:要回报。在第一次合作之后,“一报还一报”只是简单地重复对方在上次合作中的所为,但这个简单的规则却出奇有效。因为当对方合作时,他得到的也是善意的合作,当对方背叛时,他将受到同样的报复。但一旦对方恢复合作,“一报还一报”的宽容性又使双方能很快恢复到合作关系上来。所以,只有给予有效的回报,才能保持合作的稳定性。

4.不要耍小聪明

在囚徒困境中,我们很容易耍小聪明。然而,事实证明这只会令你得不偿失。而且,复杂的规则也未必会比简单的规则做得更好。对方对你的行为是有反应的,在囚徒困境中,不应该把对方看做是一心想背叛你的。同时,对方也会把你的行为看做如何给你回报的信号,因此,你的行为将会很快反射到自己身上。

昌昌当利益挑战道德

无限次重复博弈的结果就是礼仪道德在人们心目中的分量变得极为重要,并成为用来维持博弈均衡的重要环节,以至于在找不到更适合的法律法规来约束博弈双方的时候,道德也能发挥重大的作用。

在囚徒困境中,囚犯之所以都选择背叛有一个重要的原因,那就是因为他们所进行的博弈是一次性博弈。在地摊、车站、旅游点这些人群流动性大的地方,不但商品和服务质量极差,而且假货横行,也恰是因为在商家和顾客之间进行的是“一次性博弈”。不管商家的产品是物优价廉还是以次充好,旅客都不大可能再次光临,因而在正常情况下的理性选择是“一锤子买卖”,不赚白不赚。

在一次性博弈中,交易双方都只需考虑在这次博弈中自身利益的最大化。为了达到这一目的,双方都会使出浑身解数。由于博弈行为只有一次,之后双方就各走各的路,很少有再次交往的机会,因此谁都不必担心背叛或欺诈所引发的报复性行为,尔虞我诈之类的行为也就会屡见不鲜了。

在一次性博弈中,背叛是个人的理性选择,但却会直接导致集体的非理性,因而出现两败俱伤的局面往往在所难免。那么,这是不是说人类注定要陷入这样糟糕的境地而无法摆脱呢?答案是否定的。

在无限次重复博弈中,博弈双方往往是“抬头不见低头见”的关系,预期收益和预期风险会极大地影响人们的行为,进而影响到人们的生存环境,而这个生存环境正是人们所必需的。这样,无限次重复博弈的结果就是礼仪道德在人们心目中的分量变得极为重要,并成为用来维持博弈均衡的重要环节,以至于在找不到更适合的法律法规来约束博弈双方的时候,道德也能发挥重大的作用。

1809年2月12日,亚伯拉罕·林肯出生在一个农民的家庭。林肯小时候家里很穷,所以他没机会上学,只能每天跟着父亲在西部荒原上开垦、劳动。他自己说:“我一生中进学校的时间,加在一起总共不到一年。”但林肯勤奋好学,一有机会就向别人请教。他放牛、砍柴、挖地时怀里也总揣着一本书,休息的时候,经常一边啃着粗硬冰凉的面包,一边津津有味地看书。晚上,他常常在昏黄的油灯下读书读到深夜。

长大后,林肯离开家乡独自一人外出谋生。他什么活儿都干,打过短工,当过水手、店员、乡村邮递员、土地测量员,还干过劈木头的力气活儿。不管干什么,他都非常认真负责,诚实而且守信用。