通常我们把“一报还一报”看做下策,理由是“冤冤相报何时了”。事实上,从博弈的角度来看,有时候“一报还一报”正是一种有效的对策。
提出“一报还一报”策略的是美国密西根大学的学者罗伯特·爱克斯罗德。他是一个政治家,研究方向是人与人之间的合作关系。
在开始研究合作之前,爱克斯罗德设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的目标进行决策。在此前提下,要研究的问题是:第一,人为什么要合作;第二,人什么时候是合作的,什么时候是不合作的;第三,如何使别人与你合作。
在研究的过程中,爱克斯罗德组织了一场计算机模拟竞赛。其主要内容是:任何参加这个竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色,把自己的策略编成计算机程序,进行捉对博弈,在合作与背叛之间作出选择。但与“囚徒困境”案例的不同之处是:他们不止玩一次这个游戏,而是以单循环赛的方式玩上200次。
第一轮游戏有14个程序参加,在捉对厮杀中,程序运转了十多万次,最后按照总得分排出名次,胜出的程序是一个被称为“一报还一报”的策略。
“一报还一报”是人类最古老的行为规则之一。它要求我们最初总以善意待人,在没有被欺骗之前,永远不要主动欺骗他人;但一旦发现他人的欺骗,下次交往时要毫不犹豫地报复、惩罚;惩罚过后,又回到起点,继续善意待人。这种行为规则中,永远只需记忆最近一次的对方行为,宽容看待对方的过往行为,除了上一次背叛。
很快,爱克斯罗德又组织了第二轮游戏。这次有62个程序参加,其中还有不少程序针对上一次的策略专门作了改进。一场混战的结果是,“一报还一报”再次排名第一。
这两次游戏竞赛充分证明了“一报还一报”策略的威力。爱克斯罗德后来曾公开征集可能打败它的策略程序,但二十多年过去,还没有程序能做到这一点。那么这个具有相当威力的神奇策略到底是怎样的呢?
其实很简单:第一步合作,此后每一步都重复对方上一步的行动:合作或背叛。这个简单的程序之所以反复获胜,是因为它奉行了“以其人之道还治其人之身”的原则,并且用如下特征最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。
在重复博弈中,过分的忍让,未必就是一件好事。对于一些失信的不良人等,我们必须以其人之道还治其人之身。
电视剧《亮剑》中,日本的山本特工队夜袭独立团团部,掳走了独立团团长李云龙的新婚妻子秀芹,重伤独立团政委赵刚。李云龙集结队伍,未经请示,公报私仇,攻打山本特工队所在的平安县城,最终全歼山本特工队,但秀芹也玉石俱焚。这一仗打出了八路军的威风,更打灭了日本人骄横、不可一世的气焰。战斗过后,李云龙去野战医院看望赵刚时,二人有了一番推心置腹的交谈。一向服从上级领导、守纪律、讲原则的赵刚这次没有埋怨李云龙擅自调动部队作战,反而赞赏地对李云龙说:“你李云龙,是有仇就报的性格,那独立团当然也是如此。君子报仇,十年不晚,这句话不适合独立团。独立团是有仇就报,马上就报,你给我一刀,我反手就是一剑。公平合理,决不欠债。”
历史反复证明了这一策略的正确性:1945年抗日战争胜利后,为避免内战、争取和平,中囯共产党同国民党政府在重庆进行了为期43天的和平谈判,史称“重庆谈判”。谈判之前,蒋介石就让阎锡山入侵上党地区,以此先发制人,扼守抢夺平津、独占华北的交通要道,保持长江与北方之间的陆上联系。当时国共之间的军事摩擦已经出现。8月25日,即毛泽东电复蒋介石将亲自赴重庆谈判的当天,对即将返回上党前线的刘伯承、邓小平说:“你们回到前方去,放手打就是了。不要担心我在重庆的安全问题,你们打得越好,我越安全、谈得越好。别的办法是没有的。”刘、邓回到上党,稍事休息,即在直属机关干部大会上作了上党战役的动员报告。指出:“我们立足于打,不放弃有利条件的谈判。只有打得好,才能谈得好。”
就这样,国共和谈在边打边谈中进行。重庆谈判从8月28日毛泽东赴重庆开始谈判,至10月11日,前后共43天;上党战役从9月1日攻克襄垣开始,到10月8日解放长治,12日全歼逃敌而胜利结束,历时42天。重庆谈判桌上与上党战场无论时间、进展情况极其一致与密切相关,绝非是偶然。中国共产党的方针是“以打促谈”,“打而胜之”是共产党重庆谈判桌上的重要筹码,也是国共和谈取得成功的保障。
从上述事例中我们可以看到,中国共产党正是采取了“针锋相对策略”:首先,解放军绝不开第一枪,所以是“善意”的;其次,一旦国民党军队挑起军事冲突,解放军立即报以颜色,这表明共产党是“可被激怒的”;第三,共产党绝不得理不饶人,你停火,我就停火,这表明共产党是“宽容的”。其结果是,国共两党达成了和平协议。(虽然后来内战还是爆发,但它不属于本文讨论的范围)除此之外,中国军队在朝鲜战争、中印战争、对越自卫反击战等战争中,采取的均是“人不犯我,我不犯人;人若犯我,我必犯人”以及边打边谈的针锋相对策略。
人们会对伤害选择报复。当别人打你一拳,你马上还他一脚,这固然并不能减轻你已挨那一拳的疼痛,而且用力踢回一脚通常也得不到快感。那为什么还要针锋相对地坚决予以回击呢?原因就在于,打不还手只会让对手更加猖狂,而只有回击才能遏制对方的进一步侵犯。所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见得最佳。
博弈论小贴士
过度忍让和纵容只会让对手更加猖狂,只有回击才能遏制对方的进一步侵犯。