书城成功励志你怎能不懂博弈学
48974200000006

第6章 囚徒困境的启示(2)

李德裕怀疑这案子还没查完,就想办法对被告进行试探。于是,那个主事僧向李德裕申诉了自己的冤枉说:“多年以来,寺里都是空交账本,实际上没有金子。寺里的人们孤立我,想借此把我排挤走。”

李德裕说:“这事不难搞清楚。”他召来了历届主事僧来对证。僧人们各自被打发选一乘轿中,轿门都面向墙壁,不让他们相见,然后给每人一团黄泥,让他们各自捏出上届交付下来的金块的模样,声称要以之作为给案犯定罪的证据。那些僧人并不知金子的形状,都捏不出来。这样,寺里以前的这几届主事僧,都承认了自己的诬陷罪。

当囚徒困境中的各方在博弈之中处于不对等地位的时候,博弈的局势很容易发生偏移,即从合作型的博弈走向非合作型博弈。不过,这种偏移并非必然发生,因为影响博弈走向的,不但是双方的地位对比,还有局面的变化。

这就给我们一种启发,通过设计改变博弈参与者的格局,造成一种压力,那么他们很有可能改变原来的合作,改而与“警察”合作。能够达成这种局面的设计可能有很多种,但是最常用也最为有效的一种,就是有意地制造信息的不对称。

还有一个流传在美国大学生中的类似的故事,说两位交往甚密的学生在杜克大学修化学课。两人在小考、实验和期考中都表现甚优,成绩一直是A。在期末考试前的周末,他们非常自信,于是去参加弗吉尼亚大学的一场聚会。聚会太尽兴,结果周日这天两人就睡过了头,来不及准备周一上午的化学期末考。他们没有参加考试,而是向教授撒了个谎,说他们本已从弗吉尼亚大学往回赶,并安排好时间复习准备考试,但途中轮胎爆了。由于没有备用胎,他们只好整夜待在路边等待救援。现在他们实在太累了,请求教授允许他们隔天补考。教授想了想,同意了。

两人利用周一晚上好好准备了一番,胸有成竹地来参加周二上午的考试。教授安排他们分别在两间教室做答。第一个题目在考卷第一页,占了10分,非常简单。两人都写出了正确答案,心情舒畅地翻到第二页。第二页只有一个问题,占了90分。题目是:“请问破的是哪只轮胎?”结果不言而喻,两个学生只好乖乖地向教授认错。

博弈学考家告诉你

对一个博弈来说,游戏规则非常地重要,适宜的规则才能够达到目的。在我们的日常生活中莫不如此,规则制订者往往利用条件制定出有利于自身的规章制度。

合作是可能的吗

曾经有一位人类学家写了一个关于伊克人的故事。

伊克人从前是在乌干达北方山谷里采集、打猎的游牧民族,政府决定在那里开辟一个国家公园,于是,他们为法律所迫,不再在山谷间打猎,而成了耕种于山岭薄地的农民。

生活环境和生活方式的变化,摧毁了他们原有的社会规范,伊克人因此把自己变成了一群不可救药的、让人讨厌的人,他们六亲不认、极端自私、毫无爱心。

这些人似乎生活在一起,聚集在密集的小村子里,但他们实际上是孤寂的、互不联系的个人,没有明显的互相利用。他们也说话,但说出的只是些粗暴的强求和冰冷的回绝。他们什么东西都不共享,从来不歌唱。孩子一旦能走路了,就把他们赶出家门去抢劫。只要可能,随时都会把老年人抛弃,让他们饿死。行劫的孩子从无能为力的老人嘴边抢走食物。

他们生儿育女时毫无爱心,甚至连粗疏的照顾都没有。他们在彼此的大门口排便。他们对邻居幸灾乐祸,只是见到别人不幸时他们才笑。他们常常笑,也就是常常有人倒霉。

伊克人因此成为文学上的一个象征,用来代表整个人类失去信心、失去人情味后的命运将是什么。

在什么条件下才能在没有集权的利己主义者中产生合作?这个问题已经困惑人们很长时间。大家都知道人不是天使,他们往往首先关心自己的利益。然而,合作现象到处可见,它是文明的基础。那么,在每一个人都有自私动机的情况下,怎样才能产生合作呢?我们对这个问题的回答极大地影响了我们在与他人的社会、政治、经济交往时的思维和行为。

最著名的回答是由托马斯·霍布斯给出的。他悲观地认为,在有政府存在之前,自然王国充满着由自私的个体的残酷竞争引发的矛盾,生活显得“孤独、贫穷、肮脏、野蛮和浅薄”。按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。

今天,世界各个国家在没有统一领导的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。

在日常生活中,我们会问自己还要请多少次那些从来不回请我们的客人来就餐。一个机构中的管理者为了得到一些回报而给另一位管理者提供帮助。一个得到绝密消息的新闻记者为了得到进一步的消息而对来源保密。如果只有两个公司同时生产一个产品,一个公司定较高的价格是为了期望另一个公司也能保持高价,因为这样,双方都能得到好处(当然消费者吃亏了)。

合作中存在着一个根本问题,两个工业国家之间相互设置贸易壁垒便是一个很好的例子。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。

事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。

博弈学专家告诉你

个体对自身利益的追求会损害整体的利益。正如那个“鹬蚌相争”的故事所揭示的i在对手的背后,往往还有更大的、共同的敌人。

烟草商不反对禁烟广告

20世纪60年代,美国烟草行业竞争激烈,为了争夺市场,各大烟草公司都必须耗费巨额费用大做广告,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告,它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。

1971年,出于公共卫生考虑,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,财大气粗的各大烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是,尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。

实际上,在禁令出台以前的美国烟草公司已经陷入“囚徒困境”:某公司放弃做广告,而其他公司仍然大做广告抢占市场,放弃做广告的公司必然利益受损。在这种情况下,做广告就是每一个广告公司的优势策略。即使烟草公司能够达成都不做广告的协议,但是这个协议的约束力太低,并不能将烟草行业从广告战的泥潭中解救出来。

这个时候国家出台法令对于烟草行业来说反而是个好事,烟草公司自己做不到的事情,政府做到了。因为国家法律具有强制作用,相当于是烟草集团之间签订了极具约束力的协议,同时政府承担了监督烟草公司是否违反协议的成本。

在资本主义早期,成千上万的小私有者投资工商业作为谋生手段,亚当·斯密正是在这种背景下才假设经济个体行为不会影响其他个体行为,并推断出个体利益最大化也就是社会利益的最大化。后来资本的高度集中使其日益脱离生产,变为纯粹攫取利润的工具,理论模型开始注意经济生活中各利益主体之间的相互影响。一种研究经济个体如何在复杂的竞争关系中使自身利益最大化的理论“经济博弈论”应运而生。

囚徒困境本身推翻了自由经济主义存在的理论基础。囚徒困境揭示:个体理性的选择与群体理性选择之间的矛盾,从个体利益出发的行为往往不能实现团体的最大利益;市场理性本身的内在矛盾,从个体理性出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。从“囚徒困境”及其变形模型中,可以证明:人们的相互交往中,每个行为主体的利己决策结果,可能是有效率的,也可能是无效率的,但多次重复这种决策肯定是低效率的。它实际上证明了亚当·斯密200年前提出的每个人自私自利就可以实现社会最大福利的假设的不可实现性。在现代市场经济中,人们在多次交往或者重复博弈后发现,遵循平等合作规则要比通过欺诈获得少数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下去,人类将面临“一切人坑害一切人”的社会。

博弈学专家告诉你

一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。但是外力干预则可以很容易打破这种困境。

囚犯的自我救赎

好莱坞大片《肖申克的救赎》是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”

也可以通过好的策略合作,摆脱“困境”的诅咒。

为了验证面对“囚徒困境”时人们可选择的策略以及这些策略的有效程度,美国的学者组织了一次以此为主题的计算机竞赛。竞赛要求参加者根据这一困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。

竞赛的游戏方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果,即“对双方合作的奖励”,每人得3分。

如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”,也就是5分,而合作者则得到“给笨蛋的报酬”,即0分。如果双方都背叛,那么双方都得到1分,称作“对双方背叛的惩罚”。

参赛者提出了各种程序,但是大致可分为“善良的”、“邪恶的”和“随意的”三类,竞赛的结果也许有些出人意料:“善良”即“以合作为主”的策略大获全胜,而“邪恶”即“以占便宜为主”的策略成绩不佳。

现在考虑一个双方对局的例子。一个对策者采用的策略是每一步都背叛,即“总是背叛”,另一个对策者采用的策略是“一报还一报”,即在第一步合作,然后就采用对方上一步的选择。“一报还一报”意味着在对方每一次背叛之后就背叛一次。当对方采用“一报还一报”时,采用“总是背叛”的对策者,将在第一局得到收益,在尔后的对局中都得到相应的回击。这样,这个背叛者只是在第一局得到5分,而在以后的每局都只能得到1分,最终他可能会“战胜”对手,但由于总分仍然很低,而被淘汰出局。

你可能忍不住要问:“什么是最好的策略?”换句话说,什么策略能使对策者得到可能的最高分?这个问题问得很好。但是就像以后要说明的一样,独立于对方所用策略之外的最好决策规则是不存在的。从这个意义上说,“囚徒困境”完全不同于一般游戏,如国际象棋。一个象棋大师可以有把握地假定对手将走让他最头疼的一步,这种假定是这类游戏的基础。然而在这里,游戏者的利益并不是完全冲突的。双方可以通过合作而得到“对合作的奖励”,也可以通过背叛而得到“对背叛的惩罚”。如果你假定对方总是走你最担忧的一步,那么,你就会认为其他人总是不合作,这就会使你也不合作,最后招来无休止的惩罚。所以与下棋不同,在“囚徒困境”中假定对方一心要赢你是不可靠的。

事实上,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,如果你不太关心自己未来的利益,那么,你现在最好是背叛,而不用担心未来的后果。

这样,我们得到了第一个正式的结论,但是一个令人伤心的结论,即:如果未来是重要的,就不存在最优策略。

博弈学专家告诉你

在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。

有未来必然背叛

在车站和旅游点这些人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为在商家和顾客之间“没有下一次”——旅客因为商品质优价廉而再次光临的可能性微乎其微,因而正常情况下的理性选择是:一锤子买卖,不赚白不赚。

在公共汽车上,两个陌生人会为一个座位争吵,可如果他们相互认识,就会相互谦让。在社会联系紧密的人际关系中,人们普遍比较注意礼节和道德,因为他们需要长期交往,并且对未来的交往存在预期。

上面这两个例子说明,对未来的预期是影响我们行为的重要因素。一种是预期收益:我这样做,将来有什么好处;一种是预期风险:我这样做可能将来面临问题。这都将影响个人的策略。

当下屡见不鲜的一夜情现象,更能说明这种预期对行为的影响。事实上,这个对局与经典的囚徒困境如出一辙:出轨的感情本来就是为了满足欲望而进行的冒险。