1.“蜈蚣博弈”的悖论
推倒法是分析完全且完美信息下的动态博弈的有用工具,在我们分析言语博弈中“威胁”或“承诺”是否可信时,已举出了一个倒推法例子。我们看到,倒推法符合我们的直觉。通过下面的娱蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A,B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A,B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
合作合作合作合作A——B——A…………A——B——(100,100)背叛背叛背叛背叛(1,1)(0,3)(2,2)(99,99)(98,101)现在的问题是:A,B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”。此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”。因为“背叛”的收益99大于“合作”的收益。如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A∶100,B∶100-99。
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语para意即“超越”,dox的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验〔目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者〕,实验发现,不会出现开始选择“不合作”策略而双方获得收益1的情况。双方会选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。倒推法似乎是不正确的。然而,我们会发现,即使双方开始就能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
2.理性的困境
有这样一个博弈:两人分一笔总量固定的钱,比如100元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果不同意的话,两人将一无所得。比如A提出方案,B表决。如果A提的方案是70∶30,即A得70元,B得30元。如果接受,则A得70元,B得30元;如果B不同意,则两人将什么也得不到。
A提方案时要猜测B的反应,A会这样想:根据理性人的假定,A无论提出什么方案给B——除了将所有100元留给自己,而一点不给B留这样极端的情况,否则B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。
此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99∶0.01。B接受了还有0.01元,而不接受,将什么也没有。
这是根据理性人的假定的结果,而实际却不是这个结果。英国博弈论专家宾莫做了实验,发现提方案者倾向于提50∶50。而接受者会倾向于:如果给他的少于30%,他将拒绝;多30%,则不拒绝。
这个博弈反映的是“人是理性的”这样的假设在某些时候存在着与实际不符的情况。理论的假定与实际不符的另外一个例子是“彩票问题”。我们说理性的人是使自己的效益最大,如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实人们购买彩票的现象。人们愿意掏少量的钱去买彩票,如买福利彩票、体育彩票等,以博取高额的回报。在这样的过程中,人们自己的理性选择发挥不出来,而惟有靠运气。在这个博弈中,人们要在决定购买彩票还是决定不买彩票之间进行选择,根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。彩票的命中率肯定低,并且命中率与命中所得相乘肯定低于购买的付出,因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们肯定赢。在这样的博弈中,彩票购买者是不理性的:他未使自己的期望效益最大。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假设是不符合实际情况的。
当然我们可以给出这样一个解释:现实中人的理性的计算能力往往用在不符合实际情况的“高效用”问题上,而在“低效用”问题上,理性往往会失去作用。在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,然而所能命中的期望也几乎是零。这时候,影响人抉择的是非理性因素。比如,认为自己如果运气好的话可以获得高额回报,可以给自己带来更高效用。彩票发行者正是利用人们这种心理来寻求获利途径。
3.各种投票制度的利弊
至少在某些情况下,民意是一团可以捏来捏去的面,因此很容易被误导或只注重短期效益。但是总的说来,各个阶层的民众还是懂得维护自身的利益的,不过这又带来另外的问题——争吵不休导致的效率低下。所以在选择时,所面临的冲突就是目标设定:究竟要一个有效能的政府(它除了领导、远见外,还包括了一些必然不受欢迎的决策);还是选一个能反映大众期望、欲求的体制(只剥夺少数人民的权利,又能表达一般选民的不同意见)?不同的目标将会产生不同的制度。世界各国多采用“胜者为王”制,即由得到多数选票的人担任执政者。
采用“多数为王”制(哪个政党获得多数支持,就单独掌权)的最大弊端,就是在选举后将使大部分民众不再具有影响力,而少数派就像战败的军队般,只能为下次竞选作准备,影响力几乎为零,他们在扮演角色时,仍是以下次选举作为出发点。
在美国这样执政者任期较短的国家,人们可以期待下一次的选举。但在任期较长的国家,一次失利则代表着会有很长一段时间失去权力,而胜选阵营常在任期结束后仍继续掌权。其实就是在以“民主”著称的美国,现任国会议员也总是有办法连任下去,不论他政绩如何。
与“多数为王”相反的选举制度就是以投票比例决定各党代表的席次,以确保政府或民主制度中的立法单位:在运作过程中,不会忽视所有人的意见。许多欧洲国家都采用这样的制度,美国部分地区也尝试过,但世界各地的经验表示,有效能的政府需要在不同的方案间决定最佳决策,而高度分散化的团体则很难在影响深远的选择间作出决定。那些大声疾呼“多元化”可强化社会结构的论调,实在很难从历史上找到佐证。比例代表制虽不会蹂躏少数人的权益,却也不易实践多数人的愿望。不论选择为何,最后都会遇到无法回避的难题。
由此可知,不同选举制度满足的是不同的需求。“多数为王”制戬害少数人的意见,但有时也可能戬害多数民意。在一些国家实施的比例代表制对领先的候选人不利、且常产生低效率的政府。专制有利于决策的进行,但制衡机制不足,特别是对可怕的决策缺乏防范功能。不过在碰到危机时,有效的领导可以处理攸关生死的决定,因为即使是无能的将领,都强过群龙无首的局面。
所以即使在民主制国家,在非常时期(如战争)也会赋予领导者更多的权力。
对于社会的选择问题,斯坦福大学教授肯尼思·阿罗由这一类难题中得出了著名的“不可能”定理。
阿罗认为,在非独裁的情况下,任何一个体系,若要将人们对三个或三个以上的选择作出一项集体抉择,不存在任何加总社会个体成员偏好的方法。
所谓加总社会偏好,即找到一个社会偏好函数,它必须同时满足以下几个最基本的要求:
(1)传递性:假如人们在A和B之间选择A,在H和C之间选择B,那么人们在A和C之间必然选择A。
(2)全体一致性:假如在A和B之间一致倾向于A,那么人们就会选择A而非B。
(3)不相关选择的相互独立性:人们在A和B之间做的选择并不取决于是不是存在另外一个选项C。
(4)非独裁性:没有任何人可以每次都得逞,因而不存在独裁的力量。
换言之,肯尼思·阿罗证明了。任何清晰的、理性的、反映多数民意的,同时又是民主的方法是不可能存在的。
阿罗的论证,称之为不可能性定理(因为它证明了完全民主在理论上是不可能的),该论证帮助他于1972年获得了诺贝尔经济学奖,这是博弈论中最惊人的成果之一。阿罗的“毁灭性发现”所产生的影响,使人们至今还能感觉到。这种令人不安的论证立即在全世界学术界引起了评论。
自从1951年肯尼思·阿罗令人信服地论证出了这个结论,数学家和经济学家震惊了。
1952年,保罗·萨缪尔森(后来曾获得诺贝尔经济学奖)这样表达:“这证明了探索完全民主的历史记录下的伟大思想也是探索一种妄想,一种逻辑上的自相矛盾。现在全世界的学者们——数学的、政治的、哲学的和经济学的——都在试图挽救阿罗的毁灭性发现中能够挽救出的东西。”
4.民主与诡计
和其他类型的多人博弈一样,投票当中也会出现策略问题。也就是说,有时为了达到目的,投票者倾向于隐藏自己的真实意愿。
比如,三位女孩结伴逛街,临近中午她们打算一起吃午饭。她们都喜欢洋快餐,正好这条街上有麦当劳、肯德基和必胜客,可是每个人的偏好不同:A喜欢麦当劳,其次是肯德基,最不喜欢必胜客;B的偏好依次是肯德基、麦当劳、必胜客;C的选择却又不同:必胜客、麦当劳、肯德基。假定这三人一定要一起吃饭,那么会出现什么结果呢?
因为三个人的喜好如此不同,难于达成一致,所以她们决定采取投票表决的方式,先在麦当劳与必胜客之间决出一个胜者,然后再与肯德基决胜。如果是每个人都诚实投票,那么,麦当劳将战胜必胜客(因为B在两者之间倾向于前者),并在第二轮战胜肯德基。但是如果B不诚实投票,结果就会大不一样。
B知道其他人的偏好,而且她希望达到自己满意的结果,于是在第一轮故意投票给必胜客,于是必胜客获胜;在第二轮,肯德基又战胜必胜客,于是,B通过策略实现了自己的愿望。可是这个愿望并不是符合大家的最大利益的——理想的结果应该是麦当劳,因为在三个人的综合评价中,它的分数最高。
无论是少数服从多数的规则,或是其他任何投票机制,都不能解决这个问题,因为现在尚不存在一个完美无缺的体系,可以将个人的倾向会聚成人民的意愿。因此投票制的民主实际是知易行难,由于排名内部的模棱两可,造成狡猾的候选人有极大的操作空间,无论什么规则都会使公平选举遭到扭曲。所有政治演说也常谈到尊重“人民意愿”,却不容易做到。事实上,也几乎不可能决定何者是人民的意愿。宣称实行民主制度远比实际实施民主要容易得多。
5.投票悖论与阿罗“不可能”定理
民主的本质就是每个人都有发言与选择的权利,并且对于其整体是少数服从多数。
从形式上看,投票制度是民主的最佳形式。然而从实质上看,投票制度却有着根深蒂固的难以克服的内在缺陷。
余治国教授曾于2003年12月在天涯社区经济论坛发过一篇文章,名为《论民主与人类自私本性的不可调和性与民主的不可行性》。