1.“斗鸡博弈”与骑虎难下
话说某一天,在斗鸡场上有两只好战的公鸡发生遭遇战。这时,公鸡有两个行动选择:一是退下来,一是进攻。
如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,则两败俱伤。
因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。
不妨假设两只公鸡如果均选择“前进”,结果是两败俱伤,两者的收益是-2个单位,也就是损失为2个单位;如果一方“前进”,另外一方“后退”,前进的公鸡获得1个单位的收益,赢得了面子,而后退的公鸡获得-1的收益或损失1个单位,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的收益或1个单位的损失。当然这些数字只是相对值。
如果博弈有唯一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是事先知道的唯一的博弈结果。但是如果一个博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。斗鸡博弈就有两个纳什均衡:一方进另一方退。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。
由此看来,斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。这就像武侠小说中描写的一样,两个武林顶尖高手在华山之上比拼内力,斗得是难分难解,一旦一方稍有分心,内力衰竭,就要被对方一举击溃。
斗鸡博弈在日常生活中非常普遍。比如,警察与游行者相遇,最好有一方退下来。
再比如,收债人与债务人之间的博弈类似于斗鸡博弈:
假如债权人A与债务人B双方实力相当,债权债务关系明确,B欠A100元,金额可协商,若合作达成妥协,A可获90元,减免B债务10元,B可获10元。
如一方强硬一方妥协,则强硬方收益为100元,而妥协方收益为0;如双方强硬,发生暴力冲突,A不但收不回债务还受伤,医疗费用损失100元,则A的收益为-200元,也就是不仅100元债收不回,反而倒贴100元,B则是损失了100元。
因此,A,B各有两种战略:妥协或强硬。每一方选择自己最优战略时都假定对方战略给定:若A妥协,则B强硬是最优战略;若B妥协,A强硬将获更大收益。于是双方都强硬,企图获100的收益,却不曾考虑这一行动会给自己和对方带来负效益100。
故这场博弈有两个纳什均衡,A收益为100,B收益为0,或反之,这显然比不上集体理性下的收益支付,A,B皆妥协,收益支付分别为90,10。也就是债权人与债务人为追求利益最大化,会选择不合作,从某种意义上说双方陷入囚徒困境。
尽管在理论上有两个纳什均衡,但由于当今中国信用不健全(如欠债不还、履约率低、假冒伪劣盛行),法律环境对债务人有利,可想而知B会首先选择强硬。
因此,这是一个动态博弈,A在B选择强硬后,不会选择强硬,因为A采取强硬措施反而结局不好,故A只能选择妥协。而在双方强硬的情形下,B虽然收益为-100,但B会预期,他选择强硬时A必会选择妥协,故B的理性战略是强硬。因此,这一博弈的纳什均衡实际上为B强硬,A妥协。
欠债还钱博弈是假定A、B实力相当,如实力相差悬殊,一般实力强者选择强硬。比如在家庭夫妻冲突中,首先退下阵的一般是丈夫。大部分夫妻呕气或吵架,最终得利的总是妻子。
战国思想家庄子讲过一个故事,叫做“呆若木鸡”。说斗鸡的最高状态,就是好像木鸡一样,面对对手毫无反应,可以吓退对手,也可以麻痹对手。这个故事里面就包含着斗鸡博弈的基本原则,就是让对手错误估计双方的力量对比,从而产生错误的期望,再以自己的实力战胜对手。
然而,在实际生活中,两只斗鸡在斗鸡场上要作出严格优势策略的选择,有时并不是一开始就作出这样的选择的,而是要通过反复的试探,甚至是激烈的争斗后才会作出严格优势策略的选择,一方前进,一方后退,这也是符合斗鸡定律的。
因为哪一方前进,不是由两只斗鸡的主观愿望决定的,而是由双方的实力预测所决定的,当两方都无法完全预测对方实力的强弱的话,那就只能通过试探才能知道了,当然有时这种试探是要付出相当大的代价的。
在现实社会中,以这种形式运用斗鸡定律,却比直接选用严格优势策略的形式,要常见的多。这也许是因为人有复杂的思维、更多的欲望。
斗鸡博弈进一步衍生为动态博弈,会形成这样一个拍卖模型。拍卖规则是:轮流出价,谁出的最高,谁就将得到该物品,但是出价少的人不但得不到该物品,并且要按他所叫的价付给拍卖方。
假定有两人竞价争夺价值100元的物品,只要双方开始叫价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人都这样想:如果我退出,我将失去我出的钱,若不退出,我将有可能得到这价值100元的物品。但是,随着出价的增加,他的损失也可能越大。每个人面临着是继续叫价还是退出的两难困境。
这个博弈实际上有一个纳什均衡:第一个出价人叫出100元的竞标价,另外一个人不出价(因为在对方叫出100元的价格后,他继续叫价将是不理性的),出价100元的参与人得到该物品。
一旦进入骑虎难下的博弈,尽早退出是明智之举。然而当局者往往是做不到的,这就是所谓“当局者迷,旁观者清”。
这种骑虎难下的博弈经常出现在企业或组织之间,也出现在个人之间。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,就是骑虎难下。其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是必胜的。
从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像那些世界一流的赌场要设定赌博数额的限制。
博弈论专家,有时候也将骑虎难下博弈称之为“协和谬误”。
20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。
协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。
2.向左走向右走
用斗鸡博弈来解释20世纪60年代初发生在美苏两个超级大国之间的一场导弹危机,是最合适不过的了。
面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择。而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择。也就是说,这两只大公鸡都在考虑是采取进的策略还是退的策略。
战争的结果当然是两败俱伤,任何一方退下来(而对方不退)则是不光彩的事情。结果苏联将导弹从古巴撤了下来,做了丢面子的公鸡;美国坚持了自己的原则,做了有面子的公鸡。当然,为了顾及苏联的面子,美国也限制性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两国之间发生的最严重的一次危机。
这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。
前面我们已知,在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。一个小例子就是两个骑自行车的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该如何反应,于是撞到一起。
自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。所以,应该有一个强制性的规定,来告诉人们该怎么做。
开车的时候你应该走哪一边?假如别人都靠右行驶,你也会留在右边。套用“假如我认为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。
不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡,所有参与者必须就应选择哪一个达成共识,否则就会导致困惑。
海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交会的机会很多,这些船只属于不同的国家,如何调节谁进谁退的问题呢?先来看一个小笑话:
一艘军舰在夜航中,舰长发现前方航线上出现了灯光。
舰长马上呼叫:“对面船只,右转30度。”
对方回答:“请对面船只左转30度。”
“我是美国海军上校,右转30度。”
“我是加拿大海军二等兵,请左转30度。”
舰长生气了:“听着,我是‘列克星顿’号战列舰舰长,这是美国海军最强大的武装力量,右转30度!”
“我是灯塔管理员,请左转30度。”
即使你官阶、舰船再大,灯塔也不会给你让路。那么,如果是两条船相遇,又如何决定呢?
谁先让不能等待临时谈判,也不是由官阶说了算。海上避碰也有像许多国家规定车辆在马路上靠右走那样不容谈判的规矩。人们规定,迎面交会的船舶,各向右偏一点儿,问题就解决了。十字交叉交会的船舶,则规定看见对方左舷的那艘船要让,慢下来或者偏右一点儿都可以,这就从制度上规定了避让的方式。
这十字交叉交会时如何避免碰撞的规矩,就是上述博弈的两个纳什均衡中的一个。究竟哪一个纳什均衡真正发生,现在就看两船航行的相互位置。如果甲看见乙的左舷,甲要让乙原速直走;如果乙看见甲的左舷,乙要让甲原速直走。
3.威胁、承诺、作弊与惩罚
辱骂和恐吓绝不是战斗。
——鲁迅
在一次博弈论课上,一名教授对学生们说:“你们每个人需要给我10元钱,否则我就要去自杀。学生们哄堂大笑,因为他们觉得他在开玩笑。他的威胁是不可置信的。如果他真要以自杀威胁来讹诈学生的钱财,他该怎么才能成功?那他可不能简单地口头说说而已。博弈论中是否相信一个人,不是看他说了什么,而是看他做了什么——行胜于言。所以教授应该爬到高高的教学楼顶,翻到栏杆外,站在危险的边缘,然后再提出每人给他10元钱,这时候(至少是大部分)学生们会乖乖地掏出10元钱来。因为他威胁变得可信了——他现在随时有生命危险。
在博弈中,威胁、承诺,还包括报复,都是惯用伎俩,这些内容也是要探讨的主题。大家会发现,博弈论思维的确有助于我们洞悉某些局中的不可置信的威胁、不可置信的承诺等。
在生活中,人们惯用威胁和恐吓来达到自己的目的。但是,理性的参与者会发现某些博弈中威胁是不可置信的,即塞尔顿(Selton,1994年经济学诺贝尔奖得主)所谓的“空洞威胁”(empty threat)。威胁不可置信的一个重要原因是:将威胁所声称的策略付诸实践对于威胁者本人来说比实施非威胁声称的策略更不利。既然如此我们就没有理由相信威胁者会选择其威胁所声称的策略。
比如有一个垄断市场,惟一的垄断者独占市场每年可获得100万的利润。现在有一个新的企业准备进入这个市场,如果垄断者对进入者采取打击政策,那么进入者就将每年亏损10万元,同时垄断者的利润也下降为30万元;如果垄断者对进入者实行默认政策,那么进入者和垄断者将各自得到50万元利润。现在,为了防止进入者进入,在位的垄断企业宣称:如果进入者进入,那么它就会选择打击政策。
但是,如果读者把这个市场进入博弈的博弈树画出来,再用逆向归纳方法求出均衡路径,你会发现什么?
我们会发现均衡路径是进入者进入,而在位者默认。在位者的威胁将是不可置信的,因为给定进入者真的进入了,在位者选择默认而不是打击将更符合其利益,所以在位者宣称要实施打击,也只是说说而已。不可置信的威胁的产生,是因为威胁者选择其威胁所宣称的行动时,对其自己并没有好处,因此威胁不可置信。这里,对自己并没有好处应当做一个稍宽泛的理解,有时候它可能并不是表示对自己伤害几多,而是因为实施该行动的成本太高而使之无法实施。无法实施的威胁行动,自然就是不可置信的威胁。
这一观念可以解释生活中的诸多现象。