假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略的做法,必须建立在一方拥有至少三个策略的博弈的基础之上。在你没有优势策略的情况下,你要做的就是剔除所有劣势策略,不予考虑,如此一步一步做下去。
假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模和复杂程度。
对利用优势策略方法与规避劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也一样。
3.警察与小偷
是不是所有的博弈都存在纳什均衡点呢?不一定存在纯策略纳什均衡点,所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,但至少存在一个混合策略均衡点——所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的一个概率分布。这就是纳什于1950年证明了的纳什定理。我们在下面“警察与小偷”的博弈中给出混和策略的说明。
在西部片里,我们常能看到这样的故事:
某个小镇上只有一名警察,他要负责整个镇的治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻,而小偷也只能去一个地方。假定银行需要保护的财产为2万元,酒馆的财产价格为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,就会被警察抓住;若小偷去了警察没有巡逻的地方,则小偷偷盗成功。警察该怎么巡逻才能取得最好的效果呢?
一个明显的做法是,警察对银行进行巡逻,这样,警察可以保住2万元的财产不被偷窃。可是如此,假如小偷去了酒馆,偷窃就一定会成功。那么,警察的这种做法是最好的吗?有没有改进的措施?
这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混和策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。
在这个例子中,警察最好的做法是,抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍,所以用2个签代表银行,比如如果抽到1、2号签去银行,抽到3号签就去酒馆。这样警察有2/3的可能性去银行进行巡逻,1/3的可能性去酒馆。而小偷的最优选择是,以同样抽签的办法决定去银行还是去酒馆偷盗,抽到1、2号签去酒馆,抽到3号签去银行,那么,小偷有1/3的可能性去银行,2/3的可能性去酒馆。
警察与小偷之间的博弈,如同小孩子之间玩“剪刀石头布”的游戏,在这样一个游戏中,不存在纯策略均衡,而是混合策略均衡。对每个小孩来说,自己出“剪刀”、“布”还是“石头”应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。
如果对方知道你采取其中一个策略的“可能性”大,那么你在游戏中输的可能性就大。
因此,每个小孩的最优混合策略是采取每个策略的可能性都是1/3,在这场博弈中每个小孩各采取三个策略的1/3是纳什均衡。由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混和策略是参与者在各种备选策略中采取随机选取的策略。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。
4.画地为牢的精义
“山中无老虎,猴子称大王”,这似乎成为讽刺那些自不量力的人的代名词。其实仔细分析,这句话就包含着一个博弈原理。在山中没有大王的时候,也就是在多方博弈中没有一方能够在博弈中占据绝对优势的时候,所有的人都可以参与到争夺“大王”之位的博弈中来,每个拥有一定实力的博弈者都有取得胜利的机会。
但话说回来,当山中有老虎的时候,猴子又应该怎么办呢?有了老虎,就必然有了一套现成的规则,给每个人都分配了一定的权限和势力范围,并给每个人提供了一定扩大自己权限和势力范围的规则和极限。这时候,对于理智的猴子来说,一则争取自己的权力和范围,二则在允许范围内,按照既定的规则,扩大自己的权力,也就是遵守规则,安守本分。这样即使是吃人的老虎也很难找到猴子的茬儿。这才是猴子应该和可能做到的。
中国历史上的汉武帝与秦始皇在为政方面有许多相似之处。汉武帝执政54年,先后任命过十几个亚相,结果没有几个得以善终。他分封过上百个王侯,但最后又一网打尽。在汉武帝的臣子中,唯一能够善始善终的居然是一个奴隶出身的大将军,这就是卫青。
青少年时期的卫青,做梦也不会想到日后能够驰骋疆场,成为中国历史上的风云人物,因为他是一个私生子,是一个奴隶。由于母亲的关系,他在当时的平阳公主家当奴隶。长年累月的劳累、吃苦,使他锻炼出极好的体力和骑射本领;艰难的环境使他磨炼出忍耐、克制和忍让的坚韧性格和美德;与贵族的朝夕相处,卫青也学会了点儿文化知识和上层社会的礼仪。
一个偶然的机会,汉武帝看上了与卫青同母异父的却又身为歌女的卫子夫,这位地位卑贱的女子给年轻的皇帝生下了第一个儿子,卫青的命运从此改变。
公元前129年,匈奴兴兵南下,卫青被任命为车骑将军,迎击匈奴。这次用兵,汉武帝分派四路出击。匈奴主力攻击老将李广,卫青大胆孤军深入,直捣龙城,斩首700人,取得胜利。另外三路,两路失败,一路无功而还。汉武帝看到只有卫青胜利凯旋,非常赏识,加封关内侯。从此,卫青成为汉武帝抗击匈奴的主将。
公元前127年,武帝趁匈奴主力进攻上谷、渔阳,决定正面以少量部队迷惑敌人,主力则由卫青率领,避实击虚,进攻匈奴盘踞已久的黄河河套地区。
卫青从云中出发,采用“迂回包抄”的战术,不动声色地绕到匈奴后方,攻占高阙,切断了匈奴彼此的联系。然后急行军六七百里,趁着黑夜包围了右贤王的营帐。
这次战斗,俘虏了右贤王的小王十余人,男女一万五千余人,牲畜有几百万头。汉军大获全胜,高奏凯歌,收兵回朝。
汉武帝接到战报,喜出望外,派特使捧着印信,到军中拜卫青为大将军,加封食邑8700户,所有将领归他指挥。卫青的三个儿子都还在襁褓之中,也被汉武帝封为列侯。
卫青坚决推辞,主张奖励在战争中拼死厮杀的将士,使追随他的公孙敖、韩说、公孙贺、李蔡、李朔等都受到奖赏。这次战役,卫青的战功和谦让奠定了他在武帝心中的地位。
对汉武帝来说,他需要能够帮他开拓疆土,建立不朽基业的杰出将领,更需要在战场上猛如虎,在他面前怯如鼠的臣子。如果卫青欣然接受,认为理所当然,在武帝心中就觉得这样的臣子只能利用,在利用价值结束后,就必须让他消失。但卫青一再谦虚,就让武帝觉得这样的臣子不贪图功名富贵,防范心理大减,这就为日后卫青逃脱武帝的杀戮奠定了基础;所以在这次博弈中,卫青在武帝心目中留下了不贪财的印象,武帝觉得卫青没有辜负自己的期望,君臣得了一个双赢的结局。
其后,平阳公主寡居在家,要在列侯中选择丈夫,许多人都说大将军卫青合适,平阳公主笑着说,他是我从前的下人,过去是我的随从,怎么能做我的丈夫呢?左右说,大将军已今非昔比了,他现在是大将军,姐姐是皇后,三个儿子也都封了侯,富贵震天下,哪还有比他更配得上您的呢。汉武帝知道后,失笑道,当初我娶了他的姐姐,现在他又娶我的姐姐,这倒是很有意思。于是当即允婚。时迁事移,当年的仆人就这样做了主人的丈夫。这样一来,卫青与汉武帝亲上加亲,更受宠信。这又给卫青增加了一道护身符。
公元前123年,卫青率领三万骑兵,统率六位将军,浩浩荡荡,从定襄出发,北进数百里,歼灭匈奴军数千名。这次战役中,卫青的外甥霍去病率八百精骑首次参战,取得了歼敌两千余人的辉煌战果。战后全军返回定襄休整,一个月后再次出塞,斩获匈奴军一万多名。
但是,右将军苏建和前将军赵信与匈奴打了一场遭遇战,汉军死伤惨重,苏建突围逃回,赵信本是匈奴降将,兵败后就又投降了匈奴。
在讨论如何处置苏建弃军而逃的罪过时,有人建议将他斩首以建立大将军的威严,有人认为苏建是尽力而战的,不应斩首。卫青本有权力可以处决部将,却极其圆滑地把苏建用囚车送回长安由皇帝处理。这实际上又是卫青与汉武帝之间一场无言博弈。
在这场博弈中,卫青有权处理战败的将领,如果当时卫青处理了,汉武帝也不会拿卫青怎么样,毕竟他是按照自己的权力行事;但卫青却故意将他拘禁交给汉武帝,这就向汉武帝发出自己不贪恋权势的信号,进一步赢得汉武帝的信任。
对帝王来说,贪恋富贵的人不可怕,贪恋权势的人才是对帝王权力的真正威胁。卫青的这一举动,已经触及到武帝的内心深处,谁说这位奴隶出身的将军不会谄媚主上,不会用权谋呢?这种权谋对主子来说是他喜欢的,对臣子来说也是一种自我保护的手段。
公元前119年春,卫青、骠骑将军霍去病各率五万骑兵,分别从定襄、代郡出发,远征漠北。
卫青镇定自若,消灭和俘虏匈奴一万九千人,而霍去病却歼灭匈奴七万多人,外甥的战功超过了舅舅。汉武帝加封卫青为大司马,但对霍去病更加宠爱。
霍去病的声望超过了他的舅舅卫青,过去奔走于大将军门下的许多故旧都转到了霍去病门下。卫青门前顿显冷落,可他不以为然,认为这也是人之常情,心甘情愿地过着恬淡平静的生活。
正是这种得志时不骄傲,失意时不愤恨的处世方法,才使他在汉武帝的独裁专横下,能够保全自己,直到公元前106年病逝。
卫青从一个默默无闻的奴仆,成为显赫一时的名将,最后能够保全晚节,文韬武略固然让人称赞,但其中蕴藏的博弈策略也是常人难以匹敌的。
所以说,山中有老虎而老虎又爱吃人的时候,作为猴子一定要明白自己的地位,在规则内活动,从而尽量保全自己。
5.最优反应决定策略
在一个长度为1的沙滩上,均匀地分布着三三两两的游客。每个游客将消费一瓶水。两个小贩前来卖水。如果每个游客都只在靠自己最近的那个小贩那里买水,那么两个小贩将如何布局他们的摊位?在这样一个博弈中,两个小贩会发现,如果自己摆在沙滩中点以左(或右)的任何位置都是不好的,因为对方可以通过摆在紧邻自己的右(或左)边即可获得超过1/2的游客消费者,而自己只能获得少于1/2的游客消费者。只有自己安置在沙滩的正中点,这才是最好的,因为无论对方紧邻自己左边还是右边,自己始终可以得到1/2的游客,其他的位置皆不可能得到这么多游客。于是,两个小贩就把摊位紧挨着摆在了沙滩的中心点上。
这个“沙滩卖水果”的博弈,还可以用于政治选举中拉票的分析,也可用于解释为什么卖同类物品的商家总是紧挨着布局。不过,我们引用这个例子是为了说明,在什么样的策略组合下,博弈双方可以得到一个稳定的结果。就像那两个小贩得到稳定的摊位布局一样。
囚徒困境中存在优势策略纳什均衡(两个人都选取优势策略),智猪博弈中有重复提出劣势策略纳什均衡(一个人有优势策略,另一个人没有)。但是,在很多的博弈中,所有参与人都没有优势策略(也就不可能有劣势策略)。比如下面这个被称之为“麦琪的礼物”的博弈,我们应如何求解它的博弈平衡呢?
“麦琪的礼物”博弈改编自欧·亨利的同名小说。小说写的是这样一个故事:有一对生活拮据却异常恩爱的夫妻,丈夫吉姆有一只爱不释手的怀表,却没有表链;妻子有一头美丽的长发,却缺少一只发夹。他俩感情深厚,生活得美满知足。在圣诞节前夕,两人分别悄悄外出为对方买礼物。结果妻子剪卖自己的长发,为丈夫买来表链,好配他的怀表;而丈夫则卖了怀表,为妻子买来发夹。
把这个故事设计为博弈模型可设计成如下数字:
1.如果丈夫卖了表而妻子剪了发,则他们的礼物对对方都没有价值,他们各自得到效用0;2.如果丈夫不卖表而妻子不剪发,则他们都没有钱买礼物送给对方,仍各自得到效用0;3.如果丈夫卖表而妻子不剪发,或者丈夫不卖表而妻子剪发,则他们中有一方可买礼物送给对方,因为他们如此相爱,送礼方可得到2个单位效用,受礼方可得到1个单位效用。
这个博弈的稳定结果(或者说均衡)是什么呢?我们再也无法寻找到他们的优势策略,因此需要创造出一些新的寻找稳定结果的方法。可喜的是,我们确有这样的方法,那就是根据纳什均衡的定义来求解。