由此,纳什均衡状态下丈夫的混合策略是(2/3,1/3),妻子的混合策略也是(2/3,1/3),混合纳什均衡为{(2/3,1/3),(2/3,1/3)}。
比如,如下的一个博弈中,由画线法可得到(中,左)和(上,右)两个纯策略纳什均衡。那么它有没有混合策略纳什均衡呢?奇数定理有助于我们判断,该定理说:几乎所有的有限博弈都有有限奇数个纳什均衡(包括混合策略均衡)。因此,当我们找到偶数个(比如这里的两个)均衡时,则至少还应存在一个混合策略均衡。
有一些读者一看到这个博弈,首先就想到直接为参与人的每个策略赋予一个概率。习惯的做法是(注意,以下的做法是错误的!):
假设张三选择上的概率为P,选择中的概率为q,选择下的概率为1-p-q。张三选择p,q使李四的各策略下的预期赢利是无差异的,即:
李四选左的预期赢利:
2×p+3×q+1×(1-p-q)=1+p+2q
李四选中的预期赢利:
2×p+1×q+0×(1-p-q)=2p+q
李四选右的预期赢利:
4×p+2×q+3×(1-p-q)=p-q+3
各策略预期赢利无差异意味着有:1+p+2q=2p+q=p-q+3,可解出:p′=5/3,q′=2/3。这个答案显然是错误的,因为作为概率的p′怎么可能大于1呢?
到这里,实际上我们已经不需要再探讨李四的混合策略了,因为错误已经很明显。问题是,为什么会有错误呢?
原因是:我们未能在求解混合策略均衡前剔除劣势策略。
观察这个博弈,可发现对于张三来说,“下”是“上”的严格劣势策略,即张三是永远不会选择“下”的——这相当于采取“下”的概率为0,所以再求混合策略的时候我们必须先对“下”这样的劣势策略赋予0概率,或者剔除掉该策略。
读者可能还有一个问题:我们赋予策略“下”一个概率1-p-q,为什么计算出这个劣势策略得到的概率不会为0呢?原因是,给定张三选下,李四选择左、中、右的赢利是不一样的,而实际上既然张三不会选下,李四的预期赢利里实际上就不应包括(下,左或中或右)的情况,所以,写出李四的预期赢利根本就是错的,自然得到的关于策略“下”的选取概率更是错的。
好了,现在我们来介绍正确的做法:首先应当剔除张三的“下”;而这一轮剔除之后读者们会发现,对李四而言,“中”相对于“右”的劣势策略,应该剔除“中”。
对于这个博弈,混合策略的求解是容易的:假设张三选上的概率为p,选中的概率为1-p;李四选左的概率为q,选右的概率为1-q。
然后写出张三两种策略的预期赢利:
1.若他选上:2q+4(1-q)=4-2q
2.若他选中:3q+2(1-q)=2+q
令两式相等,得到4-2q=2+q→q=2/3,1-p′=1/3再写出李四两种策略的预期赢利:
1.若他选左:0p+4(1-p)=4-4p
2.若他选右:2p+3(1-p)=3-p
令两式相等,得到4-4p=3-p→p′=1/3,1-p′=2/3整理一下结果,对于上面的博弈,正确的混合策略均衡应该是:张三以1/3的概率选择上,以2/3的概率选择中,以0概率选择下;李四以2/3的概率选择左,以0概率选择中,以1/3的概率选择右。这一混合策略均衡可写为:{(1/3,2/3,0),(2/3,0,1/3)}。
存在多重均衡的博弈往往也存在混合策略,那么无纯策略均衡的博弈有没有混合策略呢?根据前面提到的奇数定理,可以推断一个博弈若没有纯策略博弈,那么至少会存在一个混合策略。
再看赌硬币博弈,在前面我们已经知道它没有纯策略纳什均衡,现在我们来求它的混合策略。
假设小孩甲选正面的概率为P,选背面的概率则为1-P;小孩乙选择正面的概率为q,选背面的概率1-q,则1.小孩甲选正面的预期lq-(1-q)=2q-12.小孩甲选背面的预期赢利:-1q+(1-q)=1-2q令2q-1=1-2q,有q=0.5,1-q′=0.51.小孩甲选正面的预期赢利:1p-(1-p)=2p-12.小孩甲选背面的预期赢利:-1p+(1-P)=1-2p令2p-1=1-2p,有p′=0.5,1-p=0.5由此我们得到两个小孩各自都有混合策略(0.5,0.5)。每个小孩都以50%的概率随机出正面,以50%的概率随机出背面。混合纳什均衡为:{(0.5,0.5),(0.5,0.5)}。
这说明,有些博弈虽然没有纯策略纳什均衡,但是却存在混合策略纳什均衡。在现实中,有很多对抗游戏都类似于这种博弈,比如猜拳行令,或者我们儿时玩的“剪刀·石头·布”游戏。
利用随机性进行博弈
世界是不确定的,不过人们总是不大喜欢随机事件,因为其难以预测,无法掌控。通常我们认为随机的序列杂乱无章,是没有用处的。比如,给你一串随机生成的数字,2134398990376540421126……这样一个随机序列会有用处吗?你大概会说没有。但是如果结合到博弈的混合策略,我们会发现它确有用处。
南方有些地方,喝酒时常有行拳的习惯。行拳的人每人可伸出1~5个指头,叫出0~10中的一个数字,如果一方叫出的数字正好是两人伸出的指头数量之和,而另一方未能同样准确叫出,那么一方就胜利,另一方就失败,失败者会被罚酒。
在这样一个博弈中,你应该怎样出拳和叫拳昵?如果你老是叫同样的数字出同样的拳,或者只简单地变化,那么你那聪明的对手就会发现你的规律,然后战胜你(虽然他不是每每可以胜你,但却可以输少赢多)。为了不让对手发现你的规律,一个聪明的办法是事先准备一个随机序列,然后按照这个随机序列来选择你的策略——当然,这个随机序列不能被你的对手知晓——由于这样做是没有规律可循的,对手就难以通过抓规律来战胜你。
又如伊拉克战争中美军试图炸死萨达姆的例子。面临美军的轰炸,萨达姆可能会想到躲到最安全的掩体中去;但是,他马上也会意识到,其实美军也会把最安全的掩体当做重点目标,于是他应当躲在并不那么安全的地方——俗话说“最危险的地方也是最安全的地方”——但是,他又凭什么认为美军不会推测到他的这种想法呢?最后,实际上他会发现这样想下去只是无穷的循环,只要他无法猜透美军的策略,他自己的策略也就很难确定。最好的解决办法也许就是抛硬币或者利用随机数据表来确定该躲在哪里。这看起来不可思议,然而却确实是一个理性人应该做的。
曾经有人说:有时候,解决问题的最好办法就是不去想怎么解决问题。这句话用在博弈的混合策略上是最恰当不过的。当你跟朋友玩“剪刀·石头·布”的游戏时,无论你怎么想,都不会得到一个最优的纯策略。这种游戏的最好玩法也许就是根本不要去想下一次该出什么,脑袋里突然出现某个策略,那选取它就行了。没有理由,也不需要理由。
股市的寓言
下面这个关于股市的寓言故事,在我看来某种程度上也反映了随机的好处。我们会发现,人们分散决策而导致的随机性质的策略组合是股市良好运行的前提,一旦人们持有相同预期而将行为收敛到某一特定的策略(组合)上,对股市反而是灾难性的。
本故事改编自一篇严肃的学术论文。所以,读起来要动点脑筋。
话说茫茫大海,有一鸟岛,岛上住着麻雀和猫头鹰。麻雀数目众多,几近于无限,而猫头鹰则比较少,大概几千只的样子。鸟岛的经济水平虽不算高,却也老早老早就有了一种叫做“鸟元”的货币在流通,现在又大力引进电脑,正准备与国际接轨,一步到位,进入最先进的互联网时代。
不知从何时起,麻雀之间开始流行一种翻牌游戏。每次游戏前,玩家把一鸟元扔进一个称为“股市”的盒子中,换取两张牌,一张上面写着“买”,另一张写着“卖”。游戏开始,每位麻雀任取一张牌覆在桌面,然后同时翻开,计算买牌和卖牌的比例,据此从股市中分钱。举个例子,假如翻出80张买牌,20张卖牌,那么每个出卖牌的麻雀可以拿到80/20=4鸟元,而每个买家只能拿20/80=0.25鸟元。买牌和卖牌的比例,鸟儿们叫“股价”。
这里有个小问题:如果大家都出买牌或都出卖牌,怎么办?麻雀们规定,这时所有钱都给一个叫“做市商”的麻雀。谁当做市商,每次游戏前由抽签决定。
这个游戏,最早是几个特有开拓精神的麻雀,到极西海边的米猴岛做生意时,当做搞活经济的诀窍学来的。刚开始只在小圈子里玩,输赢也不大,有人赔钱,自然也有人赚钱。但好消息总是比坏消息传得快也传得广。闲谈议论中,“有人玩股市赚了好多钱哟!”等传言,刺激着越来越多麻雀们的神经,不断有新的鸟儿投入这游戏,输赢的数目也随之扩大。有几只鸟在股市中大赚其鸟元,成了百万富翁。还有消息称,西边米猴岛就是靠玩股成了世界首富。这些刺激着鸟儿们的玩股激情,并使其进一步高涨,越来越多的麻雀卷了进去。
随着电脑和互联网的引入,参加股市的鸟儿们达到了空前规模。投入股市的鸟元达到了天文数字,几近于无穷大。每只鸟儿,自然都期待着同样巨额的、天文数字级的输赢。可是,奇怪的事情发生了:开牌出来,买牌和卖牌的比例差不多相等,股价差不多刚好等于1。刚开始还以为是巧合,然而不仅头一次是这样,第二次是这样,第三次还是这样……以后次次开牌,股价总是接近于1,没什么大起伏。雀儿们不了解这其实只是大数定理的必然结果,于是就去找猫头鹰求助,看有没有什么赢钱的妙方。
猫头鹰看起来都是很有学问的样子。它们的书房里堆满了大部头书籍,有经济计量学、时间序列模型、技术分析理论等。其中不少书,听说还是一些猫头鹰特意从极西米猴岛专门引进的,就连在米猴岛也只有学问高深的大口唾们才看得懂的著作,十分地了不起。对这些,麻雀个个望而生畏,佩服莫名。
自然,猫头鹰们也很高兴麻雀们来求助,使它们的高深学问有机会派上用场。收点顾问费或咨询费当然在所难免了,不过麻雀们花这点小钱,倒是心甘情愿的——猫头鹰们许诺,可以指导它们在股市上获得数十倍甚至数百倍的回报。猫头鹰讲了许多米猴岛大口唾们如何在股市上神机妙算、大展身手的事迹,都是麻雀们前所未闻的奇闻,听得它们血脉棼张,目瞪口呆。许多猫头鹰还指出,它们与米猴岛的某个或某些大口唾很有私交,曾经共喝过同一个自来水管子里的水。
一时间,鸟岛上每一个猫头鹰都成了大口唾,背后都跟着一大拨儿雀儿,每个雀儿都坚信自己选定的顾问不仅是国内顶尖,而且是国际一流。
开牌的日子快到了。曾经信誓旦旦的猫头鹰大口唾顾问们,发现自己仍然不知道怎么去猜股市翻牌的结果。不过牛皮已经吹了,顾问已经当了,咨询费已经收了,总没有临场退缩的道理,何况也不能显得自己太没学问。于是,在开牌的头天晚上,它们悄悄儿躲进书房扔硬币。如果正面朝上,就告诉信徒们出买牌,否则出卖牌。麻雀们对各自猫头鹰顾问信之不疑,当然照做不误。
开牌之后有人欢喜有人愁。赢了的麻雀自然欢欣鼓舞,觉得咨询费没有白交。输了的呢,发现猫头鹰也不是个个都有真才实学,只好埋怨自己跟错了鸟,赶紧换一个猫头鹰做顾问。如此几轮下来,每次都淘汰一批猫头鹰顾问。雀儿们从经验中发现,有些猫头鹰的预测次次都对,确有过鸟的才华;有些则很普通,没什么了不起,甚至还不如麻雀自己猜对的次数多。
有一个叫“学问”的麻雀,它的顾问是一个名叫“瞎撞”的猫头鹰,已经连续10次做出了准确预测。学问先生在麻雀中也算一只有知识的鸟,年轻时曾修过一点概率统计。它知道,在一个充斥着偶然性的世界里,什么都有可能,判定真伪必须联系概率进行,这就要用到假设检验的办法。于是,它决定利用严格的科学的假设检验法,来看看瞎撞先生是否真有鸟所不及的预测才能。
它郑重地温习了一遍概率统计课程,先做出它的零假设:瞎撞先生确实在瞎猜。然后看这个假设能否被推翻。学问先生计算道,根据零假设,瞎撞先生在买和卖两种可能性之间任择其一,猜中一次的概率是1/2,连续10次猜中的概率则是1/2的10次方,即1/1024。它满意地发现,这只是个几率低于1%的极小概率事件,几近于不可能。于是根据概率统计书上的教导,零假设便在千分之一的显著性水平上被推翻。换言之,我们可以在99.9%以上的信心水准上,接受反面的假设:连续10次做出准确预测,不可能是瞎猜的结果!
学问先生的科学检验传开后,麻雀们都相信,现在这些顾问们的预测才能,是已经被实践和科学检验过的、颠扑不破的真理。