现在,假设你是一位决定要结婚的女性,但还没有找到最好的对象,而此时,在你身边的社交圈里有一百个合适的单身男子都有意要追求你,现在你要从他们当中挑选最好的一位作为你的结婚对象。怎么做才能得到最好的结果呢?
其中,在这个游戏中有个严格的条件限定,就是每个人你只能约会一次。而且还得当场作出选择是否决定要放弃,如果你一旦选择了其中的一个,也就说明你已经没有机会再约了。其实,这个限制还是有一定道理的,因为在现实生活当中,大多数情况下,机会是不会等人的,在你左挑右选的时候,也许人家早已成为别人的如意郎君了。
也因此,在这个游戏规划中你必须遵守,约会之后你一旦决定要淘汰这个人,也就意味着他就永远出局了。那么,怎样才能在既定的规则下,找到概率最大化的理想对象呢?
对于这个问题,最好的选择方式到底存不存在呢?答案是肯定的。虽然不是百分之百中意,但是绝对可以增加成功的概率,因为这和买彩票不一样,买彩票无论你花费多少心思,其结果都取决于运气。而在这个游戏中,只要你策略得当,就能得到不错的结果。
首先赢的策略就是能够给你最大成功机会的策略。很显然,你不应该选择第一个遇到的人,因为他在一百个人当中名列第一的机会只有百分之一,这个概率可以说是非常的渺茫的。因为在现实生活中,早早结束约会生涯,仓促地走进婚姻,匆匆结婚因此而终生悔恨的也大有人在。所以,直接把筹码压在第一个人身上,显然是最糟糕的赌注。不过,话又说回来了,如果你等得太久,让最好的那个人从指间溜走,要补救也来不及了。再则,假如你约会的第一个人碰巧就是最好的那个,怎么办?如果淘汰掉了,以后约会的对象一个不如一个,岂不是抱憾终生吗?但命运或缘分在人的生命里毕竟是微乎其微。因此,只要你不十分迷信就会承认,与其把未来交给偶然的概率,还不如掌握在自己的手里。
所以,对于第一次约会,就算碰到的这个人真的很优秀,你也要忍痛割爱。因为你不知道在这一百人当中。他到底处在什么位置。
一个最有效的方法就是:将前面的一组人作为试验对象。之后如果遇到比这组人更好的对象。你就可以考虑嫁给他了。而你要做的就是在前面一组人当中获取经验,作为评估下面一些人的基础。那么,取多少人作为实验对象才算合适呢?
这是一个很难的选择。因为如果实验对象太少。得出的结论可能不会很准确;可是如果取得太多,结论虽然准确了,可是也会因此错失最佳的选择机会,因为错失的机会像说过的话、泼出去的水、虚度的年华一样,永远回不来了。那么,有没有一个最佳的对象数存在呢?如果有到底是多少呢?
从下面这个故事就可以找到答案,苏格拉底的三个弟子曾向他求教怎样才能找到最理想的伴侣。于是苏格拉底把他的三个弟子带到了一块麦田里,要求他们沿着田埂直线前进,不准后退,而且只有一次机会选摘一枝最大的麦穗。
第一个弟子在走了没几步的时候。看见了一枝又大又漂亮的麦穗,高兴地摘了下来,但是他再继续往前走时,发现前面有许多比他摘的那枝更大的麦穗,于是,他只得遗憾地走完了全程;第二个弟子吸取了第一个弟子的教训。每当他要摘时。总是提醒自己。后面还有更好的。当他快到终点时才发现。机会全错过了。
于是,他只好将就着摘了一个;第三个弟子吸取了前两位的教训,当他走到三分之一的时候,即分出了大、中、小三类。再走三分之一时验证是否正确。等到再走到最后三分之一时。他选择了属于大类中的一枝美丽的麦穗,虽说这不一定是最大最美的那一枝,但他满意地走完了全程一一因为他知道,自己已经尽可能争取到最好的结果了。
为什么得出最好结果的弟子的策略其比例是三分之一呢?
其答案是很明显的,因为在冷静地比较若干样本后,选择下一个高于他们全体的那一个所失去的最佳选择的风险仅约1/3。但是它已经是你竭尽所能的了,而且在这同时你还有大约1/3的机会在一百个当中挑中最想要的那一个。其实当你在一百个人当中挑选时,有1/3的机会已算是不错了的。
其实,在现实中,无论是选择爱情、工作还是人生的道路,“正确答案”只是在理论上存在的一种形式,与其在这上面纠缠不清,还不如通过理性的态度,选择适合自己的策略,争取到一个较好的结果。
(第三节)均衡理论
均衡博弈理论是一个叫做纳什的大学生发现的,可以说它的出现影响了全世界,被认为是成为现代经济学内容的一个里程碑式的标志。在纳什均衡中,你不一定满意其他人的策略,而其他人也不一定满意你的策略,但是你们却针对对方确定了最佳的策略。谁也不会为了谁去改变自己的策略,谁也不会为自己的选择而后悔。
从“囚徒困境”中我们会发现,作为博弈双方所选择的结果,都是针对对方选择的最佳策略。在他们没有串供的情况下,所作出的只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手利益的事情。也就是说,这种策略组合由所有局中人的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大的利益。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。也就是他们两人都是在坦白与抵赖策略上首先想到的是自己,而结果就必然导致他们要服长期的徒刑。事实上,要想得到集体理性的最优策略。就是首先替对方着想或者相互串供,这样才能得到对于个人和集体来说都是最好的策略。
诺贝尔经济学奖获得者萨缪尔森曾说过一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:
供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。
1950年和1951年,纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即着名的“纳什均衡”。
从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,而后来的博弈论研究基本上都在沿着他这条主线在展开的。
事实上。均衡理论是一种非合作下,双方所选的都是对自己最有利的策略,它是一种稳定的博弈结果。正是因为它的稳定,因而其结果是可以预测的。博弈结果有可能有两个均衡点,但也有可能没有纳什均衡点,而存在着混合策略均衡点。
如下述“夫妻博弈”中就有两个纳什均衡点。丈夫杰克和妻子爱菲丝商量晚上看什么节目。丈夫喜欢看拳击比赛,而妻子喜欢看电视连续剧。但又都希望两人能在一起度过夜晚。在这个时候。“夫妻博弈”中就出现了两个“纳什均衡”点:(电视剧,电视剧)。(拳击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道最终结果是一同看了电视剧还是一起看了拳击比赛。
前面我们已经说过,有的博弈结果有可能没有纳什均衡点而存在着混合策略均衡点,事实上,所谓的纯策略均衡点是指参与者在他的策略空间中选取唯一确定的策略。但至少存在一个混合策略均衡点——所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的一种概率分布。
在《三国演义》中曹操和诸葛亮的华容道博弈就是这样的一个博弈例子。
曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:
大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?
曹操说:岂不闻兵书有云:“实则虚之,虚则实之。”诸葛亮多谋,故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等着。吾已料定,偏不教中他计。诸将皆说:丞相妙算,人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”
的捉放曹操的义举。逃过华容道大难,但曹操人马也只剩二十七骑!
在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是在走华容道还是走大路之间进行选择:而诸葛亮派关羽埋伏时,要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。
华容道博弈——曹操:选择华容道(被捉,逃脱);选择大路(被捉,逃脱)诸葛亮:选择华容道(捉住曹操,白等);选择大路(捉住曹操,白等)这个博弈如同猜硬币的游戏一样,是一“零和博弈”。所谓“零和博弈”是指双方的得益之和为一常数零,一方所得增加,另一方所得便减少。而“变和博弈”是指博弈双方的所得之和为一变数,它没有纳什均衡点。双方对各种策略下的博弈支付是知道的——大路和华容道。但双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他想要的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的道路上。
诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。
这里关键是谁能真正猜到对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。
由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选策略中随机选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。
在日常生活中,许多事实也都证明了这一点。比如在博弈中,“每个参与者是理性的”,这是每个人都知道的。为什么?因为这是博弈前提——当然也是我们的假定。在具体博弈中,参与者知道对方是理性的,同时也知道自己是理性的。
对博弈来说,“参与者是理性的”是起码的要求。对于像“囚徒困境”这样的博弈,双方的不同策略下的支付也是双方共知的;曹操和诸葛亮在华容道上的博弈,双方的策略下的支付也正是双方共知的。
上述分析有些抽象,读起来令人乏味,现在让我们宋举个具体的例子来说明这一点,并且可以用它来分析身边的社会现象。
有一群人围坐在一起,为了便于分析,假定只有4人,不过,人更多一些也可以。现在,他们每个人头上都戴着一顶帽子,帽子为黄色和蓝色两种,他们每个人都看不到自己帽子的颜色,但能看到别人帽子的颜色。因此,此时他们不能判定出自己头上的帽子的颜色。
为了分析的方便,我们假定这4个人戴的均是黄色的帽子。
这时候,一个人来到他们的群体当中,对他们说:“你们其中至少一位头上戴的是黄色的帽子。”当他说了这句话后,他问:“你们知道你们头上的帽子的颜色吗?”4个人都说“不知道”。这个人第二次问:“你们知道你们头上的帽子的颜色吗?”4个人又都说“不知道”。这个人第三次问:“你们知道你们头上的帽子的颜色吗?”4个人又说“不知道”。这个人接着又问第四次:“你们知道你们头上的帽子的颜色吗?”这时4个人均说:“知道了!”
你能知道为什么吗?
当这个人未宣布“至少一个人戴的是黄帽子”时,这个事实其实每个人都知道了,因为每个人看到其他3个人的帽子都是黄色的。但每个人不知道其他人是否知道这个事实,即这个事实没有成为大家都知道的事实。而当这个人宣布了之后,“至少一个人的帽子是黄色的”便成了大家都知的事实。此时不仅每个人知道“至少一个人的帽子是黄色的”,每个人还知道其他人知道他知道这个事实……这个人第一次问时,由于每个人面对的其他3个人都是黄色的帽子,每个人当然不能肯定自己头上的帽子是什么颜色,于是均回答说“不知道”。此时,如果只有1个人戴黄色的帽子,那么这个人因面对3个戴蓝色的帽子,他肯定知道自己的帽子颜色。
因此,当4个人均回答“不知道”时意味着“至少有2人戴的是黄色的帽子”,而且这也是每个人都知道的。
当这个人第二次问时,如果只有2人戴的是黄色的帽子,这2人就会回答说“知道”——因为他们各自面对的是1个戴黄色帽子的人。由于每个人面对的是不止一个戴黄色帽子的人,因此当这个人第二次问时,他们只能回答“不知道”。——此时的“不知道”,意味着“至少3个人戴黄色的帽子”,并且它是每个人都知道的事实。
同样,这个人第三次问时,他们均回答“不知道”,意味着4个人均戴的是黄色的帽子。因此,当这个人第四次问时,他们就知道每个人头上均戴的是黄色的帽子,于是,他们回答说“知道”。
在这个过程中。当这个人首先宣布“其中至少一个人的帽子是黄色的”,以及第二、第三、第四次回答的时候,无论是回答“知道”还是“不知道”——它们构成了所有人推理的前提,实际上,在这个过程中,每个人均在推理。
对于博弈来说,肯定存在着某些大家共知的东西,而均衡的产生也正是依赖于这些共知的条件,只不过不同博弈的共知条件是不相同的。
但是,在博弈中,大家共知的不是参与者知道的唯一的内容,这也就是说。对参与者来说,存在着只有自己知道而别人不知道的内容。即:有些事实是藏在人的心里的。
这里有两种情况:一是有些事实,博弈双方知道,但不知道对方知道不知道,当然也不知道对方是否知道自己知道不知道。
这时也形成了均衡。第二种情况是,有些事实是博弈的一方知道的,而另外一方不知道,即一方拥有的事实多一些,而另外一方拥有的事实少一些。
生活的“纳什均衡”