博弈可以说是无处不在的,人们的工作和生活就是一个不断决策的博弈过程。我们每天都必须做出各种各样的决策,在这些决策中,存在一个共同的因素,那就是我们并不是一个人在一个毫无干扰的真空世界里作决定,我们的身边充满了同样的决策者,他们的选择与我们的选择相互作用,选择的结果也相互影响。了解博弈思想和博弈策略,能够让我们更客观地审视自己的得与失,在正确的时间里作出正确的选择。
博弈就是策略制胜的游戏
著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”其实,所谓“博弈”就是指可以分出胜负的游戏,也就是双方或多方在竞局中为争夺利益所采取的策略。
迪克西特和奈尔伯夫在《策略思维》一书中,讲述了这样一个有趣的故事:
有两个大学生选修了一位博弈论教授的课程。这两个学生平时的成绩很好,总是得“A”。转眼到了期末,考试前一个周末正是紧张复习的时候,这两个学生却到外地去参加另一所大学举行的舞会。他们本打算周日早晨一早就赶回学校,这样就可以利用周日下午的时间来准备第二天的考试。但是,由于玩得太尽兴,结果周日那天他们睡过了头。当他们匆匆返回学校的时候,已经到了晚上,所以肯定来不及准备第二天的考试了。于是他们打电话给教授撒谎说他们赶回学校时乘坐的汽车的轮胎爆了,因此一直被耽误在路上没有时间复习功课,希望可以获准缓一天参加考试。
对教授而言,如果这两个学生说的是事实,他的确想体谅他们并允许他们缓考。但如果这两个学生仅仅是在撒谎,那么他显然应该拒绝他们不合理的要求,并让他们为自己的行为付出代价。但问题是,教授并不知道这两个学生的缓考理由是真是假,那他该怎么办呢?教授仔细思考后答应了这两个学生的缓考请求。
这两个学生很高兴,他们抓紧当天晚上和第二天上午的时间认真复习,作好了应对考试的一切准备。考试开始以后,他们被分别安排在两个不同的考场里,并很快拿到了试卷。试卷一共有两页,第一页上是一个非常简单的题目,他们轻松地做完了,并暗自庆幸教授还真是照顾自己。等翻到第二页的时候,他们傻眼了——上面只有一道考题,题目是:爆胎的是哪个车轮?
在故事中,这位教授就面临一个难题,即要不要相信学生的话。如果只是出于直觉而不相信学生的话,那么就是对学生的不尊重,但如果相信了学生说的话,但他们其实是在撒谎,那对其他学生来说就是不公平的。而问题的关键在于,教授无法去实地验证学生的话。那教授该怎么办呢?这时,聪明的教授就运用了博弈思维去解决这个问题。他把两个学生分开放在两个不同的考场里,这样他们就无法串供。在这样的情况下,如果两个学生的答案是一致的,就说明他们说的多半是真话,如果他们的答案是不一致的,就说明他们说的多半是谎话。在这个故事中,博弈思维得到了淋漓尽致的运用。
其实,所谓“博弈”就是指可以分出胜负的游戏,也就是双方或多方在竞局中为争夺利益所采取的策略。只要参赛者讲究博弈策略,排阵有方,本来较弱或比较被动的一方就有可能打败较强或比较主动的一方,取得最后的胜利。就像上述故事中处境被动的教授就是通过一个巧妙的计策来验证了学生的话。
博弈可以说是无处不在的,我们的工作和生活就是永不停息的博弈决策过程,小至决定早餐要吃什么,晚上要不要到超市疯狂采购一番,要不要看场电影、散散步、买部车、把菜吃完,或是读哪一本书,大至报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位,甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,不管有意无意,一时冲动还是深思熟虑,你都在进行着做还是不做、怎样去做的选择,而这个过程里就充满着博弈思维。
在这些各不相同的决策中,存在一个共同的因素,那就是你并不是一个人在战斗,更不是在一个毫无干扰的真空世界里战斗。相反,你的身边有很多同样的决策者,他们的选择既被你的选择所影响,也影响着你的选择。就像小说《鲁滨逊漂流记中》鲁滨逊一个人沦落荒岛的时候,做与不做、做什么都是他自己说了算;可是“星期五”(鲁滨逊的仆人)出现了以后,他就要面对博弈问题了。
博弈论是由20世纪中期的两位杰出的学者——冯·诺伊曼和摩根斯坦创立的。从专业的角度来说,博弈论就是“研究决策主体的行为在直接相互作用时,人们如何进行决策以及这种决策如何达到均衡的问题”。
为了解释和理解不同主体之间博弈决策的相互影响,我们不妨设想一下石匠作决策和拳击手作决策时所参考因素的差异是什么。石匠在开凿石头的时候,他的“对象”常常是被动的,没有什么思维能力,不会对他采取合作或对抗策略。然而,拳击手在攻击对方要害的时候,他的每一步计划都会招致对方的抵抗,而且他还会被对方主动地攻击,他必须设法消除或战胜这些抵抗和攻击。
所以,在人与人的博弈中,你必须意识到,你的博弈对象都是聪明而有主见的人,他们关心自己的利益,而不会被动挨打。他们既会有与你的目标发生冲突的可能,也会有与你合作的可能。在你作决定的时候,你应该首先设法消除他们的对抗意识,然后积极与对方进行不同程度的合作,以使双方都能从这种合作中得到最大的利益。
为了能够作出更有利于自身的选择,也为了能够与他人更好地合作,你需要学习一点博弈论的策略思维。正是因为如此,著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”
黯跷跷板上的你和我:纳什均衡
所谓纳什均衡,就是指在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他单独改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
要解释纳什均衡,就要从2001年拍摄出品的一部名叫《美丽心灵》的电影说起。《美丽心灵》是由美国环球公司拍摄的一部家喻户晓的电影,该片一共获得了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心。《美丽心灵》艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症30多年又奇迹般恢复正常的约翰·纳什的传奇般的人生经历。
纳什是一位非常了不起的数学家,他于1950年至1951年在普林斯顿读博士学位时作出了巨大的贡献,他的天才发现——非合作博弈的均衡便是其中之一。
1950年和1951年纳什发表了两篇关于非合作博弈论的重要论文,从此彻底改变了人们对竞争和市场的看法。在这两篇论文中,纳什证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡,从而揭示了博弈均衡与经济均衡的内在联系。
那么究竟什么是“纳什均衡”呢?
所谓纳什均衡是指一个不会令人后悔的结果,无论其他人采取什么策略,博弈各方对于自己的策略都很满意。即使在对抗的条件下,双方也可以通过向对方提出威胁和要求,找到双方都能够接受的解决方案而不至于因为各自追求自我利益而无法达成妥协,甚至两败俱伤。更重要的是,在纳什均衡中,无论对方作何选择,每一个参与者所选择的策略始终应优于其他策略。在纳什均衡中,博弈参与者不一定满意其他人的策略,但他们的策略却是应对对手策略的最优策略。纳什均衡中的参与者彼此之间绝不会合作,因为他们认定了自己无法改变对手的行动。围棋就是一个极好的例子。
从博弈的角度来看,围棋初段与九段的差别只是棋手选择策略的技巧水平高低有所不同而已。比如棋手过分的“骗招”、“本手”与“缓招”之间,一般都会选“本手”。由于招法过分如不遇反击,棋手可能占到便宜,但如果遇到反击则可能亏损,因此如果双方的棋力相当,棋手会考虑到对手的反击手段。当然,对手也会考虑到这些因素。在这种情况下,选择“本手”就是双方都能接受的方案。如果一方抢占实地,另一方获得外势,而结果相当,互有所得,双方就愿意继续这样做。抢占实地获得现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也用同样法则找到应对,则可以说双方达成“均衡”。如果其中任何一方都只想独霸所有利益,那么该博弈就无法进行下去,双方也就无法从中获得自己想要的乐趣。
从这个分析的过程中,我们也可以引申出纳什均衡中的这样一个悖论:从利己目的出发结果损人不利己。从这个意义上说,纳什均衡还告诉我们这样一条真理:合作是有利的“利己策略”。但博弈各方要达成合作,就必须符合以下黄金律:如果你想让别人怎样对你,你就要先这样对别人,但前提条件是他们也按同样方式行事。一旦有人单独改变策略,那么他将不会得到好处。
小吴与女友正在热恋之中,可是有一天他们因为一件小事闹得不太开心。这是因为北京时间2008年6月30日晚上,第13届欧洲杯足球决赛将在维也纳恩斯特·哈佩尔球场进行。小吴是个超级球迷,他连国内的甲级联赛都不肯放过,更何况是这样四年一届的精彩赛事呢?恰好这天晚上,女友的妹妹要来,女友准备去火车站接站,她不放心让她妹妹独自来访。问题在于,小吴和女友正处于热恋之中,整天如胶似漆,让他们“各自为政”、分别去做自己的事情是他们都不愿意得到的结果。如此一来,他们就面临一场笼罩在温情下的“博弈”。在情侣博弈中,双方都没有严格优势策略和严格劣势策略。
我们不妨这样给小吴和女友的“满意程度”赋值:如果小吴在家看球而女友一个人去接妹妹,双方的满意程度都为“0”;如果两人一起去看足球,小吴的满意程度为“2”,女友的满意程度为“1”;如果两人一起去接妹妹,小吴的满意程度为“1”,女友的满意程度为“2”。现在我们就会发现,如果女友坚持去接妹妹,小吴也一起去的话,他还可得“1”,但如果他选足球的话却只能得“0”,可见接妹妹不是小吴的劣势选择,而选足球也不是小吴的劣势策略。所以,小吴没有严格的劣势策略。同样,女友也没有严格的劣势策略。这样,此时的严格劣势策略消去法就毫无用处。但是,作为一对热恋中的情侣,他们总会作出一个较好的选择。在这样的情况下,事实上他们的最佳选择就是都去看足球或者都去接妹妹,而这种选择恰恰就是相对优势策略的组合:一旦处于这样的位置,双方都不会想单独改变策略,因为单独改变没有额外的好处。比如,如果小吴单独去看足球,收益为“0”,显然是没有好处的;如果女友单独去接妹妹,她也没有好处。所以,两人一起去看足球或是接妹妹都是合理的结局。
这个生活化的例子可以更直白浅显地把纳什均衡讲清楚。从这个例子出发,我们也可以将纳什均衡做如下定义——在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他单独改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
当然,如果在博弈中有两个或两个以上的纳什均衡点,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。
生活中的简单案例能说明深刻的道理。在我们普通的生活中大量存在着充满博弈思维的事情,当遇到存在两个或两个以上纳什均衡点的博弈局势时,如果你是个有心人,懂得运用博弈思维去分析的话,那么局面对于你就不会是进退两难了。
黑猫与白猫:博弈的竞争本质
无论怎样分类,无论是什么博弈,其直接目的都是为了竞争,其次才是在竞争的基础上寻求共同点,以获得最大的利益。
博弈在不同的状态下有不同的表现形式,我们可以简单地看一下博弈的不同分类法。
一般来说,博弈可以分为合作博弈与非合作博弈。它们之间的区别主要在于相互发生作用的当事人之间有没有一个具有约束力的协议。如果博弈参与者在行动时从自身的利益出发能与其他参与者达成某种有约束力的契约或默契,以选择共同的策略,那么这种博弈就是合作博弈。如果参与者彼此之间无法达成有约束力的协议,那么这种博弈就是非合作博弈。比如,企业之间联合定价的行为就属于合作博弈,而挑起价格战的行为便是非合作博弈。
合作博弈与非合作博弈之间并不是完全不相容的,合作博弈中往往包含着非合作博弈的因素,如石油输出国组织(OPEC)的建立就是合作博弈的产物,但各参与者之间为了保护各自利益而做出的超产和争吵行为又属于非合作博弈。
非合作博弈研究人们在利益相互影响的局势中如何选择策略以使自己的利益达到最大化。比如,A、B两家企业合作建设一条汽车的生产线,协议由A方提供生产汽车的技术,B方提供厂房和设备。在对技术和设备进行资产评估时就会形成非合作博弈,因为每一方都试图最大化己方的评估值。这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,就可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响到合作企业的总体运行效益这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。
目前经济学家所说的博弈论一般是非合作博弈,由于相对比较简单,它的成熟度要比合作博弈高。
按照双方在博弈中的收益,博弈可以分为零和博弈与非零和博弈。所谓零和博弈就是指所有博弈方的得益总和为零的博弈,赌博就属于零和博弈。例如三个人参加一场赌博,其中两个人总共输了2000元,那么另外一个人必然赢了2000元。期货交易市场上的参与者之间的关系也是零和博弈。人们平常所说的“损人利己”实际上也包含零和博弈的意思。
非零和博弈是指博弈双方得益总和不为零的博弈,这种博弈方式又可分为正和博弈和负和博弈。