“智猪博弈”有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。
“智猪博弈”是一个著名的博弈论模型。
笼子里有两头猪,一头大猪,一头小猪。笼子很长,一头有一个按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。问题是按钮和食槽分置笼子的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
如果大猪先到,大猪呼啦啦吃到9份,小猪只能吃到1份;
如果同时到达,大猪吃到7份,小猪吃到3份;
如果小猪先到,小猪可以吃到4份,而大猪吃到6份。
“智猪博弈”的具体情况如下:
如果两只猪同时按钮,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;
如果大猪按按钮后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;
如果大猪等待,小猪按按钮,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
比较以上数字,我们知道“等待”是小猪的优势策略,“按按钮”是小猪的劣势策略。
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,1份不得;按按钮,得到4份。所以“等待”就变成了大猪的劣势策略(注意,是现在才变成劣势策略)。
因此就得到“智猪博弈”的结局:
小猪将选择“搭便车”的策略,也就是舒舒服服地等在食槽边;而大猪则会不知疲倦地奔忙于按钮和食槽之间。小猪只是坐享其成地等待,每次都是大猪去按按钮,小猪先吃,大猪再赶来吃。
“智猪博弈”有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。
欧佩克的一个重要特点是其成员的生产能力各不相同。沙特阿拉伯的生产能力远远超出其他成员。同属一个同盟的大成员和小成员,他们的作弊激励是不是一样大?
为了简化这个问题,我们只看一个小成员,即科威特。假定在合作的情况下,科威特应该每天生产100万桶石油,沙特阿拉伯则生产400万桶。对于它们两家,作弊意味着每天多生产100万桶。换言之,科威特有两种选择,分别是100万桶和200万桶;沙特阿拉伯则为400万桶和500万桶。基于双方的不同选择,投入市场的总产量可能是500万桶、600万桶或700万桶。
科威特有一个优势策略:作弊,每天生产200万桶。沙特阿拉伯也有一个优势策略:遵守合作协议,每天生产400万桶。沙特阿拉伯一定遵守协议,哪怕科威特作弊也一样。“囚徒困境”就此破解。
为什么会这样?沙特阿拉伯出于纯粹的自利心理,有一个合作的激励。假如它有一个较低生产数量,则市场价格攀升,欧佩克全体成员的边际利润上扬。假如它的产量只占欧佩克总产量一个很小的份额,它自然不会发现,原来向整个联盟提供这种“公共服务”对自己也有好处。不过,假如它的份额很大,那么,上扬的边际利润会有很大一部分落在它手里,因此牺牲一些产量也是值得的。这也是我们选做例子的两个国家的抉择。这个例子描述了走出“囚徒困境”的另一个途径:找出一个大慈善家,让它遵守合作协议,并容忍其他人作弊。
“小猪躺着大猪跑”的现象,是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。
如果改变一下核心指标,笼子里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。
投食仅是原来的一半分量。结果是小猪、大猪都不去按按钮了。因为小猪去按,大猪将会把食物吃完;大猪去按,小猪也会把食物吃完。谁去按按钮,就意味着为对方贡献食物,所以谁也不会有按按钮的动力了。如果目的是想让猪去多按按钮,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。
投食为原来的一倍分量。结果是小猪、大猪都会去按按钮。谁想吃,谁就会去按按钮。反正对方不会一次性把食物吃完。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物),而且因为竞争不强烈,想让猪们去多按按钮的效果并不好。
改变方案三:减量加移位方案。
投食仅当原来的一半分量,但同时将授食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着按按钮。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车的社会资源配置并不是最佳状态。为了使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也就不会有动力了,就像“智猪博弈”减量方案所描述的情形。最好的激励机制设计就是像改变方案三那样,减量加移位的办法,奖励并非人人有份,而是直接针对个人(业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。