在现代企业中,由于所有权和经营权的完全分离,企业薪酬诸利益主体之间的关系实质就是委托—代理关系,对这种关系的博弈分析有利于进一步研究战略性薪酬的内在作用机制。
4.1.1 博弈假设
1.非对称信息假设
委托人和代理人的目标冲突与信息不对称是委托—代理问题的关键。在非对称信息情况下,具有信息优势的一方为代理人,另一方为委托人。在代理人利益与委托人的利益不一致的情况下,代理人可能把委托人的利益放在次要位置甚至以牺牲委托人的利益为代价去追求个人利益。阿克洛夫指出信息的不对称带来两种问题:隐藏信息导致逆向选择,使有效率的交易难以达成;隐藏行动带来道德风险,行动不容易被观察到的人,在追求自我利益时,会不负责任地损害他人利益。他认为,对信息不对称所带来的逆向选择和道德风险,可以通过建立起激励机制和信号传递机制的办法加以解决。詹姆斯·莫里斯指出,委托人在最优化其期望效用函数时,必须面对来自代理人的两个约束,即参与约束和激励相容约束。
2.有限理性假设
经典决策理论赋予理性“完美的”假定,但这一假定越来越受到许多经济学家和社会心理学家的挑战。有限理性的概念是阿罗提出的,他认为有限理性就是人的行为“即是有意识地理性着,但这种理性又是有限的”。在诺思看来,人的有限性包括两个方面的含义:一是环境是复杂的,在非个人交换形式中,人们面临的是一个复杂的、不确定的世界,而且交易越多,不确定性就越大,信息也就越不完全;二是人对环境的计算能力和认识能力是有限的,人不可能无所不知。西蒙从心理学角度出发,论证了人类行为的理性是在给定环境限度内的理性,有限理性是由人的心理机制决定的;人们在决策过程中寻找的并非是“最大”或“最优”的标准而只是“满意”的标准。在做均衡分析时,经典博弈理论假设参与人是完全理性的,每个参与人对博弈的结构及对方的支付有完全的了解。有理性局限的行为主体(博弈问题中的博弈方)称为“有限理性”的博弈方;有限理性首先意味着博弈方往往不能或不会采用完全理性条件下的最优策略,意味着博弈方之间的策略均衡往往是学习调整的结果,而不是一次性选择的结果,而且即使达到了均衡也可能再次偏离。
3.机会主义假设
新制度经济学关于人的行为假定如下:(1)人类行为动机是双重的,一方面追求财富最大化,另一方面又追求非财富的最大化。(2)由于环境的不确定性和信息的不完全性以及人的认识有限性,人的理性是有限的,即有限理性。(3)人的机会主义倾向,即人对自我利益的考虑和追求。人具有随机应变、投机取巧、为自己谋取更大利益的行为倾向。机会主义倾向假设以有限理性假设为前提;处于有利信息条件下的一方就有可能向对方说谎、欺骗或要挟;有目的、有策略地利用信息,按个人目标对信息加以筛选和扭曲,并会违背对未来的承诺。机会主义实际上是对追求自身利益最大化的经济人假设的补充,机会主义动机是经济人人格中的必然内容。机会主义倾向可分为事前机会主义和事后机会主义,道德风险是事后的机会主义;事前机会主义行为又被称为“逆选择”。
4.1.2 博弈模型
在现代企业中,股东、经营者和员工由于利益目标不一致而产生冲突。股东希望实现企业市场价值最大化,从而获得更多的投资回报和剩余收入;经理人和员工追求自身人力资本的增值和自身的利益最大化。委托人必须制定适当的薪酬激励措施来促使经营者和员工按其所期望的目标行动,使三者的目标趋于一致。
1.股东与经理人之间的博弈分析
在此博弈模型中,股东和经理人是局中人(PLAYER),其中股东(投资者)的纯策略是激励和不激励。经理人的纯策略是努力和不努力,由此建立的支付矩阵。
在此博弈矩阵中,存在着两个纳什均衡:(努力,激励)和(不努力,不激励),即合作与不合作都是纳什均衡。但通过逆向归纳法分析可知,只要当W(E)-C(E)>0和R(E)-W(E)>0时,才能达到唯一的纳什均衡:(努力,激励),即合作的状态;而在其他情况下的均衡只能是(不努力,不激励),即双方达成的不合作的状态。
假设委托人股东先选择行动(激励或不激励),再由经营者根据委托人的动向选择自己的行动(努力或不努力)。若委托人选择(不激励),则代理人根据委托人的这一选择必然最有利于自己的支付,即选择(不努力),从而双方的支付函数为(R1,W1)。所以当委托人选择不激励,其支付函数必然为R1,因为R(E)-W(E)>0,所以,R1 <R1 +R(E)-W(E)。同理,若委托人选择激励,那么其支付函数为R1 +R(E)-W(E)。
所有的支付函数都是双方的共同知识,委托代理双方都知道双方是理性的。委托人在采取行动时能预测代理人将会采取的下一步行动是什么,即能预知其行动能带来的支付函数。所以委托人只会选择对自己最有利的行动,即采取(激励)。
反之,代理人也知道全部的支付函数,通过逆向分析,也能预知委托人必将采取(激励)。所以在此情形下,代理人的最优选择是努力。因此,在委托人先行动的博弈树中,只要R(E)-W(E)>0.就会形成(激励,努力)均衡。同理可证:在由代理人先行动的博弈树中,只要W(E)-C(E)>0,最终会形成(激励,努力)的纳什均衡,即投资者和经营者达到一个双方共赢的理想结果。
然而,即使投资者采取了激励措施,但激励机制若只与企业短期收益相关,就会导致经营者为了追求短期奖励而产生短视行为,不注重企业核心竞争力和长远发展,大力投资那些“短、平、快”的项目,造成了企业的发展后劲不足。股票期权激励计划较好地解决了这一难题。期权激励作为一种激励方式能够有效地促进博弈合作的机理在于:(1)可以提高代理人对企业利益的关注程度。通过期权激励将委托人和代理人连成一个利益共同体。(2)使代理人产生机会成本。实行期权激励后,代理人因企业业绩上升而获得额外利益,也会因不努力或经营不善等导致公司业绩下降而损失预期的额外收益。(3)实行期权激励使得委托人—代理人之间的两人博弈退化成单人博弈,即代理人和自己博弈。博弈支付矩阵。
从单人激励—努力支付矩阵中可以看出,经理人会选择的策略是努力,而获取未来的额外收益。
2.经理与员工之间的博弈分析
对于经理与员工之间的博弈分析,采用了单阶段和多阶段博弈分析的方法。
先作如下假设:
假设1:模型中有两个局中人,即经理和员工。
假设2:经理人的纯策略选择是激励和不激励,员工的纯策略的选择是努力和不努力。
假设3:员工的努力程度与企业绩效成正相关,即员工投入的努力越多,企业绩效就越高。
其中员工效用的最大化目标函数为:
MAX U(E)=W1 +W2 -U·E(1)
经理人的利益就是企业的利益,其目标为:
MAX π(E)=R1 +R(E)-W1 -W2(2)
其中,U(E)表示员工的效用;U表示员工所付出努力所花费成本的系数;U·E表示员工总的努力成本;W1表示员工的固定收益;W2表示因努力增加的额外收益;R1表示企业固定收益;R(E)表示企业因员工的努力而额外增加的收益。先进行单阶段博弈分析,从(1)式中可以看出,该式是关于E的一次线性方程。员工要获得最大效用,只需E=0,即员工采取不努力的策略,因此,员工在单阶段激励博弈中不会努力。基于员工采取不努力的策略,不管经理人的策略是激励还是不激励,都不会影响员工的策略选择。由(2)可知,R(E)=0,所以只需W2越小,π(E)就越大,因此经理人选择的策略为不激励,最终达到的均衡为(不努力,不激励)。构造类似于“囚徒困境”经理和员工博弈双方的支付矩阵。
双方的战略锁定为(不努力,不激励),这是一个不合作的纳什均衡,使员工和经理人都不能达到效用最大化。
在多阶段博弈模型中,博弈双方意识到,采取不合作的态度对双方短期有利而长远不利。在以后的策略选择中,博弈双方考虑的不再只是一个阶段中的利弊,会更注重长远利益的获取。可以证明,只要博弈双方有足够的耐心,(努力,激励)将是他们最终的博弈结果。
在多阶段博弈模型中,双方将进行多次博弈。因此可以把多阶段博弈看做无限博弈。假定每个阶段博弈结构相同,因此可以看做是无限次的重复博弈。将博弈双方的总收益转化为现值来考虑。令δ为贴现因子(双方均相同)。假如员工在某一阶段首先选择不努力策略,则他在该阶段得到6单位收益;但员工这一行动将触发经营者永远采取“不激励”措施。因此员工在以后各阶段中都只得到2单位的收益。若满足下列条件,给定经营者选择激励,则员工不会选择不努力工作。
6+2δ+2δ2 +2δ3 +…≤5+5δ+5δ2 +5δ3 +…
(1-4δ)/(1-δ)≤0
解得:1/4≤δ*<1
其中,贴现因子δ=1/(1+R)(银行利率0<R<1)由于利息总是小于1,所以贴现因子δ的取值范围应在1/2 <δ<1之间,1/2<δ<1包含在区域1/4≤δ*<1之内。在贴现因子δ的取值范围内,员工不会选择不努力策略。
在多阶段博弈中,经理人和员工之间采用的最优策略是(努力,激励),这种结果是帕累托最优,博弈双方彼此合作实现双赢。
4.1.3 博弈结论
委托—代理理论的核心是设计一种合理的激励机制,给代理人提供各种激励和动力,使代理人能按照委托人的预期目标努力工作,使委托人与代理人在相互博弈的过程中实现“双赢”的格局。
在不完全竞争市场中,由于信息不对称会导致机会主义行动,使追求个人利益最大化的员工和经营者利用其信息优势“隐蔽行动”和“隐蔽信息”,并在利己心的支配下,牺牲企业和股东的利益来增进自身的利益,结果导致冲突和效率低下。就个体而言,单方采取合作行动是不理性的,这违反了个体的“经济人”假设,所以从逻辑上看,在一次合作中难以产生合作行为。从“囚徒困境”博弈的实际结果看,背叛是占优策略,不管对手如何应对,背叛策略是单方最优的,选择背叛总能比选择合作有较高的收益。如果说一次“囚徒困境”博弈表现出的是个体理性导向了集体非理性,那么重复博弈就使个体变得聪明起来,选择导向“集体理性”的合作;艾克斯罗德认为在有限重复“囚徒困境”博弈中不能产生合作解,但KMRW定理证明了只要重复博弈的次数足够多,参加者有足够的耐心,即使(有关参加者类型的)很小的不确定性可能引起均衡结果的重大改变(很小的P就可以保证合作均衡的出现)。
合作是人类的基本存在方式之一,是经济发展和社会进步的根本条件之一;合作的价值在于可以实现收益的创造,从而产生“合作剩余”。合作可以实现生产力的创造,这不是各个要素功能的简单相加,是众多资本聚合而产生一种倍增效应。
在单阶段博弈模型中,博弈双方都过分的关注个人的利益选择,结果导致了对各方均不利的结局,最终会将各自的战略锁定为(不激励,不努力),这是一个纳什均衡,使得无论是股东,还是经营者或是员工都不可能达到效用的最大化。在多阶段激励博弈模型中,博弈双方更关注博弈过程的合作和连续性;博弈双方彼此通过合作,实现双赢,走出了一次性博弈的困境。