进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的 纳什均衡概念来解释。然而,博弈论是研究 完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中 理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。
进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的 人类行为显然是行不通的。但随着心理学研究的发展及 有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的 基本分析框架作出相应的调整。如果去掉参与人 偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理 有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。
1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念---- 进化稳定策略(Evolutionarily stable stragegy ESS),如今学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。
1980年代以后,随着 新古典经济学及博弈论固有的缺陷逐渐被人们所认识, 有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。如今,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为 主流经济学的一部分已经为时不远。
进化博弈理论结合经典博弈理论及生态理论研究成果,并以 有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。
进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。
能在多大程度上解决经济和其他社会科学中的实际问题是度量进化博弈理论价值的唯一依据。到目前为止,尽管进化博弈理论还没有形成学术界一致认可的理论体系,其基本框架仍然处于数理研究阶段,但它提供了一种全新的分析问题的方法,国外许多经济学者纷纷应用该理论来分析诸如社会制度形成、行业发展趋势、社会习俗演化等现象,获得了极大的成功。下面略举几例简单地介绍该理论在经济学领域的应用。
Conlisk (1980)
利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。他假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率。他的主要结论是:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优者在群体中最优化者所占比例并不渐近地收敛于1。这个结论与传统理论的理性人结论显然不一致,即进化选择的结果并不会使所有人都会进行理性选择。
Crawford(1989)
考察了一个对某一公益事业进行捐助的实验,在该实验中要求每个对象选择捐最小数量还是适度数量款。他应用适应性随机动态进化博弈理论模型得出的结论能够很好解释实验中所观察的数据,这篇文章同时表明实验可以作为发现特定进化动态模型的一个有力武器。
Peyton Young(1998a)
把进化博弈理论应用于分析社会习俗、传统、规范等的演化及传统合约的形成原因。他认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。在作出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期演化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Peyton Young利用进化博弈理论分析了社会规范的形成与社会福利的关系。他通过一个简单的左行右行的例子,说明习俗的形成是为了减少不确定性及由此带来的交易成本。
Jones(1976)和Cowen and Kroszner(1987)
利用进化博弈理论研究了在自由竞争易货贸易经济中,存在交易成本时交易媒介是如何进行选择。他们把个人愿意接受不想最终持有某物品的行为看作一个纯策略,认为单个交易媒介存在的实质就是寻求系统的角点均衡而不是内点均衡;
Weitzman(1984)
在行业组织方面的应用,如Weitzman(1984) 利用进化博弈理论分析股份制经济。他认为,如果企业职工都不愿意稀释所有者权益,那么企业实行职工持股的管理方式是动态稳定的;在经济体制分析方面的应用,
青木昌彦(1996)
等利用进化博弈理论来分析社会经济体制的变迁,他们认为任何一种经济体制的产生都具有一定的惯性并随经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化,即经济体制的进化是路径依赖的结果。