莱因哈德·塞尔滕:理性和人类行为的先驱分析家

本尼·莫尔多瓦努,阿克塞尔·奥肯菲尔斯2016年9月14日

莱因哈德·塞尔滕1930年出生于德国布雷斯劳(现波兰弗罗茨瓦夫)。他的父亲是犹太人,在20世纪30年代中期,也就是他父亲去世前不久,这个小型家族企业不得不被出售。塞尔滕和他的家人在二战结束时成为难民,在西德定居。他在法兰克福大学学习数学,并于1957年获得硕士学位,1961年获得博士学位。

在伯克利担任访问教授后——在那里他开始了与约翰·哈萨尼的长期合作——塞尔滕回到了德国。1969年至1972年(学生抗议相当混乱的那几年),他是柏林自由大学的教授;1972年至1984年,他在比勒费尔德大学学习。从1984年到2016年去世,他一直与波恩大学(University of Bonn)有联系,在那里他建立了第一批经济学实验实验室之一。

1994年,塞尔滕与约翰·哈萨尼(John Harsanyi)和约翰·纳什(John Nash)一起被授予诺贝尔经济学奖,“因为他们对非合作博弈理论的均衡进行了开创性的分析”(诺贝尔基金会1994年)。

博弈理论

博弈论分析了利益可能冲突的代理人之间的战略互动,假设代理人遵守理性的规范原则。它提供了一种通用的语言和技术来描述广泛的社会现象,并已成功地应用于经济学、政治学、法学、心理学、计算机科学和进化生物学等领域。

虽然第一个正式的博弈论分析起源于法国大革命时期,但第一个重大突破是约翰·冯·诺伊曼(John von Neumann)和Oskar Morgenstern的《博弈论与经济行为》(Theory of博弈论,1944),主要讨论了合作博弈(代理之间可以达成有约束力的协议)和零和两人非合作博弈(不可能达成有约束力的协议,双方的利益完全相反)。

约翰·纳什(1951)将冲突的性质更普遍(非零和)的博弈纳入其中,并将纳什均衡定义为策略的概况——每个参与者都有一种策略——参与者都没有偏离这种策略的动机。举个例子,想想我们在决定开车靠路的时候玩的游戏。

在《博弈论与经济行为》出版约20年后,人们认为冯·诺伊曼、摩根斯特恩和纳什的基本分析同样可以很好地应用于动态博弈,即战略互动会随着时间发生。在这类游戏中,策略要求制定一个完整的计划,为所有可能的未来意外事件建议行动。特别是,玩家必须在未来的意外事件中预测到其他人的理性行为,并为此制定适当的计划。

但是,在其他玩家已经做出了一些“改变游戏规则”的重大决定之后,玩家又该如何在以后的时间点执行自己的未来行动呢?塞尔滕注意到静态的描述和分析模糊了这一点,他为一场革命铺平了道路,允许对动态情况下的理性游戏进行一致的分析。

考虑一个简单的例子,一个公司决定是否进入一个市场。在观察到这一决定后,现任企业可以发起价格战或不发起价格战。价格战对当权者来说代价高昂,但很可能会让进入市场一开始就无利可图。如果进入者认为在进入市场后,现任者肯定会发动战争,那么它可能会决定完全退出市场。

在博弈论的语言中,如果进入者不进入,而在位者拒绝进入,这构成了一个完全有效的纳什均衡。从某种意义上说,毁灭性价格战的威胁足以说服进入者退出市场。但请注意,这种威胁实际上并不需要在这种平衡中进行!Selten(1965)认为这是不可能的:一旦进入市场,在位者会意识到从自己的角度来看,价格战也是非常昂贵的,实际上可能会发现不参与价格战是有利可图的。预料到现任者的推理,进入者应该进入市场!

根据与各种行动相关的特定收益,当参与者进入而参与者默许的结果构成了独特的子博弈完美均衡,因为它规定了每个可能的意外事件之后的最优行动过程。请注意,我们的推理是如何反向进行的(我们首先观察在位者的决定),尽管游戏本身实际上是由参与者先做出决定的。在Selten(1978)所分析的著名的重复进入战争中,这种“逆向归纳”推理的结果被推到了极限,在那里他质疑这种经典的、理性的分析的力量来解释观察到的现象。

由Selten(1965)设计的子博弈完美纳什均衡,强调承诺的难度和可靠的行动计划,仍然是动态博弈战略分析的主要概念。它已经在所有社会科学的不同模型中无数次地被应用,也在生物学和计算机科学中被应用。

强调寡头(和监管者)参与的多阶段博弈的现代工业组织,如果没有子博弈完美的概念,将是不可想象的。但即使是经济学的偏远领域,如动态宏观经济学,也获得了巨大收益——例如,关于公共政策中时间一致性问题的基础性工作。芬恩·基德兰和爱德华·普雷斯科特的诺贝尔奖嘉奖明确提到了对塞尔滕的知识债务(诺贝尔基金会2004年)。

Selten(1975)对博弈论做出了另一个开创性的贡献,它塑造了未来几十年的研究议程。他定义了一个新的、更好的完美概念,称为“颤抖的手完美”,它更好地抓住了所有可以想象的广泛形式的游戏中前瞻性理性和可信度的概念。我们的想法是只关注那些扰动博弈的平衡点的极限在这些平衡点中,个体会以很小的概率犯一些错误。特别是,这一定义表明,一个稳健的理性定义还必须处理其他参与者对理性的某些偏离。

尽管这一概念在某种程度上更难直接应用,但它催生了大量关于所谓“纳什均衡的细化”的文献,其中既分析了公理方法,也分析了进化方法。该文献的一个特别突出之处是Kreps和Wilson(1982)提出的顺序均衡,它结合了Harsanyi和Selten(1988)的观点,并将注意力转移到玩家对彼此的信念上,从而为不完全信息动态博弈定义了一个均衡概念,这是Selten的完美均衡的近亲。

人类行为

Selten对规范博弈论和社会经济互动的描述性理论进行了鲜明的区分。他坚持认为,博弈论和其他经济学方法所描绘的理性决策并没有捕捉到实际观察到的人类行为,因此有必要发展基于经验证据的“有限理性”理论。

遵循Simon(1957)的传统,Selten使用了“有限理性”一词来描述由实际人类行为表现出来的理性——与“在扶手椅上发明的”公理和原则为基础的理性相反(Selten 1994)。为了研究有限理性,他在20世纪50年代末开始进行实验,当时实验经济学领域还不存在。

他的第一篇论文《Sauermann and Selten》(1959)是一篇关于寡头行为的实验研究,他在1965年的著名论文中首次定义了子游戏的完美性,这是受到了他对寡头行为的实验研究的推动。在他的整个职业生涯中,Selten继续致力于建立“决策和博弈论的一个描述性分支,它认真对待人类行为的有限合理性”(Selten 1994)。

Selten (1998a)区分了人类行为的三个根源:动机(驱动力)、适应(无需推理的例行调整)和认知(推理)。他特别强调了认知对动机和适应,以及最终对行为的重要影响。例如,在从Selten和Stoecker(1986)开始的一系列论文中,Selten发展了他的学习方向理论和冲动平衡平衡的想法。对于一类重复决策任务,这些模型描述了认知对适应的影响。

其观点是,决策者倾向于遵循事后理性的原则:他们倾向于改变行为,使之朝着上一段时期会更好的方向发展。重要的是,决策者不只是受试错的指导,也不受复杂的贝叶斯或其他预测的指导,也不受某些最大化过程的结果的指导。然而,这种推理仍然涉及到对世界的认知模型,关于以前会是一个更好的选择。Selten和他的学生进一步发展了该模型,使其能够成功预测不同实验环境下的各种行为模式,如讨价还价、拍卖、报摊游戏和其他设置(例如Ockenfels和Selten 2014)。

Selten开发的其他人类决策模型也不依赖于决策者某些目标函数的最大化——例如,参见Selten的愿望适应模型(Selten 1998b, Sauermann和Selten 1962),寡头实验中的互惠行为(Selten et al. 1997)和定性推理(Selten 2004)。Selten的方法是基于实验观察到的人类行为特征,例如决策过程倾向于从肤浅的分析开始,避免循环的概念,以事后理性的方式受近期经验的影响,只依赖于较低的记忆深度。

当被问及他对博弈论中完全理性的研究和对实验经济学中观察到的人类行为的研究是否矛盾时,他经常回答说,他认为自己是一个“方法论二元论者”。描述理论和规范理论都是理解社会和经济互动本质的重要视角。

结束语

塞尔滕是分析完全理性玩家(博弈论)和有限理性人类(实验经济学)的战略互动的先驱。没有人在这两方面的研究都做出了如此重大的贡献。塞尔滕也是一位鼓舞人心的老师,他似乎拥有无限的跨学科相关文献知识,巨大的方法独创性和非凡的好奇心,也涉及其他科学(他还对哲学、心理学、进化生物学、政治学、语言学和植物学做出了贡献)。

我们中的一个(本尼)有幸成为塞尔滕的博士生、博士后,后来成为他在波恩大学的同事。另一个(阿克塞尔)在塞尔滕指导他的毕业论文后,有幸和他一起工作了20年。当许多学者花费大量的时间和精力在著名期刊上发表文章,或者在组织内追逐资金、地位、影响力和权力时,莱因哈德没有做这些。他脑子里只有一件事:通过科学促进理解。这是一个老师能教给学生的最好的一课。

参考文献

Harsanyi和R. Selten (1988),博弈均衡选择的一般理论马萨诸塞州剑桥:麻省理工学院出版社。

D. Kreps和R. Wilson(1982),“序贯均衡”,费雪: 863 - 94。

纳什J.(1951),“非合作博弈”,上数学54(2): 286 - 95。

诺贝尔奖(1994)1994年瑞典央行纪念阿尔弗雷德·诺贝尔经济学奖, 2014年诺贝尔传媒协会。2016年9月6日。

诺贝尔奖(2004)2004年瑞典央行纪念阿尔弗雷德·诺贝尔经济学奖, 2014年诺贝尔传媒协会。2016年9月6日。

Ockenfels, A.和R. Selten(2014),《新闻小贩游戏中的冲动平衡》,游戏与经济行为86: 237 - 47岁。

Sauermann, H.和R. Selten(1959),“在寡占实验”,Zeitschrift für die gesamte Staatswissenschaft115: 427 - 71。

绍尔曼,H.和R.塞尔滕(1962),“anspruchsanpassungstheory der Unternehmung”,Zeitschrift für die gesamte Staatswissenschaft118: 577 - 97。

Selten。R.(1965),“spiel理论家Behandlung eines Oligopolmodells mit Nachfrageträgheit - Teil I Bestimmung des dynamischen Preisgleichgewichts”,Zeitschrift für die gesamte Staatswissenschaft121: 301 - 24。

Selten, R.(1975),“广义博弈平衡点的完美性概念的再检验”,国际博弈论杂志4: 25-55。

Selten, R.(1978),“连锁商店悖论”,理论和决策9: 127 - 59。

Selten, R.(1994)。传记”,Nobelprize.org。诺贝尔媒体协会2014。2016年9月6日。

(1998),“实验观察到的有限理性的特征”,欧洲经济评论42(3 - 5): 413 - 36。

(1998b),《愿望适应理论》。数学心理学杂志42: 191 - 214。

(2004),“基于比较静力学的有界理性定性推理”,载于战略行为、博弈论、实验与有限理性的研究进展由斯蒂芬·哈克、帕尔格雷夫·麦克米伦、贝辛斯托克编辑。

Selten, R., M. Mitzkewitz和G. Uhlich(1997),“由经验丰富的玩家编写的双寡头策略”,费雪65(3): 517 - 55。

Selten, R.和R. Stoecker(1986),“有限囚徒困境超级游戏序列中的最终行为”,经济行为与组织杂志7: 47 - 70。

西蒙,H.(1957),“理性选择的行为模型”,在人、社会和理性的模型:社会环境中理性人类行为的数学论文,纽约州:威利。

冯·诺伊曼,J和O摩根斯特恩(1944),博弈论与经济行为,普林斯顿,新泽西州:普林斯顿大学出版社。

主题:经济研究前沿工业组织

标签:Reinhard Selten博弈理论有限理性

波恩大学经济学教授

科隆大学经济学教授

事件

经济政策研究

Baidu
map