博弈论专家诺奖获得者：罗伯特?奥曼

博弈论专家诺奖获得者：罗伯特?奥曼
2015/8/13 哲学园

     一、人物生平

     罗伯特·奥曼，1930年6月出生于法兰克福，1950年毕业于纽约大学并获数学学士学位。之后，又于1952年和1955年在麻省理工学院分别获得数学硕士学位和数学博士学位。1966年，罗伯特·奥曼被选为经济计量协会会员，现任耶路撒冷希伯莱大学数学研究院教授、纽约州立大学斯坦尼分校经济系和决策科学院教授以及以色列数学俱乐部主席、美国经济联合会荣誉会员、青岛大学名誉教授等。

     在他的学术生涯中，曾担任多家专业杂志社的编辑，如《国际对策论杂志》、《数理经济学杂志》、《经济学理论杂志》、《经济计量学》、《运筹学数学》等。

     罗伯特·奥曼作为一名杰出的经济学家，在决策制定理性观点方面有着杰出的贡献，对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此，他于1983年获得了以色列技术机构颁发的科学技术哈维奖，1994年获得了以色列颁发的经济学奖。

     2005年10月，2005年度诺贝尔经济学奖揭晓，以色列耶路撒冷希伯来大学数学研究院教授罗伯特·奥曼和美国马里兰大学公共政策学院教授托马斯·谢林因在博弈论方面的贡献共同分享了这一殊荣。[1]

     二、罗伯特·奥曼的理论

     罗伯特·奥曼第一个定义了博弈论中的相关均衡概念，这是一种非协作型博弈中的均衡，比经典纳什均衡更加灵活。他还提出了交易者连续统市场经济模型、

     把交互环境中代理人之间通识模型用人们熟悉的数学公式来表示并且还提出了重复博弈的连续交互模型。

     (一)、相关均衡[2]

     除了在分析超级博弈时，奥曼提出的“强均衡”之外，奥曼还提出了另一个均衡概念——相关均衡,并指出相关均衡可视作贝叶斯决策理论向非合作博奕的自然拓展。我们知道，有些博弈不止存在一个纳什均衡，而是存在多个甚至无穷多个纳什均衡，而纳什均衡的多重性问题严重影响了博弈分析工具的有效性。因此，研究“从多重纳什均衡中挑选一个作为合理且正确预测”的一般性规律，将有助于多重问题的解决。但是，“当存在多个纳什均衡时，说某个纳什均衡一定会被采用，必须有某种能够导致每个博弈方都预期同一个纳什均衡出现的机制或者程序”相关均衡就提供了一种将多重均衡进行简化的有效方法。相关均衡是在博弈有多重均衡，也就是人们有多重选择但需要协调的情况下，解决策略选择相互协调问题和避免冲突的重要机制之一。

     相关均衡允许参与人的策略统计相关，所以纳什均衡可以视作相关系数为0的相关均衡。如果参与人的策略选择基于相互关联的随机变量，那么参与人的策略就可能相关，这些相互关联的随机变量是向参与人传递信息的一些“信号”。相关均衡就是人们根据博弈策略以外的特定相关信号机制进行决策选择所实现的均衡。在相关均衡中，仍像纳什均衡一样，每位参与人在给定其余参与人的策略条件下选择最优策略。这些特定的相关信号机制充当了“能够导致每个博弈方都预期同一个纳什均衡出现的机制或者程序”。所以，相关均衡实际上相当于博弈在特定的信号装置下的“条件纳什均衡”，这一方面使纳什均衡分析可以针对于不同的实际条件来进行，同时也可以对多重纳什均衡进行筛选与简化。

     相关均衡最简单的例子就是交通信号灯的作用。在没有交通信号灯时，车辆、行人通过路口时很容易发生事故，原因是驾驶员或者行人在选择停或行方面存在多重纳什均衡，而且缺乏协调机制，只能盲目选择。但信号灯的出现就给人们提供了一种协调机制，当大家利用它们来选择时，就有了相互判断对方选择的方法，从而自己就能作出正确选择，顺利通过路口。

     (二)、重复博弈的连续交互模型[3]

     重复博弈是指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容，它可以是完全信息的重复博弈，也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

     首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代，被称为“佚名定理”。该定理认为，重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而，虽然所有可行的个体理性结局确实代表了合作博弈的解观点，但是它相当模糊，并且不提供信息。而奥曼认为，完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象，可能一开始看起来是非理性的。

     奥曼还考察了许多具体的合作行为，定义了“强均衡”概念，即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出，重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此，奥曼定义和研究了经济理论中极为重要的“一般”合作博弈，即非转移效用博弈，这开拓了该领域的研究空间，因为在此之前，仅有“单边支付”博弈被研究，即每个联盟可以任意在其成员中分享一定数额的赢得。

     其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始，奥曼和其他合作者一起，在其学生的辅助下，发展了不完全信息的重复博弈论。1966年，奥曼和M.马希勒在给美国武器控制和裁军机构的开创性报告中，建立了不完全信息的重复博弈模型。他们指出，信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零和博弈中，其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息)，拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的；有时是完全揭露或根本没有揭露；有时是部分揭露。这种分析被扩展至更一般的模型，即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如，奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的彩票”的概念，即没有参与者可以单方面地改变彩票不同结果的可能性，这个概念与非零和博弈密切相关。之后，奥曼在重复博弈上的研究获得了丰硕成果。事实上，他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科，诸如寡头垄断、委托人与代理人、保险等等。

     (三)、交互环境中代理人之间的通识[4]

     奥曼认为，博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的，就是说人们之间的决策与行为将形成互为影响的关系，一个经济主体在决策时必须考虑到对方的反应，所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点，认为博弈论是交互式条件下“最优理性决策”，即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者，通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中，一个参与者对结果的偏好等级并不意味着是他的可能决策的等级，这个结果也取决于其他参与者的决策。

     他还分析了一般和特殊模型中的“解概念”，指出，就社会科学的理性方面而言，博弈论是一种概括或“统一场论”。这里的“社会”是广义的，包括人类和非人类的参与者(如计算机、动物、植物等)。与探讨像经济学或政治学等学科的他种方法不同，博弈论不利用个别的、特定的结构讨论各种具体问题，如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说，博弈论发展了原则上应用于所有交互情形的一套方法，并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间，常常出现密切的联系。然而在其他的情形下，博弈论方法会得出一些其他方法未能得出的新见解。[5]

     [1]百度百科：罗伯特·奥曼

     [2]《2005年诺贝尔经济学奖得主—罗伯特?J?奥曼学术思想述评》丁继红李强

     [3] MBA智库百科：罗伯特·奥曼

     [4] 《罗伯特?奥曼》中国人民银行2008年4月

     [5]交互环境下的代理人理论 2005年12月

    http://www.duyihua.cn
返回哲学园返回首页返回百拇医药