什么是博弈论?(1 / 1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门学科。用我们日常的语言来说,博弈论就是研究在不同情境下策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并实施各自所倾向的行为或是策略,从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例,如《孙子兵法》《三十六计》《三国演义》,等等,不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究的是象棋、围棋,以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论层面发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家冯·诺伊曼提出了博弈论的基本原理,并与经济学家莫根斯特恩合作,于1944年发表了《博弈论与经济行为》一书,提出了合作博弈的基本模型,并将二人博弈结构推广到多人博弈结构。自此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把冯·诺伊曼和莫根斯特恩的这部巨著看作是现代博弈理论诞生的标志。

目前,博弈论作为分析、解决冲突和合作的理论工具,已经在管理学、国际政治学、经济学、外交学和社会学等领域得到了广泛的应用,为解决不同实体的冲突与合作提供了宝贵的方法,并日渐发展成为一热门学科。

◇博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体

决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者都构成一个决策主体。

决策主体的目的是通过选择行动方案或者战略以使自己的效用水平最大化。只有两个决策主体的博弈称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业、国家等。

——策略

策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用

效用,又叫支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈后的收益。

效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时得到的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所制定的一组策略有关。一局博弈结束时每个决策主体得到的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

◇博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈。

静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者直到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈。

完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所能做的就是努力使自己的期望支付或期望效用最大化。

——按照参与者能否达成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈。

合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成协议时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体的理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行限制,以达到获取更多垄断利润的目的。

反之,不能使其他参与者遵守某一协议,各参与者只能选择自己的最优战略的行为,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择、决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动是否有先后顺序,可以分为四种不同的类型,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,制定每个决策主体的行为规则。如果在没有外在强制性约束的情况下,各参与者自觉遵守该协议,没有人违反协议规则,就构成一个纳什均衡(概念见第二章)。只要有一个参与者违背协议规定,则此协议就构不成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预料到这一点,所以也会考虑自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择,获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行动的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动来掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣、理论上又颇有深度的学问。可以毫不夸张地说,掌握博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择,而策略选择问题实际上就是博弈论的本质所在。