第5章 博弈类型和结构化思维(1 / 1)

学会分类

科学的起点是分类,只有通过分类才能区分事物之间的不同。

当然,任何一种东西都可以按照不同的特征差异进行分类,并没有统一的分类标准。比如对人的分类,可以根据肤色分为白色人种、黄色人种、黑色人种及棕色人种;也可以根据性别分为男性和女性;还可以根据年龄分为婴幼儿、青少年、中年人和老年人;更可以通过身高、收入、智商、出生地、国籍、宗教信仰等各种特征进行分类。

对博弈也可以从不同的角度进行分类。博弈的分类最常见的有两种,一种是分为静态博弈和动态博弈,另一种是分为完全信息博弈与不完全信息博弈。

静态博弈和动态博弈

按照博弈参与者做出策略或行动有无先后顺序来区分,博弈可以分为静态博弈和动态博弈。

静态博弈是指在博弈中,参与者同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动(虽然在物理时间上不是同时的,但是在逻辑时间上是同时的)。

动态博弈是指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

比如“石头剪子布”、罚点球(一攻一守)、投标活动之类是同时决策的,属于静态博弈;像棋牌类游戏、拍卖等决策(行动)有先后次序的,属于动态博弈。

有些高校在每门课程结束后,会要求学生给任课老师评分,包括对课程评分和对老师本人评分。老师们也需要对学生的学习成绩进行评分。

学校的管理者可能会担心,如果老师先评分,学生看到老师的评分后,会根据老师的评分高低给老师评分。一般情况下,如果老师给学生的评分高,学生给老师的评分自然也会高,反之也会如此。这样一来,老师就不太会给学生一个比较低的分数,即便有的学生考试成绩并不好。

如果学生先评分,老师看到学生的评分后,同样会根据学生的评分高低给学生评分。一般情况下,如果学生给老师的评分高,老师自然不会给学生太低的分数,即便有的学生成绩并不好。这样一来,学生和老师相互牵制,学校管理者就很难得到一个真实有效的评分。让老师和学生同时打分,这在技术上也很难做到。

为此,浙江大学的做法是,每次课程考试之前,先让学生对老师的课程和老师本人打分,打完分后,具体的评分结果对老师是保密的。等课程考试结束,老师再给学生的成绩打分并输入学校系统,让学生们先知道自己的课程成绩,然后再过几个月,老师才能看到学生们给自己的评分。

这个师生相互评分博弈虽然在物理时间上有先后,但是在逻辑时间上并没有先后。因此,这是一个静态博弈,而不是动态博弈。

静态博弈和动态博弈的最大区别在于:静态博弈的参与者只能依据对对手策略或行动的想象做决策,比如“石头剪子布”的游戏,你只能想象着对方会出“石头”,然后你决定出“布”。动态博弈的参与者则是依据对手的实际选择做决策,比如在重复博弈中有一种叫作“一报还一报”的策略,在这种策略下,因为你上次选择了背叛,那么我这次也选择背叛,我这次选择背叛和你这次选择什么无关。换句话说,我不预测你这次会如何对我,我只关心你上次是如何对我的,你上次如何对我,我这次就如何对你。

如果是动态博弈,那么后行动者会根据先行动者的实际选择做出相应的选择。

我在课堂上曾经和学生们说 :“我想象着你们会给我一个比较高的评分,结果分数一公布,竟然这么低,那我只能去‘报复’以后选我课的学生了。你们或许也一样,你给了我一个很高的评分,结果期末成绩公布后,发现我竟然让你不及格,你气得不得了,但是你也拿我没办法,只能去‘报复’以后给你上课的老师了!”当然,这只是玩笑而已,为的是让学生们更好地理解静态博弈和动态博弈的区别。我相信,老师们不会真的这么去做,学生们也同样如此。

完全信息博弈与不完全信息博弈

按照参与者对其他参与者的了解程度来区分,博弈又分为完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

完全信息博弈是指在博弈过程中,每个参与者对其他参与者的类型、策略空间及损益函数的信息有准确的了解。如果参与者对其他参与者的类型、策略空间及损益函数的信息了解得不够准确,或者不是对所有参与者都有准确的了解,在这种情况下所进行的博弈就是不完全信息博弈。通俗地说,不完全信息博弈是指总有一些信息不是所有参与者都知道的。反之,如果每个参与者所了解的信息一样多,那么就是完全信息博弈。

生活中常常会出现信息不对称的现象,譬如假药、假烟、假酒就是生产商或经销商利用了消费者缺乏对产品信息的充分了解而采取的欺骗行为。

博弈双方对信息了解的程度差异越大,说明双方的信息越是不对称。在我看来,有三个行业就存在着非常严重的信息不对称。这三个行业是:教育、医疗和金融。

先说教育,师生之间对课程内容存在严重的信息不对称。学生在选课之前并不清楚课程的详细内容是什么。由于每个学生对某课程往往只学习一次,没法比较不同老师的教学优劣,所以学生在学习完某课程后也无法对该课程的教学质量进行准确的评价。就拿本书来说吧,你在购买之前只是看到了前言中的内容和目录,最多试读几页内容,对整本书具体会讲哪些内容,这些内容是不是你真正喜欢的,或者对你的工作和生活是否有帮助,你并没有充分的了解。

再说医疗,医生和病人之间对病情的了解和判断也存在着严重的信息不对称,当医生给病人做各种检查、开各种药的时候,对于病人来说,很难判断这些检查和药是否必需。

最后说金融,我在给一些金融行业的学员上课时说,金融行业明显不同于其他行业,操作方法很不一样。比如,很多行业都实行“价高者得”的游戏规则,但金融行业就不适用这个规则。并不是谁愿意出的借款利率高,银行就把钱借给谁。此外,很多行业都希望买者买得越多越好,叫“多多益善”。比如你问我买10本《博弈论》,我很开心,买100本,则更开心,如果是买1000本,我会专门安排印刷厂给你单独印刷。但是银行却不是这样的,你贷100万,银行或许愿意贷给你,你贷1000万,银行可能就不愿意了,你要想贷一个亿,银行会告诉你绝对不行。这背后的一个重要原因就是银行和贷款人之间对贷款人的还款能力和还款意愿存在着严重的“信息不对称”。

结构化思维

当某样东西可以从两个不同的维度进行分类的时候,如果把两个维度组合在一个平面上,就可以构建出一种结构化的组合方式。

如果将静态博弈与动态博弈、完全信息博弈与不完全信息博弈这两种分类进行组合,就会出现四种更为具体的博弈类型,它们分别是完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。

与上述四种博弈相对应的均衡概念分别为:纳什均衡(Nash equilibrium)、子博弈精炼纳什均衡(subgame perfect Nash equilibrium)、贝叶斯纳什均衡(bayesian Nash equilibrium)、精炼贝叶斯纳什均衡(perfect bayesian Nash equilibrium)。表5.1给出了四种不同的分类组合。

表5.1 经典的博弈分类和相对应的均衡概念

以上4类博弈,最容易分析的是完全信息静态博弈,其次是完全信息动态博弈,然后是不完全信息静态博弈,而最难分析的是不完全信息动态博弈。作为一本博弈论入门级的书,我们的学习重点是完全信息静态博弈。

合作博弈与非合作博弈

如果按照博弈参与者是否能够达成一种具有约束力的协议来区分,博弈可以分为合作博弈(cooperative game)与非合作博弈(noncooperative game)。合作博弈是指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略,譬如企业间的联合定价等。非合作博弈是指参与者无法达成这样一种协议,在该博弈中,参与人需要解决的问题是:“当其他参与者会对自己的策略选择做出最优反应时,我的最优策略选择是什么?”

本书所介绍的博弈一般是指非合作博弈。需要指出的是,非合作博弈不是说参与者之间一定就不能合作或不会合作,而是说可以不合作。不难理解,如果每个参与者都发现合作比不合作要好,那么也是会选择合作的。何乐而不为?

零和博弈与非零和博弈

从博弈结果看,博弈可以分为零和博弈与非零和博弈。零和博弈是指博弈前的损益总和与博弈后的损益总和相等,博弈过程只是损益在不同博弈者之间的重新分配。在日常生活中,下棋、打球以及赌博等通常是零和博弈,即你所失去或得到的和对方得到或失去的是一样的。

非零和博弈是指博弈后的损益总和大于(或小于)博弈前的损益总和。非零和博弈根据总和的正负又分为“正和博弈”和“负和博弈”两种。

正和博弈是指博弈双方的利益都有所增加,或者一方的利益增加,而另一方的利益不受损害,或者一方利益的增加超过了另一方的利益损失,因而博弈各方的利益总和将有所增加。一般而言,市场经济中的交易行为是一种典型的正和博弈,每个人自由选择其所需,做出对其而言边际收益大于边际成本的策略(行动),从而增加了每个人的收益水平,产生了大于“零”的社会新增利益,是一种最为典型的合作共赢的博弈关系。也正是基于此,市场经济制度创造了巨大的人类财富。

根据美国加州伯克利大学经济学家布拉德福德·德隆(J.Bradford DeLong)的研究,在人类历史上,从旧石器时代到公元2000年的250万年间,人类花了99.4%的时间,即到15000年前,世界人均GDP达到了90国际元(这是按照1990年国际购买力核定的一个财富度量单位)。然后,又花了0.59%的时间,到1750年,世界人均GDP翻了一番,达到180国际元。从1750年开始到2000年,即在0.01%的时间内,世界的人均GDP增加了约37倍,达到6600国际元。换句话说,人类97%的财富,是在过去250年,也就是0.01%的时间里创造的。(1)

此外,按照零售商库存记录的商品种类计算,在250年前,人们能够消费的商品种类大致是10的二次方,也就是上百种而已。而现在,我们能消费的产品种类是10的八次方以上,有上亿种。

马克思对市场经济的魔力也曾给予了高度的评价。他在1848年出版的《共产党宣言》中写道:“资产阶级在它的不到一百年的阶级统治中所创造的生产力,比过去一切世代创造的全部生产力还要多,还要大。自然力的征服,机器的采用,化学在工业和农业中的应用,轮船的行驶,铁路的通行,电报的使用,整个大陆的开垦,河川的通航,仿佛用法术从地下呼唤出来的大量人口,过去哪一个世纪料想到在社会劳动里蕴藏有这样的生产力呢?”(2)

负和博弈是指参与者博弈之后损益总和小于零的博弈,既可以是参与者都有不同程度的损失,也可以是一方的损失大于另一方的收益。一个非常明显的负和博弈是彩票市场,大多数彩民买彩票的结果一定是亏得多,赚得少!例如,彩民投入1亿元购买彩票,返回给彩民的大约是50%。也就是说,对于彩民总体而言,亏损率是50%左右。

我给学生上课时经常奉劝他们尽量不要购买彩票,一个大学生去买彩票意味着他要去和那些从来没有上过大学的人竞争,比拼的是谁的运气好。显然,这么多年的读书生涯并没有为这位学生在博彩的竞争中建立起竞争优势。当然,如果一个人买彩票的目的仅仅是支持国家的福利事业和体育事业,那就另当别论了。

曾有人给我说过这么一个段子:张三买彩票中了500万的大奖,有记者对他进行了采访。

记者:先生,你好!拿了这么多钱,准备怎么花啊?

张三:先把买彩票借的钱还了!

记者:那剩下的呢?

张三:指望还能再中一次大奖!

从这个段子中大家不难感受到,就算是那些中了大奖的彩民,也未必是真正赚到钱的人,更何况是那些没中奖的彩民。

在我看来,股市中的二级市场往往也是一种负和博弈,所有参与股市二级市场的散户和机构从二级市场中得到的收益总和是小于零的。那是因为在很多国家的股市中,参与者每年从上市公司得到的分红抵不上缴给国家的印花税、交给券商的佣金和投入资金的机会成本。

总之,负和博弈最大的特点就是即便有人从中赚钱,也是参与者中的少数人。股市中流传着这么一句话:七赔二平一赚,即10人去炒股,1人是赚钱的,2人不亏不赚,还有7人是亏钱的。在负和博弈中,如何选择与多数人不同的策略就变得十分重要。正如股神巴菲特曾言:“别人恐惧的时候你贪婪,别人贪婪的时候你恐惧。”在负和博弈中,你若想的和别人不一样,胜算的概率反而可能更大。

关于零和博弈和非零和博弈,我给大家的建议是:多玩正和博弈,少玩零和博弈,尽量不玩负和博弈。

竞争博弈与合作博弈

依据参与者损益之间的相互关系,可以把博弈分为竞争博弈与合作博弈。这里对博弈的分类和之前谈到的“合作博弈和非合作博弈”的博弈不同,是根据参与者损益之间的相互关系来定义的。

如果参与者之间的损益是正相关的,就是一种合作博弈;如果参与者之间的损益是负相关的,就是一种竞争博弈。换句话说,如果在博弈中,一方赢就意味着另一方输,那就是竞争博弈;如果一方赢另一方也赢,一方输另一方也输,就是说不是双赢就是双输,那就是合作关系。

在我看来,婚姻制度的本质是通过男人之间或女人之间的竞争,实现男女双方的合作。市场制度的本质就是通过卖者之间(当商品供大于求的时候)或买者之间(当商品供不应求的时候)的竞争,最终要实现的是买卖双方的合作关系。

市场经济的表象是竞争,市场经济的本质是合作!这才是市场经济能够在短时间内迅速创造社会财富的根本奥秘之所在,市场经济的发展就是人类合作关系的不断拓展。

本章小结

1. 对博弈进行分类为的是让我们在今后的博弈中更容易针对不同的博弈类型采取不同的应对策略。

2. 两种不同分类的组合分析给我们带来结构化的思维方法,从而细化对博弈的认知。

3. 无论是个体还是群体,只有多参与正和博弈,才能推动社会财富和个人财富的持续增长。这也是市场经济能够迅速创造社会财富的根本奥秘之所在。

考考你

曾经在网上看到过这么一段留言:“由于受父母的影响,我喜欢随手买一两注彩票。但是有朋友说彩票是智商税,买彩票的大多是中低阶层的人,成天做一夜暴富的梦。为什么说彩票是智商税呢?买彩票的人真的素质偏低?”

从博弈论的角度看,博彩是一种负和博弈,理性的人应该避免参与这种游戏。但现实的情况是,很多人对博彩乐此不疲,你认为这背后的原因是什么?

(1) 张维迎.市场的逻辑[M].上海:上海人民出版社,2010.

(2) 马克思,恩格斯.共产党宣言[M].中共中央编译局,译.北京:中央编译出出版社,2005.