第10章 博弈描述:真正的入门在这里(1 / 1)

本章我们要一起解决的一个问题:如何用一种简便的方法来描述一种博弈关系。这里真的要再次感谢2005年获得诺贝尔经济学奖的谢林,他让我们学会了一种建模的好方法。

在本章中,我们用博弈论的模型分析方法来描述两种博弈关系,一种是绑架博弈,另一种是皇帝和功臣的博弈。

绑架博弈

1. 现实中的绑架

绑架既是现实中经常发生的刑事犯罪,也是很多警匪片中的常用情节。在绑架博弈中,被绑架人的家属经常会面临两个问题:(1)要不要支付赎金;(2)要不要报警。

香港在1997年回归之前,富豪经常被绑架。比较著名的是龚如心的丈夫王德辉,他先后被绑架了两次。第一次支付了1100万美元赎金之后,被放了回来;第二次就没那么幸运了,在支付了6000万美元赎金之后,他惨遭撕票,尸体被扔进大海,再也找不回来了。

除了王德辉,另一著名绑票对象就是李嘉诚的儿子李泽钜,绑架他的人就是世纪悍匪张子强。1996年5月23日下午6点左右,李泽钜从公司下班回家。张子强在一个人烟稀少的单行道上精心设下了埋伏。劫持成功后,直接上门向李嘉诚要赎金。

张子强的要价是20亿港元!全部现金,不要新钞。经过讨价还价,双方最后商定的赎金是10.38亿港元。拿到所有现金后,张子强对李泽钜说:“你老爸讲信用,钱我们已经拿到了。所以我们也讲信用,今天晚上我们就放你走。”张子强最后分到了3.6亿港元现金,因为他是老大,拿到的份额最多。(1)

以上案例多少会让人们心生疑惑,在人们所看的电影和电视剧中,很少有绑匪绑架成功获得赎金的桥段。对此,不妨从博弈的角度来进行模型分析。

试想,一个歹徒绑架了你的孩子,威胁你如果不付赎金的话就把孩子杀死,你怎么办?如果能够把孩子赎回来,你自然愿意付赎金。可是你也非常担心歹徒拿了赎金后,出于不留后患的考虑,还是会把你的孩子杀死,从而让你落得个人财两空的悲惨结局。

2. 建立绑架博弈模型

建立一个绑架博弈的分析模型。

第一步:选定参与人,你和绑匪;

第二步:选定策略,有两个策略可供你选择,付赎金和不付赎金,绑匪也有两个策略,即释放人质或杀死人质;

第三步:罗列结局,这里一共有四个结局,不付赎金放人,付赎金放人,不付赎金撕票,付赎金撕票;

第四步:衡量(或比较)损益。

先衡量你的损益,把刚才提到的四种可能结局,按照损益的大小先排序,再赋值。一般而言,对你来说,四种结果的偏好排序从高到低分别是:不付赎金放人>付赎金放人>不付赎金撕票>付赎金撕票。排序后再进行赋值,对于每种结果给予一个具体的分数。你可以这样赋值:

(1)你不付赎金,绑匪放人,得4分;

(2)你付了赎金,绑匪放人,得3分;

(3)你不付赎金,绑匪撕票,得2分;

(4)你付了赎金,绑匪撕票,得1分。

需要提醒你的是,排序很重要,具体怎么赋值不重要。对刚才的四种结果,你也可以分别给予10倍的赋值:40、30、20、10。如果你觉得四种情况对你来说都是损失,而不是收益,认为不应该用正数来赋值,而是要用负数来赋值,也是可以的。

(1)你不付赎金,绑匪放人,得-1分(虚惊一场);

(2)你付了赎金,绑匪放人,得-2分(破财消灾);

(3)你不付赎金,绑匪撕票,得-3分(丧子之痛);

(4)你付了赎金,绑匪撕票,得-4分(人财两空)。

不过,在后面的分析中,我还是决定用正数来赋值,方便你找到纳什均衡。

赋值完成后,接下来分析绑匪。绑匪面对刚才的四种情况,他的排序又会是什么呢?此时,你需要对绑匪的偏好顺序进行判断。依据不同的偏好排序结果,可以把绑匪分成三种类型,即残存良知型、残暴型和金钱至上型。

3. 绑架博弈模型分析

第一种,残存良知型。绑匪以得到赎金为目的,如果真得不到赎金,也愿意释放人质。这种绑匪对四种结果从高到低的排序是:付赎金放人>不付赎金放人>付赎金撕票>不付赎金撕票。具体的赋值是:

(1)你付了赎金,绑匪放人,得4分;

(2)你不付赎金,绑匪放人,得3分;

(3)你付了赎金,绑匪撕票,得2分;

(4)你不付赎金,绑匪撕票,得1分。

借助于谢林提供的田字矩阵表达式,我们把四种结果及双方的损益都放在了表10.1中。表中左边的数字代表的是你的损益,右边的数字代表的是绑匪的损益。我们以后的模型分析都采用这种表达方式。

表10.1 残存良知型绑架博弈

比较表10.1中四种结局的损益状况,你会发现,无论你是否付赎金,绑匪都会释放人质。因此,你不付赎金,绑匪释放人,就会成为这个博弈唯一的纳什均衡。

第二种,残暴型。对于这种绑匪,无论你是否支付赎金,都会选择撕票。具体的赋值是:

(1)你付了赎金,绑匪撕票,得4分;

(2)你付了赎金,绑匪放人,得3分;

(3)你不付赎金,绑匪撕票,得2分;

(4)你不付赎金,绑匪放人,得1分。

依据前面介绍过的方法,我们就可以建立起第二种绑架博弈模型,并称之为“残暴型绑架博弈”(见表10.2)。

表10.2 残暴型绑架博弈

在这个博弈中,你会发现,无论你是否付赎金,绑匪都会撕票,因此你不付赎金,绑匪撕票,就会成为这个博弈唯一的纳什均衡。

第三种,金钱至上型。绑匪的目标是讹诈赎金,如果你给钱,他就放人,以免杀人后一旦被抓罪加一等。如果你不给钱,他会选择撕票,以确保以后还能讹诈到赎金。试想,如果你不付钱,绑匪也放人,以后他撕票的威胁就变得不可信了。具体的赋值是:

(1)你付了赎金,绑匪放人,得4分;

(2)你付了赎金,绑匪撕票,得3分;

(3)你不付赎金,绑匪撕票,得2分;

(4)你不付赎金,绑匪放人,得1分。

依据同样的方法,可以建立起第三种绑架博弈模型,并称之为“金钱至上型绑架博弈”(见表10.3)。

表10.3 金钱至上型绑架博弈

在这个博弈中,博弈的均衡结果是:你不付赎金,绑匪撕票。

在此,你可能会问:面对一个金钱至上的绑匪,你付赎金、绑匪放人不是比你不付赎金、绑匪撕票的结果更好吗?为什么不去选择这个更好的结果呢?问题出在哪里?出在你身上!

因为,我们一开始设定你对结果的偏好顺序:不付赎金放人>付赎金放人>不付赎金撕票>付赎金撕票。也就是说,在你看来,不管绑匪是放人还是不放人,你都认为不付赎金比付赎金好。这个道理一般而言也确实是对的,如果绑匪选择放人,你自然不愿意付赎金。如果绑匪选择撕票,你同样不愿意付赎金。问题是,如果每个家人都是这么想的,就不可能出现龚如心和李嘉诚花钱赎人的事情了。我们又怎么去理解这种现象呢?

要想改变博弈的均衡结果,就需要改变参与者的偏好排序以及对应的损益结果(支付函数)。现在假设一种新的情况,如果对你来说,无论绑匪是选择放人还是撕票都愿意支付赎金。那么,碰到残存良知型或金钱至上型的绑匪,均衡结果是你付赎金,绑匪放人,如李泽钜绑票案,王德辉第一次绑票案;碰到残暴型绑匪的均衡结果是你付赎金,绑匪撕票,如王德辉第二次绑票案。表10.4、表10.5、表10.6给出了相应的博弈模型。

表10.4 残存良知型绑匪博弈(2)

表10.5 残暴型绑匪博弈(2)

表10.6 金钱至上型绑匪博弈(2)

在绑匪撕票或释放人质的条件下,为什么有人会觉得付赎金比不付赎金好?我觉得可能有以下几个原因:

(1)赎金对其而言只占总财产的很少一部分,他们对这点钱不在乎;

(2)在对方释放人质的情况下,如果不付赎金,担心歹徒下次会继续绑架人质;

(3)在已经支付赎金的情况下,绑匪选择撕票,觉得自己已经尽力了,反之,如果是因为自己没付赎金,导致绑匪撕票会有很强的内疚感或负罪感。

当然,大家应该还可以找出其他原因。可以肯定地说,现实情况一定会比模型分析更复杂。考虑到本章的内容主要是教大家怎么学会博弈论的建模,更深入的探讨将放在以后的内容里去展开。

皇帝和功臣的博弈

分析完绑架博弈,我们来分析皇帝和功臣之间的博弈。

1. 历史的迷思

新皇帝上台之后,诛杀有功之臣,在中国历史上是一个屡见不鲜的现象,最典型的是朱元璋,那真是一个“狠”字了得。和他一同“创业”的伙伴们到最后基本上都被他赶尽杀绝,甚至满门抄斩。

当然,并不是每个新上台的皇帝都会选择诛杀功臣,如东汉光武帝刘秀、唐太宗李世民和宋太祖赵匡胤,他们对功臣们还是比较温情脉脉的。最典型的是赵匡胤的“杯酒释兵权”,让功臣们解甲归田,优待有加。

此外,回顾清朝的历史,吴三桂为清军入关立下汗马功劳,后来康熙皇帝下令撤藩,吴三桂起兵造反。试想康熙和吴三桂之间,是因为康熙担心吴三桂会谋反而选择撤藩,还是因为康熙下令撤藩,才导致吴三桂的谋反?

2. 皇帝的忧虑

对任何一个皇帝来说,自己把位子坐稳,并确保儿孙们继续把位子坐稳,从而江山万代相传,一定是其最关心的问题。因此,皇帝最担心的就是会不会有人想着谋反(权)篡位。如果皇帝一个个地去问下面的官员或老百姓:“你想不想谋反?”我相信官员或老百姓一定会被吓得半死,然后诚惶诚恐地高呼:“吾皇万岁、万岁、万万岁!”在很多官员看来,一旦被皇帝怀疑有谋反之心,立马会有性命之忧。因此,官员们想不想造反,皇帝是问不出来的。官员们自己心知肚明,皇帝却不能明确地判断出谁是奸臣,谁是忠臣,谁是真正有谋反之心的。

在这种情况下,皇帝的想法是,虽然我不知道你想不想造反,但我能相对容易地知道你有没有能力造反。因此,对于皇帝来说,最安全的做法是把所有有能力造反的大臣们都赶尽杀绝,只留下那些没有能力造反的大臣,他们即便想造反,也是心有余而力不足,只有这样才能保证江山永固。

3. 如何建模

为分析皇帝和功臣之间的博弈关系,我们把皇帝分成强、中、弱3种类型,同样把功臣也分成强、中、弱3种类型。这样一来,就会出现9种博弈关系。考虑到皇帝和功臣之间的对称关系,皇帝强对应功臣弱,皇帝弱对应功臣强。本书只从功臣的强、中、弱来分析双方的博弈关系。

任何一个皇帝都会面对三种类型的功臣:强、中、弱。采取两种不同的策略:杀和不杀。功臣能够采取的策略是:造反和不造反。根据我们在绑架博弈中提供的建模方法,可以建立以下3种博弈模型。

第一,皇帝与实力强大的功臣之间的博弈。表10.7给出了双方的策略表达式,从各个数字的比较来看,对于实力强大的功臣来说,无论皇帝选择杀或是不杀,自己选择造反都比不造反好。既然功臣一定会造反,那么皇帝自然会选择杀。因此,双方博弈的均衡结果是:皇帝杀,功臣造反。

表10.7 皇帝和功臣的博弈(强实力型功臣)

第二,皇帝与实力中等的功臣之间的博弈。表10.8给出了双方的策略表达式,从各个数字的比较来看,对于实力中等的功臣来说,如果皇帝选择杀,则选择造反;如果皇帝选择不杀,则选择不造反。对于皇帝来说也同样如此,如果功臣造反,则选择杀;如果功臣不造反,则选择不杀。这里一共存在两个纳什均衡结果。在现实中这两种情况都有可能发生。至于哪种情况发生的可能性更大,我会在后续的内容中进行更深入的分析。

表10.8 皇帝和功臣的博弈(中等实力型功臣)

第三,皇帝与实力弱的功臣之间的博弈。表10.9给出了双方的策略表达式,从各个数字的比较来看,对于实力弱的功臣来说,无论皇帝选择杀或是不杀,自己选择不造反都比造反好。既然功臣一定会选择不造反,那么皇帝自然会选择不杀。因此,双方博弈的均衡结果是:皇帝不杀,功臣不造反。

表10.9 皇帝和功臣的博弈(弱实力型功臣)

4. 若干启发

刚才的博弈分析,给了我们一些很重要的启发。

第一,对于大臣们来说,要想保住性命,最好的选择是“自废武功”,让皇帝彻底放心。比如告老还乡,放弃手中的一切权力;比如自污其名,做一些有损自己形象的事情。当然,有时候甚至只能采用“自杀身亡”的极端举措,以避免满门抄斩的更坏结果。

第二,考虑到皇帝还需要依靠大臣来统治和管理国家,如果把有能力的大臣们都赶尽杀绝,只留下碌碌无为的平庸者,也不利于对老百姓的管理和控制,无形中增加了被农民起义推翻的危险。再加上国家除了内忧,还有外患,如果治理不好,很容易被他国所灭。因此,皇帝还必须留下一些有能力的人。让大臣们有能力办事,无能力造反,这才是皇帝们最希望看到的理想局面。

第三,依靠暴力获得国家的统治权,就很难避免被暴力推翻的历史命运,因为皇帝(包括后续的皇帝)总有变弱的那一天,而当皇帝的收益又是如此巨大,很多实力强大的人都愿意去冒这个风险。因此,皇权统治之下,屠杀功臣是一个永远走不出的困境。

本章小结

1. 描述一个博弈的关键要素是:参与人、策略(行动)和损益。

2. 参与人的不同类型会导致不同的博弈关系。

3. 建立博弈模型后,可以通过不同结局之间的相互比较对均衡结果进行深入分析。

考考你

结合你以往上学与听课的相关经历,构建一个老师和学生之间“逃课与点名”的博弈模型,并通过模型参数的不同分别解释现实中存在的几种均衡结果:(1)老师每次点名,学生每次不逃课;(2)老师每次不点名,学生每次不逃课;(3)老师每次不点名,学生每次逃课;(4)老师有时候点名,学生有时候逃课。请分别计算出老师点名和学生逃课的概率。

(1) 《当年绑架李嘉诚之子张子强分到3.6亿,想知道内幕?》,http://www.sohu.com/a/66933959_115738。