第11章 懦夫博弈:大国博弈的均衡解(1 / 1)

冲突无处不在:狭路相逢勇者胜?

几乎所有的人都有与他人直接对抗的经历(如吵架、打架、挤公交车等)。争则两败俱伤,退则颜面尽失。常有人劝你“退一步海阔天空,忍一时风平浪静”,你很可能会心有不甘地问:“为什么一定要退?”有人选择“宁为玉碎,不为瓦全”的人生哲理,甚至高喊“狭路相逢勇者胜”,也有人觉得“好汉不吃眼前亏”,选择息事宁人甚至忍气吞声。中国的古老智慧总能让你找到一种适合自己的处事方式。

从2018年开始的中美贸易战,面对美国政府的咄咄逼人,中国人的内心也是五味杂陈。网络上也是意见杂多。有的认为应该和美国正面交锋、死磕到底;也有的认为应该和美国据理力争、不断谈判,直到达成协议;当然,也有的认为应该避其锋芒,以免遭受更大的损失。

本章试图用懦夫博弈模型对人类社会普遍存在的争斗现象进行理论总结与分析。在本章的内容中,我先给你介绍“懦夫博弈”的经典模型,然后分析懦夫博弈中的制胜策略,再讨论一下不同类型的懦夫博弈,最后我们一起来分析大国之间博弈的均衡解会是什么。

懦夫博弈(chicken game)

1955年,美国上演了一部当时颇有影响力的电影《无因的反叛》(曾获奥斯卡三项提名),影片中的吉米和巴兹发生冲突,双方决定通过玩夜间飞车游戏来解决,即两人同时开车冲向悬崖边,谁第一个跳出车来谁就是“懦夫”。当两辆汽车冲向悬崖时,吉米安全地跳出车来,巴兹却因为衣服挂在车门把手上不能脱手,最后掉下了悬崖。

这种比谁胆子大的游戏是很多电影中的桥段。在《幻影英雄》这部电影中,施瓦辛格开着一辆很炫酷的黑色老爷车和反派面对面地进行汽车对撞,最后在两辆车快要撞到一起的时候,反派急打方向盘避开了施瓦辛格的汽车,最终施瓦辛格赢得了胜利。

后来的人们把这种“比比谁是胆小鬼”的游戏,称为“懦夫博弈”(chicken game),在国内也会翻译成“斗鸡博弈”,一方面的原因是“chicken”这个单词最常用的翻译就是“鸡”,另一方面的原因是中国和美国都有悠久的斗鸡传统(美国现在已经立法禁止斗鸡了),所以翻译成“斗鸡博弈”还是非常形象的。其实“chicken”一词在美国口语中是“懦夫”之意,“chicken game”译成“懦夫博弈”还是比“斗鸡博弈”来得更准确一些。

在懦夫博弈中,有两个参与者A和B,每个参与者有两种策略(行动):进和退。双方面临四种结果:都进、都退、A进B退、A退B进。四种结果对应的损益分别是:都进(-5,-5)、都退(0,0)、A进B退(10,0)、A退B进(0,10)。表11.1用田字矩阵进行了描述。再强调一下,这四种结局的损益是人为给定的。如果你认为双方都进的损失不是(-5,-5)而是(-50,-50),这也是可以的。

表11.1 懦夫博弈(不考虑面子)

懦夫博弈的特点是:都进则两败俱伤(-5,-5);都退则息事宁人(0,0);一进一退则进的一方占尽便宜(收益为10),退的一方颜面尽失(收益为0)。退的一方用0来赋值,意味着先不考虑颜面的价值。如果你一定要考虑颜面的价值,也可以用-1、-2或-3来赋值,只要不低于-5就可以。

通过对博弈结果的分析可知,懦夫博弈中有两个纯策略的纳什均衡结果:(A进,B退)和(A退,B进),即一方进,一方退。至于在现实生活中究竟是哪个均衡结果更容易发生,就上述的这个博弈而言,两个均衡的可能性各占50%。

先下手为强,后下手遭殃?

接下来对懦夫博弈做进一步的探讨。

懦夫博弈存在先动优势。一旦有一方选择了进,另一方的选择只能是退,否则会遭受更大的损失。这就是人们常说的“先下手为强,后下手遭殃”。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出“破釜沉舟、背水一战”的决心来,以迫使对方退却。因此,鲁莽、非理性、非理智形象的人往往能够取得胜利。譬如,在过独木桥时,那种看上去不把自己生命当回事的人往往能逼退独木桥上的另一人。

我在自己所住的小区就亲眼见到过这么一件让我印象深刻的事。小区内的单行道有人逆向行驶,当逆向行驶的车与另一辆正向行驶的车相遇时,逆向行驶的车死活不肯退让,甚至选择弃车走人。最后的结果是,正向行驶的驾驶员选择退让后从另外的门口开走。如果这种懦夫博弈是重复博弈,那么冒险选择向前而成功的参与者就更有信心在将来采取这种策略,其所树立的粗暴形象,将使得对手在未来的对抗中因害怕两败俱伤而退出,冒险者从而获益。

懦夫博弈中所存在的“先动优势”一方面意味着双方比拼的是谁先选择进,另一方面也意味着还要比谁先把选择进的信息传递给对方。试想,如果A选择了进,但是还没来得及告诉对方,却先收到了对方选择进的信息,这个时候A怎么办?是继续选择进,双方两败俱伤,甚至同归于尽,还是选择退,避免与对方产生真正的冲突?

如果有一方还没采取行动就先告诉对方自己一定会选择进,你认为对方会相信吗?一般而言,对方是不会相信的,对方会想,你这是吓唬谁呢,我才不怕呢,然后在行动上先选择了进。那么,之前声明要选择进的一方怎么办?是改变策略选择退还是坚持之前所坚称的进呢?在懦夫博弈中,重要的不是你怎么说,而是你怎么做。当然,在现实的博弈中,如果你实在无法选择先行动,就先告知对方自己的意图,有时候也是有用的。这是因为,你通过告知的行为改变了博弈的损益函数,让你自己选择退的损失变大了。你如果说了要进却选择了退,意味着你是一个言而无信的人,让别人以后无法相信你的承诺。

从理论上说,懦夫博弈的制胜策略是:抢先选择进,并抢先告诉对方已经选择了进,同时让对方知道自己的选择已经无法更改了。在这种情况下,除非对方是个疯子,否则一定会选择退。比如两辆车相对而开,如果你只是把对方退作为博弈的目标,你直接双手离开方向盘,当着对方的面把双手伸出窗外,然后猛踩油门往前开。在这种情况下,相信对方不得不选择退。当然,这么做的前提是:对方能看到你双手离开方向盘的行为,同时对方的方向盘还掌控在他的手里。不过这仅仅是一种想象,先不说这本身就是一种违反交规的行为,同时也存在巨大的危险。

分析到此,你可能会问,如果所有的利益冲突都是以一进一退作为均衡结果的话,那么现实生活中的两败俱伤就不可能出现。这说明,刚才的分析肯定有问题,那么问题出在哪里呢?问题就出在你对面子的赋值上。

试想,在一进一退的情况下,如果选择退的一方认为自己输掉了面子,而且对输掉面子的赋值超过了两败俱伤的损失,那么一进一退就不再是一个均衡结果了。此时的均衡结果是双方都进。表11.2给出了这个博弈的四种结果,在这个博弈中,双方都进的这个均衡结果已经不是懦夫博弈的均衡结果,而是第13章中将会介绍的“囚犯困境”的均衡结果。

表11.2 懦夫博弈(考虑面子)

曾在网上看到这样一则新闻,那是2009年3月25日下午,浙江丽水成龙小学校门口一辆红色的骐达轿车与一辆蓝色别克轿车互不相让,“顶”在小弄堂里,从上午11时15分左右,一直顶到下午6时左右,两辆车还僵在成龙小学门口的小弄堂里。最后是派出所民警调来拖车将两辆汽车拖走。两个司机不但需要承担拖车费用,还要按照《中华人民共和国治安管理处罚法》接受处罚。(1)

当你了解了这件事的整个过程后,一定会认为这两位车主完全没必要这么做,他们做事很不理性。问题是,生活中,很多夫妻之间的吵架不也是这样吗?为一点鸡毛蒜皮的事情吵得不可开交,甚至到了闹离婚的地步,因为谁也不愿意被别人认为是懦弱的、可以被欺负的一方。中国有句古话,“人善被人欺,马善被人骑”,一个懦弱的小孩在学校里很容易被其他同学欺负,他长大了也很容易吃亏。从更长远的角度来看,那种总是选择退让的基因在人类长期的进化过程中是很容易被淘汰的。因此,人们看重面子、树立硬汉形象等很可能是出于长期利益的理性考虑。一些在静态博弈中显得不可理喻的行为放在动态博弈中就可以得到合理的解释。

懦夫博弈中一进一退的均衡解是基于“行动有先后,信息有沟通”的重要前提。如果双方在分散决策并无法沟通的情况下,或虽然有沟通但没能达成共识的情况下,又会是一个什么样的博弈结果呢?答案请见下文,至于答案是怎么得出的,我会在后面的学习内容中讲解具体的计算方法。

在双方完全分散决策或无效沟通的情况下,每一方选择进的概率是3∶2,选择退的概率是3∶1,双方各自的期望收益是0。懦夫博弈还存在一个混合策略的纳什均衡。至于什么是混合策略,如何计算混合策略的纳什均衡,在本书后面的内容中会详细展开。

接下来我们继续改变一下双方的损益结果,前面我们考虑了颜面的价值后,双方博弈的均衡解变成了两败俱伤的争斗。如果我们降低颜面的价值,又会如何呢?试想,在一开始的懦夫博弈结果中,一进一退的双方收益是(10,0),如果我们认为那个选择进的一方因为其鲁莽而霸道的形象会遭人鄙视,而选择退的一方会遭人同情和帮助,从而使得双方的损益从刚才的(10,0)变成了(6,4),这意味着进的收益下降了,退的收益上升了。表11.3给出了这个博弈的四种结果。

表11.3 另一种懦夫博弈

在这个博弈中,除了一进一退的两个纳什均衡以外,还有一个混合策略纳什均衡是双方选进的概率是40%,选退的概率是60%。这非常符合我们的常识:一旦进的收益下降了,退的收益就上升了,人们自然更愿意选择退了。因此,双方斗起来的可能性大大降低了,每一方的期望收益也从之前的0增加到1.6。至于这些数字是怎么算出来的,本书后面的学习内容中会有详细解答。

不同懦夫博弈的比较

当我们把表11.2和表11.3两个懦夫博弈结果放在一起比较时,可以得到两个非常有用的推论。

1. 过度激励导致过度竞争

在表11.3的懦夫博弈中,因为进的收益下降了,所以大家愿意选退了,斗起来的可能性下降了,总的收益反而上升了。这说明,我们对任何行为的激励一定要适度,过犹不及。

我在给本科生上课的时候会问同学们一个问题:如果一等奖学金的奖金从6000元增加到6000万元的时候,对学生们有没有好处?我的答案是肯定没好处,因为学生之间的争斗会厉害得多。如果是6000元奖金,大家的竞争一般只限于努力学习考出好成绩;如果是6000万元奖金,那么大家的竞争肯定不会只限于努力学习,一定会出现其他的方式,比如会有同学采取一些不正当的竞争手段来获得奖学金。正所谓“重赏之下,必有莽夫”,当某种**足够大了以后,很多人会不断突破做人的底线。

2. 赢者通吃导致过度竞争

在表11.2的懦夫博弈中一进一退是(10,0),而在表11.3的懦夫博弈中一进一退是(6,4),这说明表11.2的懦夫博弈是一个赢者通吃的博弈,在这个博弈中参与者选择进的概率会增加,彼此争斗得更激烈,总的收益反而减少了。因此,越是赢者通吃的博弈越容易出现过度竞争。

我在课堂上给学生们设计了这么一个游戏:先给每个学生展示我的微信支付码,然后告诉他们,每个人可以支付任意一个金额,最后看谁支付得多,我直接给他100元现金的奖励。这个游戏结束后,我几乎每次收到的金额都会超过100元。其中,有200多元的、300多元的和400多元的,甚至好几次都超过了500元。这说明学生们为了得到我手里的100元,总共花去了100多元的代价。这就是赢者通吃所导致的过度竞争。当然,需要说明一下,我和学生们玩的这些游戏,在开学的第一堂课就会提前告诉大家,一个学期下来,如果我在游戏中的结果是亏损的,亏损由我自己承担;如果我是盈利的,盈利的钱将会在期末的时候通过在课程群里抢红包的方式全部返还给大家。

本章小结

1. 只要资源稀缺,利益冲突不可避免。

2. 懦夫博弈存在先动优势。

3. 懦夫博弈中的先动优势既是基于行动的先动优势,又是基于信息传递的先动优势。

4. 在懦夫博弈中,精神层面的损失也需要考虑到损益中去,这样才能更好地理解现实中的博弈结果。

5. 过度激励会导致过度竞争。重赏之下会出现勇夫,也会出现莽夫。组织的管理者必须把握好激励的力度。

6. 赢者通吃同样会导致过度竞争。在这种博弈中,请反复估量自己胜出的可能性有多大。一般情况下的理性选择是不参与博弈的。

考考你

在上“博弈论”课程的过程中,我曾经和学生们玩过这么一个游戏:每个人发红包给我,金额是0.1元或0.1元的整数倍,红包的个数不限,可以发多个红包,等所有红包打开后,发红包金额最少(没有相同金额的条件下)的同学获得40元的奖金,并且每位同学所发的红包金额一律不返还。

现在假设参与者的数量在60人左右,参与者的红包个数在60~180个,如果你是其中的一个参与者,在你愿意参与游戏的情况下,你会选择什么样的策略?

请写下你所发红包的数量和具体金额。

附录里的参考答案会告诉大家现实中的博弈结果是什么,采取什么样的策略能让自己在该博弈中更容易胜出。

(1) 《两辆车堵在弄堂口互不相让顶牛8小时》,http://news.sina.com.cn/s/2009-03-26/040217482643.shtml。