事先设想最严峻的局面
在追求某种利益或者冒险采取某种行动时,我们一般都会在脑海中想象最坏的局面,比如“最少也能保住本钱”“最多也就承担这种程度的风险”“想要告白,就算被拒绝,也只是伤心一会儿而已,并不会因此而变得一无所有”等。不管是有意识还是无意识,在日常生活中,我们每天都会做出类似的判断。因此,正如第一章中提到的选择生意A的人,他们所依据的最大最小准则就非常自然地成了常用的判断准则。
我认为“最差也就是这种程度了”的理念是存在问题的,究其原因,“究竟允许差到什么程度”的容忍度是非常重要的。在评价事物时,我们更倾向于给出1或0之类的定性结论,而不是连续地(一点点地)跟踪观察,比如“如果被逼降薪的话,我就辞职”“如果再这么请假下去,就不给你学分”“如果再磨磨蹭蹭,就别坐公共汽车去了”“如果现在不结婚,不如就此分手算了”等。
在日常生活中,当必须做出这种非此即彼的判断时,我们自然要先考虑“究竟能容忍到什么程度”。所谓明确容忍限度是指明确“底线”。概括起来,“底线”是指“最小利益”或“最大风险”。
比如表1-1中,选择生意A的情况下,最低收益为1万日元。换句话说,“不管发生什么情况(不管天气状况如何),必然会有1万日元以上的收益”。因此,我们也将1万日元称为生意A的保底值(security level)。这个数值是指采取某种行动后(或者未采取行动时),需要确保的最低利润值。有鉴于此,依据最大最小准则,我们应该选择保底值最大的行动方式。
安全资产与风险资产
在选择金融资产进行投资时,我们可能会无意间用到最大最小准则。
一般来说,股票属于风险资产,债券属于安全资产(尤其是国债)。这是为什么呢?
这里,需要大家先明确一个概念,持有金融资产的利润主要包括两个方面——收入收益(income gain)和资本收益(capital gain)。收入收益是指可以持续领取的现金收入;资本收益是指金融产品增值(转卖之后)带来的收益。股票的收入收益是企业拿出的分红,是以每股固定份额的形式共同分享的企业部分利润。债券的收入收益是事先约定好的利息。
如果对收入收益进行比较,就会发现股票是有风险的,而债券是相对安全的。这是因为股票的分红要受到企业业绩的影响,充满了不确定因素,而债券的利息是事先约定好的,相对稳定可靠。也就是说,购买债券在绝大多数情况下可以拿到利息作为回报,其最小利润值是正数。与之相对,购买股票则可能面对零分红甚至亏本的风险。因此,从最大最小准则的视角出发,与购买股票相比,购买债券是更为合理的选择。
当然,如果发行债券的公司破产或违约,投资债券也可能血本无归。因为国债是国家发行的债券,所以购买国债几乎不会面临发行方“破产”的风险。但是,曾经发生的希腊债务危机表明购买国债也会面临一定的风险,需要大家特别注意。
此外,在20世纪末开始流行的金融衍生品[1]中,期权等是明确规定了最小损失值的金融产品。比如以股票作为标的物的看涨期权[2],投资者购买的就是约定期限内拥有买入相应股票的权利。如果股票的价格上涨,那么投资者就可以行使权利买入,如果股票价格下跌了,那么他也可以放弃购买的权利。在放弃买入时,他损失的只是购买期权时抵押的保证金。在这种情况下,最大损失值是固定的。可以说,这种新型金融产品为信奉最大最小准则的人提供了更为广阔的投资空间。
最大最小准则是过于保守的选择方法吗?
使用最大最小准则的优点在于不必过多考虑各种情况。使用最大最小准则,无论是客观上还是主观上,都不用在意如何去分布概率。第二章中曾经提到过,分布概率本身是非常烦琐的。从某种意义上讲,如果可以规避这个环节,那将是一种非常经济实惠的做法。
如果再往深一点看,使用最大最小准则甚至于不用再逐个思考各种基本事件(参照前文)了。比如在追求利润的情况下,除了利润最小的情况以外,只要认定“所获利润比最小利润大”,就不用再去认真考虑“具体大多少”的问题了。这样一来,就可以大幅削减由于思考而耗费的时间和精力。
但是,从另一个角度来看,这里列举的优点可能也是缺点所在。最大最小准则是一种过于保守的准则。不管怎样,这种准则将关注的焦点全部集中在了最差局面上,根本不在乎除此以外的其他利润(或损失)。因此,可以说,这是一种片面的、极端的判断。
比如有两种彩票,一种是“99%的情况下可以中10万日元,1%的情况下只能中1万日元”,另一种是“99%的情况下可以中3万日元,1%的情况下只能中2万日元”,如果依照最大最小准则,我们应该选择后者,因为前者的保底值是1万日元,后者的保底值是2万日元。
然而,如果冷静地思考一下,你就会发现“选择前者的话有很大概率可以获得10万日元的收益,而选择后者的话最多只能获得3万日元的收益”,这才是更为合理的逻辑。之所以选择前者,是因为担心出现发生概率极低的最差局面:只拿到1万日元的收益。但就是因为做出这种选择,才忽视了有很大概率可以获得的10万日元的收益,可谓是“捡了芝麻,丢了西瓜”。
此外,如果完全根据最大最小准则做出判断,就会出现“无论如何也不会乘坐可能发生死亡事故的交通工具”的情况。在这种情况下,人们会丧失理性思考的能力,根本不去求证乘坐交通工具导致死亡事故的概率到底有多大,而是彻底放弃乘坐交通工具。
上文列举的两个选择是非常偏激的,根本谈不上合理。从这一点来看,最大最小准则是存在缺点的。
“风险”和“不确定性”之间的差异
上文探讨了最大最小准则的缺点,从中可以发现这一准则适用于概率不明的状况。
正如第二章所述,客观概率分布适用于“基本事件具有数学对称性的数学概率”或者“通过多次观测掌握统计性频率的统计概率”。然而,在现实生活中,我们面对的许多事件往往既缺少对称性,又无法掌握统计性频率。
比如在启用新技术时,人们根本不了解其诱发事故的概率。如果让我说对于日本人而言刻骨铭心的教训,那就是核电站事故了。在真正发生事故之前,人们根本无法搞清核泄漏造成放射性污染的概率到底有多高。下面,再举一个生活中更为常见的例子,在向市场投放新产品时,我们几乎无法预测消费者对这种产品感到满意的概率的具体数值是多少。又比如政府在施行某项政策时,根本无法想象其将会给国民行为带来怎样的变化,也无法预测国民采取各种行为的概率。
当然,关于这种情况,如果非要去做,也可以实施主观概率分布。但是,我们面对的事件越新,可用于推测的材料就越少,有时甚至于凭主观也难以实现概率分布。
从专业术语的角度来讲,人们将这种凭主观也难以分布概率的状况称为奈特氏不确定性[3]。这里所提到的奈特来自著名经济学家弗兰克·奈特的名字。弗兰克·奈特将可以分布概率的状况称为风险(risk),将无法了解概率的状况称为不确定性(uncertainty),并对两者进行了明确的区分。不仅如此,奈特还主张将许多与经济交织在一起的状况归为“不确定性”。
可以说,在面对奈特提出的不确定性的情况下,使用最大最小准则是合情合理的。关于奈特氏不确定性的内容,下文中还将多次提到。
通过“博弈论”选择最合适的行动方式
最大最小准则最早出现在人们的视野当中是在博弈论领域。
博弈论最早是由数学家约翰·冯·诺依曼[4]和经济学家奥斯卡·摩根斯特恩[5]在著作《博弈论与经济行为》中首次提出的。在当时,博弈论是一种全新的数学理论,影响极为深远。这一理论将人类的行为全部视为游戏,并从战略博弈的视角出发对其进行论述说明。在正式提出后的70多年间,博弈论发挥着重要的影响力,不仅在数学领域影响深远,还在生物学、统计学、政治学等多个领域掀起了一场创新风暴。
在博弈论中,博弈是由“玩家可以自由选择的行为”和“与所有玩家分别选择的行为相对应的每位玩家的收益”构成的。可以说,这是从社会上存在的纷繁复杂的各种博弈或者带有博弈色彩的事物中,抽象剥离出本质性的内容,并进行归纳总结的精髓。在这一基础上提出的博弈论是对各种玩家应该选择怎样的行为进行阐释的理论。
在决定应该选择怎样的行为时,玩家要面对一个非常棘手的问题,那就是每位玩家的收益并不仅仅是由自己选择的行为决定的,还要受到其他玩家所选行为的影响。如果玩家一个人的行为就能决定自己收益的大小,那么自然应该选择对自己而言收益最大的行为。但是,如果考虑到其他玩家的行为会对最终收益造成影响,每一名玩家就必须认真思考其他玩家究竟会采取怎样的行为,并做出有针对性的决策。
令人感到困扰的是,这一理论同样适用于其他玩家。其他玩家也要思考自己之外的玩家会采取什么样的行为。这样一来,各位玩家之间就会交织产生“相互依赖”的复杂关系。因此,在这种环境下,想要明确每位玩家应该采取的行为绝非一件易事。博弈论的难度可想而知。
零和博弈[6]的机制
由冯·诺依曼和奥斯卡·摩根斯特恩最先提出的博弈,本质上是指两个人的零和博弈。顾名思义,在这一理论中,两个玩家展开博弈时,无论哪一方取胜,他们的收益总和始终都是零。也就是说,如果一位玩家的收益是x,那么另一位玩家的收益必定是-x。可以说,这是博弈当中最为简单也是最为典型的基本机制。一般来说,两支球队的体育比赛大都是典型的零和博弈。
为了更好地理解零和博弈,下面将举一个具体实例进行说明。
假设有两支队伍参加比赛,分别是队伍1和队伍2。我们将这两支队伍的比赛视为博弈。每支队伍只能从三种策略(上场队员、阵形、防守和进攻战术等综合在一起形成的方案)中选择一种。队伍1从a、b、c中选择一种,队伍2从d、e、f中选择一种,并运用所选策略进行实际比赛。这样一来,共有九种策略与得分组合。把这九种组合以表格的形式列出来,我们可以了解队伍1在各种策略组合下能够得到的分数(或得失分差),如表3-1所示。
比如当队伍1选择策略a、队伍2选择策略d时,如表3-1所示,队伍1可以得到4分,根据零和博弈理论,队伍2的得分自然是-4分。
此外,当队伍1选择策略b、队伍2选择策略d时,如表3-1所示,队伍1的得分是-3分,与之相应,队伍2的得分就是3分。
那么,在上述机制下,两支队伍究竟应该采取怎样的策略呢?下面,我们将根据博弈论理论,分析参赛队伍的心理,并进行论述。
如果静下心来思考一下,就会切实地感受到这是一个非常棘手的问题。如表3-1所示,队伍1肯定希望获得尽可能多的分数,因此拼命想扩大这一数字。与之相对,队伍2则希望这一数字越小越好。然而,由于彼此是竞争对手,要想同时满足双方的愿望,不另辟蹊径,采取特殊的解决方式是根本办不到的。
也就是说,假如队伍1单纯想拿到表中所列举的最大得分4分,那么队伍1应该选择策略a。但是,这种想法的目的性太过明显,很容易被队伍2猜透。如果队伍2提前判断到队伍1会选择策略a,那么队伍2肯定会有针对性地选择策略f。这是因为在队伍1选择策略a的前提下,队伍2选择策略f时可以得到2分(根据表3-1,当队伍1选择策略a而队伍2选择策略f时,队伍1的得分为-2分)。
但是,对于队伍2的这种想法,队伍1肯定也能猜到。如果队伍1提前预测到队伍2可能会做出这样的判断选择策略f,那么队伍1可能就会将计就计选择策略b,拿到3分。虽然这一得分比队伍1能够得到的最高得分4分少1分,但是在这种局面下,也属于上上之选了。
然而,队伍2也可能会猜到队伍1这种“以退为进”的策略,从而有针对性地选择策略d。就这样双方不停地斗智斗勇,最终会陷入无休止博弈的死循环。那么,冯·诺依曼和奥斯卡·摩根斯特恩是如何摆脱这个陷阱束缚的呢?
冯·诺依曼和奥斯卡·摩根斯特恩是这样认为的
为了避免出现上文中提到的陷阱,陷入无休止博弈的死循环,冯·诺依曼和奥斯卡·摩根斯特恩提出了下述思维方式。
由于博弈双方无法确切地掌握对方最终会采用哪种策略,因此应该放弃去猜测对方的选择。在这一前提的基础上,博弈双方决定所选策略的关键在于保底值,即选择某一行为时,最低能保证多少收益。
也就是说,两支队伍应该使用最大最小准则作为选择策略的标准。
下面,我将结合前文中提到的两支队伍的比赛进行具体说明,如表3-2所示。
首先,我们试着从队伍1的立场出发思考问题,探讨队伍1是否应该选择策略a。在这种情况下,队伍1的分数自然会受到队伍2所选策略的影响。队伍2选择策略d、e、f时,队伍1选择策略a的得分分别为4分、-1分和2分,其中最低得分是-2分。因此,-2分就是队伍1选择策略a时的保底值,也就是保底分数。同样,当队伍1选择策略b时,保底值是-3分;选择策略c时,保底值是1分。在三个保底值中,最大的是1分。因此,对于队伍1而言,“选择策略c时,最差也能得1分”。换言之,队伍1“如果想达到1分的保底值,就应该选择策略c”。
其次,我们试着从队伍2的立场出发思考问题。对于队伍2而言,将表中数字的正负号颠倒过来,就是队伍2所得到的分数。因此,队伍2希望表中的数字越小越好。如果队伍2选择了策略d,那么队伍1选择策略a、b、c时,队伍2的得分就分别是4分、-3分和3分的相反值,即-4分、3分和-3分,其中最大失分就是4分。也就是说,不会有比-4分更少的分数。有鉴于此,4分就是队伍2选择策略d时的保底值。同样,在选择策略e、f时,队伍2的保底值分别是1分和3分。
因此,希望从表中选出的数字越小越好的队伍2,肯定会选择策略e。换言之,队伍2将不得不选择1分的失分(也就是-1分的得分)作为保底值,从而选择策略e。
在这种情况下,队伍1的目标是拿到保底值1分,队伍2的目标是拿到最少失分,也就是得-1分。可以说,双方的想法达成了一致。因此,当队伍1选择策略c、队伍2选择策略e时,双方都拿到了自己想要的1分和-1分,这种状况就是冯·诺依曼和奥斯卡·摩根斯特恩所提倡的博弈的结果,也就是所谓的均衡状态。
在这一分析过程中,作为比赛对手的两支队伍并没有只选择对于自己而言最有利的策略,而是将对方的利益得失纳入计算范围,并在此基础上做出了决策。另一方面,如果太在意对方的行为,自己的选择总是随着对方而改变,就会陷入无限循环的陷阱,影响最终的决策。如果两支队伍都能秉承“设想最差局面,并在这一条件下谋求最大利益”的理念,就可以避免出现无限博弈的死循环。
在这种情况下,我们将队伍1的保底值的最大值1称为最大最小值,将队伍2的失分保底值的最小值1称为最小最大值。冯·诺依曼和奥斯卡·摩根斯特恩提倡的博弈结果(均衡)就是这种最大最小值与最小最大值一致的行为组合。
按照混合概率选择行为
如上文所述,在冯·诺依曼和奥斯卡·摩根斯特恩提出的零和博弈的均衡状态下,博弈双方所选行为实现了各自的最大保底值。
但是,这里存在着一个不容忽视的问题——这种均衡并不是一种常态。
比如在“石头剪刀布”的游戏中,假设获胜方得1分,失利方得-1分,不分胜负(打平)时双方各得0分。在这种情况下,玩家A无论出剪刀、布、石头中的哪一个,其保底值都是-1分。因此,保底水平的最大值就是-1分。与之相对,玩家B的保底值就是1分。由此可见,双方的保底值是无法达成一致的(最大最小值=最小最大值)。这是因为一方失利,就意味着另一方取胜。
针对这种情况,冯·诺依曼和奥斯卡·摩根斯特恩提出了“按照混合概率选择行为”的理念。也就是说,玩家在选择时,并不仅限于单纯选择“石头”“剪刀”“布”,而是可以按照不同的概率组合选择出招的策略。比如采用“按照各0.5的概率选择出剪刀和石头”或者“按照0.6、0.3和0.1的概率组合,选择出石头、剪刀和布”等策略出招。在使用这种混合概率出招时,玩家的得分自然也就不同了。
比如玩家A和B都选择“不出布,分别按照0.5的概率出剪刀和石头”的策略时,玩家A得1分、玩家B得-1分的概率为0.25(A出石头的概率×B出剪刀的概率),与之相反,玩家A得-1分、玩家B得1分的概率也是0.25。双方各得0分的概率是0.5(A出石头的概率×B出石头的概率+A出剪刀的概率×B出剪刀的概率)。
在这种情况下,如果不明确规定如何计算玩家的得分,就无法实施具体分析。因此,冯·诺依曼和奥斯卡·摩根斯特恩就决定运用第二章中提到的期望值(概率的平均值)来解决实际问题。比如针对前面的例子,经过计算后,每位玩家的得分都是1×0.25+(-1)×0.25+0×0.5=0。
顺便提一下,在实际运用“不出布,分别按照0.5的概率出剪刀和石头”的策略组合时,其本身是不均衡的。这是因为当玩家A使用这一策略时,如果玩家B选择“只出石头”的策略,那么玩家A面对的结果“除了输就是平”,其得分的期望值就是负数。这样一来,A的保底值就变成了负数,而不是0。
在猜拳游戏中按照固定套路出招是非常不利的
冯·诺依曼和奥斯卡·摩根斯特恩提出这一概率组合行为的理论,证明了无论哪种形式的两人零和博弈,最终都存在一个均衡状态。比如在猜拳游戏中,如果两位玩家都采用“按照各1/3的概率,选择出石头、剪刀、布”的策略,那么双方就处于均衡状态了。这是因为玩家A选择这种策略后,不管玩家B选择怎样的概率组合,A的期望值始终是0。也就是说,A的保底值是0。此外,在使用其他概率组合的情况下,必然会出现选择“石头”“剪刀”和“布”中某一个选项的概率高于其他选项的情况。比如,如果一方出“石头”的频率较高,那么另一方出“布”的概率就会相应增大,这样一来,其期望值就会变为负数。由此可见,除了“按照各1/3的概率,选择出石头、剪刀、布”的策略以外,其他概率组合的保底值均为负数。因此,玩家A的最大保底值就是“按照各1/3的概率,选择出石头、剪刀、布”时的数值。同理,玩家B的情况也是如此。
这一结果与我们日常生活中的直观感受是一致的。众所周知,在玩猜拳游戏时,出拳带有一定倾向性的一方,往往会输掉比赛。这是因为如果出拳的习惯容易被对方猜透,就会陷入不利的局面。有鉴于此,无论是从现实来看还是从理论来看,“按照各1/3的概率,选择出石头、剪刀、布”的策略都是猜拳游戏中依据最大最小准则制定的策略。这一结果非常有趣,值得大家玩味。
夏洛克·福尔摩斯与詹姆斯·莫里亚蒂
在柯南·道尔的著名侦探小说《夏洛克·福尔摩斯探案集》中,有一篇叫作《最后一案》(收录在《夏洛克·福尔摩斯回忆录》中),描写了福尔摩斯被宿敌詹姆斯·莫里亚蒂围追堵截的场景。当时,福尔摩斯几乎被莫里亚蒂所杀。他从维多利亚车站乘坐开往多佛的火车,准备逃往欧洲大陆。在火车即将驶离车站的瞬间,莫里亚蒂出现了,两个人四目相对。福尔摩斯预判了莫里亚蒂准备启用特快专列提前抵达多佛设伏的计划,于是在火车经停的坎特伯雷提前下车。这样一来,福尔摩斯就完美地躲过了莫里亚蒂乘坐的特快专列的奔袭追赶。
福尔摩斯经常利用自己的创造性思维解决问题。但是,这次在坎特伯雷提前下车的做法真的就是最佳选择吗?这是一个值得深思的问题。因为如果莫里亚蒂也看穿了“福尔摩斯想在中途下车”的想法,那福尔摩斯就只能束手就擒了。冯·诺依曼和奥斯卡·摩根斯特恩在《博弈论与经济行为》一书中也提到了这一问题。他们认为从博弈论的角度来看,福尔摩斯的判断(柯南·道尔在小说中描写的情节)是不合适的。他应该选择的策略是“乘车一直坐到多佛”和“在坎特伯雷提前下车”的概率组合。下面,我们来看一下他们的分析,如表3-3所示。
表3-3 下车地点组合的莫里亚蒂的收益值表
他们将福尔摩斯、莫里亚蒂双方较量的战场设定在特定的博弈框架内。
表3-3是从莫里亚蒂的视角出发总结出的损益得失表。无论是莫里亚蒂还是福尔摩斯,都有两种行动方案可以选择,分别是“在多佛下车”和“在坎特伯雷下车”。如果双方在同一车站下车,莫里亚蒂就能实现自己的阴谋,成功拦截并杀害福尔摩斯。因此,在这种情况下,莫里亚蒂的收益值是100,而福尔摩斯则相反,收益值为-100。与之相对,如果莫里亚蒂在坎特伯雷下车,而福尔摩斯在多佛下车,那么福尔摩斯就可以从多佛前往欧洲大陆,从而顺利逃亡。因此,在这种情况下,莫里亚蒂的收益值是-50,而福尔摩斯的收益值是50。此外,如果福尔摩斯在坎特伯雷下车,而莫里亚蒂在多佛下车,那么莫里亚蒂虽然无法抓住福尔摩斯,但是可以阻止他逃往欧洲大陆。因此,从这个角度来看,双方打了个平手,各自的收益值均为0。
如表3-3所示,关于莫里亚蒂的保底值,在多佛下车时为0,在坎特伯雷下车时为-50,因此其最大保底值为0。另一方面,关于福尔摩斯的保底值,在多佛和坎特伯雷下车时均为100,因此最小值为100。由此可见,两者之间的保底值是不一致的,无论采取哪种行动组合,都无法实现博弈均衡。但是,即使面对这种局面,只要能够合理采用概率组合的方式,依然可以实现均衡。关于这一点,或多或少会引起争议,下面,我将试着进行论证。
福尔摩斯究竟应该怎么办?
我们先从结论开始说起。按照最大最小准则,莫里亚蒂应该采用的策略是“按照0.6的概率在多佛下车,按照0.4的概率在坎特伯雷下车”;按照最大最小准则,福尔摩斯应该采用的策略是“按照0.4的概率在多佛下车,按照0.6的概率在坎特伯雷下车”。也就是说,在这一策略下,福尔摩斯应该准备10张纸,在其中的4张纸中写上多佛,在剩余的6张纸中写上坎特伯雷,然后,将这10张纸混合在一起,从中随机抽取1张,作为自己最终的决定,可以说,这是一种均衡的策略。
下面,我们将对这一结论进行分析论证。
为了更加具体直观地进行说明,我们假设莫里亚蒂在多佛下车的概率为0.1,在坎特伯雷下车的概率为0.9。然后,在这一条件下,尝试计算保底值,如表3-4所示。对此,我们只要从福尔摩斯的策略中,选择对于莫里亚蒂而言最差的一组即可。
假设福尔摩斯在多佛下车的概率为p(与之相应,在坎特伯雷下车的概率自然就是1-p),那么,针对四种结果,出现的概率具体如表3-4所示。
表3-4 莫里亚蒂的收益值表
这样一来,莫里亚蒂的收益的期望值(基于概率计算的平均值)就等于概率乘以收益值相加之和:
0.1×p×100+0.1×(1-p)×0+0.9×p×(-50)+0.9×(1-p)×100=90-125p
由此可见,福尔摩斯在多佛下车的概率越大,莫里亚蒂的收益的期望值就越小。也就是说,对于莫里亚蒂而言,福尔摩斯在多佛下车的概率为1时,其承受的损失是最大的,此时的保底值最小,为-35(90-125)。
下面,我们再计算一下莫里亚蒂在多佛下车的概率为0.9,在坎特伯雷下车的概率为0.1(与刚才的情况正好相反)时的期望值:
0.9×p×100+0.9×(1-p)×0+0.1×p×(-50)+0.1×(1-p)×100=10+75p
在这种情况下,福尔摩斯在多佛下车的概率越小,则莫里亚蒂的收益的期望值就越小,因此,当p=0时,保底值最小,为10。
有鉴于此,莫里亚蒂的保底值变化情况,具体如图3-1所示。
图3-1 莫里亚蒂的保底值变化情况
只要观察一下,就会发现莫里亚蒂的保底值是随着在多佛下车的概率而变化的,当概率从0增加至0.6时,保底值也随之增大,当概率大于0.6后,保底值开始持续下降。因此,莫里亚蒂的最大保底值就是在多佛下车的概率为0.6时计算得到的数值。也就是说,莫里亚蒂按照最大最小准则应该采取的策略是“按照0.6的概率在多佛下车,按照0.4的概率在坎特伯雷下车”。
关于福尔摩斯按照最大最小准则应该采取的策略,也可以按照相同的思路来考虑,如图3-2所示。
图3-2 福尔摩斯的保底值变化情况
到此为止,我们对最大最小准则的阐述就告一段落了。正如广大读者读过上文之后所感受到的那样,最大最小准则在不知不觉间影响着人们的日常生活,发挥着重要的作用。此外,关于使用最大最小准则的有效性和合理性,也有着充分的依据支撑。尤其是在深入研究冯·诺依曼和奥斯卡·摩根斯特恩对零和博弈理论分析的基础上,无论是从行为选择的合理性来看,还是从数学必然性的视角来看,这一准则都是正当、合理的。
因此,我衷心希望读者有意识地使用或规避最大最小准则,从而灵活掌握更富战略性的行动指针,在日常生活中处理复杂问题拥有更为可靠的决策依据。
[1]金融衍生品(derivatives)是一种金融合约,其价值取决于一种或多种基础资产或指数,合约的基本种类包括远期、期货、掉期(互换)和期权。
[2]看涨期权(call option),又称认购期权、买进期权、买方期权、买权、延买期权或“敲进”,是指期权的购买者拥有在期权合约有效期内按执行价格买进一定数量标的物的权利。
[3]奈特氏不确定性(Knightian uncertainty)指无法被衡量、不能被计算概率的风险,由经济学家弗兰克·奈特提出。在奈特的成名作《风险、不确定性与利润》中,他为风险与不确定性做出定义,主张风险是能被计算和评估的,而不确定性是无法被预先计算与评估的。此外,他还提出利润是来自不确定性的论点。
[4]约翰·冯·诺依曼(John von Neumann,1903—1957),美籍匈牙利数学家、计算机科学家、物理学家,是20世纪最重要的数学家之一。冯·诺依曼是布达佩斯大学数学博士,现代计算机、博弈论、核武器和生化武器等领域的科学全才之一,被后人称为“现代计算机之父”“博弈论之父”。冯·诺依曼先后执教于柏林大学、汉堡大学、普林斯顿大学、普林斯顿高等研究院,曾担任美国原子能委员会会员、美国国家科学院院士。冯·诺依曼早期以算子理论、共振论、量子理论、集合论等方面的研究闻名,开创了冯·诺依曼代数。第二次世界大战期间,冯·诺依曼参与曼哈顿计划,为第一颗原子弹的研制做出了贡献。1944年,冯·诺依曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》。这是博弈论学科的奠基性著作。冯·诺依曼晚年转向研究自动机理论,著有对人脑和计算机系统进行精确分析的著作《计算机与人脑》(1958年),为研制电子数字计算机提供了基础性的方案。
[5]奥斯卡·摩根斯特恩(Oskar Morgenstern,1902—1977),德国-美国经济学家,曾长期在维也纳大学讲授经济学。1938年纳粹德国吞并奥地利后,摩根斯特恩被迫离开奥地利来到美国,1944年加入美国籍。他在普林斯顿大学教经济学,并在那里度过了他的后半生。他热心于将数学应用于经济学,更广义地说,应用于人类的各种战略问题,以便获得最大收益和尽可能地减少损失。他认为这些原理也同样适用于哪怕简单得像抛掷硬币这样的游戏,因而提出了博弈论。
[6]零和博弈(zero-sum game),又称零和游戏,是博弈论的一个概念,与非零和博弈相对,属非合作博弈。它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。