许多休闲游戏(recreational games)都是能力和机会的组合。能力是能提升的,但机会就与运气有关了。对于这里讨论的所有“游戏”,你会很容易相信它们是有限多个结果,并且它们都是等可能的。因此在这一章中,除非明确声明,我们都会使用处理概率的经典方法:计算可能结果的个数,任何事件的概率就是它们发生的结果占总结果数的比例。
我的目标是展示在不确定性存在的情况下,概率能如何帮助一个玩家做出正确的选择。观众对概率的理解也会增加观赏游戏的享受和乐趣。
彩票
在英国国家彩票中,最常见的模式是6/49。涂有不同号码的49个橡胶圆球在塑料桶中被搅拌打散,然后随机选择出6个来。赌博者花费1英镑来选择6个号码,如果这个选择中包含了至少3个中奖号码,他们就会赢得奖金。但是因为只有50%的彩票收入会成为奖金,彩票玩家平均收入的值远低于赌场赌博或者赛马。
彩票对人们的主要吸引力是巨额的中奖预期,虽然它们很难得到——曾有一张英国彩票开出2200万英镑的大奖,美国彩票的奖额已经超过了3亿美元。计算可知,用一张彩票中得头奖奖额的概率,在英国大约是1/14 000 000,在欧洲百万彩(the Euromillions Game)中小于1/116 000 000,在美国超级百万(the USA Mega Millions)中大约是1/176 000 000。
为了体现这些概率到底有多么小,我们单看英国彩票。实际上,一个随机选出的40岁男子在一年内死亡的概率是1/1000。所以他在一天中死亡的概率是大约1/365 000,在一小时内死亡的概率是1/9 000 000,所以概率低到1/14 000 000表示的就是他在接下来的35分钟内死亡的概率了!对于美国超级百万彩票来说,在相同的假设下,这名男子中得头奖的概率和他在接下来3分钟内死亡的概率几乎相等。
尽管有极低的回报和几乎没有的赔率,“效用”能够给出买彩票行为的合理解释。用1英镑作为交换,无论如何你都会得到平均50便士,另外50便士你就用来买了梦想未来奢侈生活的权利、做了慈善事业,还有像我一样确信你在浪费钱的人的潜在的羡慕。这些权利的确算是一些效用。
我们应该假设未来的彩票开奖结果和先前的结果是相互独立的——一个无生命的橡胶球不会“记住”它是否“应该”被抽中。除了作弊,没有任何方法能够改变中奖的概率。但是你的确可以影响你可能获得的奖额的大小,因为在这些彩票规则中,奖池确定比例的部分会在每个奖励等级中被相应的中奖者们平分。我们有了一个训练某种能力的机会。
某些很小或特别的确定的数字(例如生日)会比其他数字更经常被选择,并且许多彩票玩家将自己的选择平均分配到自己买的彩票中,可能是误认为这么做就进行了“随机”选择。结果就是,几个较大数字,或者相距不远的一串数字,或者边缘的数字,比较不经常被选择。如果你能够确定其他的玩家做出了什么类型的选择,并且做一些不同的选择,你中奖的概率不会受影响,但是一旦你中奖了,你就会赢得比平均值更多的奖金。
别基于“没有其他人会想到这个”耍小聪明,例如选择{1, 2, 3, 4, 5, 6},或者选上次开奖时候的中奖号码。他们的确会想到。在英国国家彩票首次开奖的时候,大约10 000人选择了前6个数字。在2009年9月,相邻两次保加利亚彩票的中奖号码完全相同:第一次没人选那个号码,但第二次就有18个人选了。
已知其他玩家会像他们以前做的那样继续频繁地选择他们特定的号码,对于英国的6/49类型的彩票来说,下面的过程会帮到你。取普通的52张一副的纸牌然后去除3张。将剩下的纸牌与数字1到49一一对应,洗好牌,然后抽取6张纸牌。这是一种完全随机的抽取6张纸牌的方法。人类不可能不借助外物进行这种随机选择,我们需要这类辅助。
然后对于这6张牌,作如下规定:
(a)它们加在一起至少达到177(为了偏向较大数字);
(b)在写在彩票上的时候,它们分成了2、3、4或者5个集群;
(c)它们中有3、4或者5张的值落在彩票数值的边缘上;
(d)它们不会在彩票上形成任何明显的规律。
如果其中任意一个条件不被满足,就将这6张纸牌放回牌堆,彻底地洗一遍牌,然后重复这个过程。
即使你遵循这个秘诀,你仍然预期会输钱——因为全部的回报只占彩票公司收款的50%这个事实是没法克服的。但是这样你就不太可能同整个世界分享你的头奖了。
电视游戏
“黄金球”(Golden Ball)在2007年首播。最后两位玩家会面对11个金球,其中一些对应一些奖额,另一些叫杀手球,不对应任何奖额。玩家从中选取5个球,生成潜在奖金,选中的任何杀手球会将之前选取的球代表的金额减小到原来的1/10。因此在选取了一个50 000英镑的球之后再取两个杀手球就会让奖额变成500英镑。
所有的球表面上看起来都是一样的,所以玩家完全是随机选择。从11个物体中选取5个一共有462种方式,所以从中选取到5个最有价值的球的概率就是1/462。在最初的288期节目中,这只发生过1次。
假设一个球名义上价值1000英镑:即使不考虑杀手球,选中它的概率也只有5/11,所以它的真实的价值就是455英镑。选取任意杀手球都会降低总奖额——在有3个杀手球的情况下,平均值的计算结果是255英镑。
当选取完5个球,实际的奖金已经知道的情况下,两个玩家都会做出一个彼此保密的决定,或是将自己的奖金分享给另一个玩家,或是夺取所有的奖金。他们俩会同时公布他们的选择:如果都选了分享,那么两个人分享奖金;如果其中只有一个选择了夺取,这名玩家就会获得所有奖金;如果两个人都选了夺取,两个人都不会得到任何奖金。
这是在博弈论中非常著名的一个情景,它被称为“囚徒困境”(the Prisoner’s Dilemma)。假设你的对手选择了分享,那么你选择夺取就会获得较多的钱。如果你的对手选择了夺取,你怎么选都无所得。所以无论另一个人选择什么,你可以说选择夺取就永远不会输。经常发生的情况是,两个人都选了夺取,那么唯一的赢家就是不出任何钱的电视节目制作公司。
不同版本的“成交与否”(Deal or No Deal)已经在70多个国家播放。在英国,22个密封的盒子装有从1便士到250 000英镑不等的钱。这些盒子被随机分配给22个玩家,其中一位叫艾米的玩家将会在这一天参与游戏。她自己的盒子直到游戏结束都一直是关着的。她首先选择5个其他的盒子,之后盒子中的金额会被展示出来。庄家这时会出价来交换艾米的盒子中的金额。要是接受的话,她说“成交(Deal)”,则游戏结束;说“不成交(No Deal)”,则拒绝这个出价。若游戏持续进行,更多的盒子会被打开,庄家会开出新的出价,等等。
出价时,仍在游戏中的确切金额是已知的,所以他们的平均值是很容易计算的。在最初的几轮中,正常情况下庄家的出价会远远小于这个均值,但是艾米必须将她自己的效用函数牢记心上:如果她十分想要5000英镑,而出价是4500英镑,她就应该理智地接受,即使剩余盒子的平均金额超过20 000英镑——如果坚持不成交的话,她可能最后只得到1便士。
22次中有1次,艾米会被分到最高金额的盒子,但是她很少会赢得那么大的金额。效用可以给出一个令人信服的解释。在最后一次决定中,剩下两个盒子,其中一个是250 000英镑,另一个也许是2英镑。如果庄家出价80 000英镑,虽然这比均值125 001英镑小很多,也只有最有勇气的或者最富有的艾米才会拒绝。千鸟在林,不如一鸟在手……
已知庄家总是会给比剩余的盒子的平均金额少的出价,长远地看大数定律保证了“成交”的选手获得的金额比他们盒子中的少。所以庄家的确会支付出价,但是也会在选手成交之后获得盒子中的金额,就会长远地获利。
“金钱本色(The Color of Money)”被认为是最令人紧张的电视节目,它在2009年只播出了4期。但是它给出了计算概率过程中应用加法和乘法定理的极好的例子。
1000英镑、2000英镑,一直到20 000英镑被随机分配到20个不同颜色的盒子中,玩家葆拉要达到一个预先设定好的目标金额,例如64 000英镑。为了达到这一点,她可以选择至多10个盒子,一次选一个。如果她(不知情地)选择了14 000英镑的盒子,1000英镑、2000英镑,一直到14 000英镑的数字就会以稳定的速度在屏幕上变换,每显示一个数字她都可以叫停。如果她及时叫停了,就会积累下最后显示出来的那个数字,但如果她等得太久,就什么都攒不下。如果在选取了10个盒子之后,她还是没有达到既定目标,她就什么都赢不到。她应该采用什么策略呢?
除了颜色,所有的盒子都是相同的,所以葆拉从每一轮中剩下的盒子中做选择是完全随机的。在她的最后一轮中,剩下了11个盒子,她的策略显而易见:例如,如果她想要9000英镑来达到目标,而且恰好6个盒子价值9000英镑或者以上,她就会计划在9000英镑出现时叫停,她成功的概率是6/11。但是在早期的几轮中她应该怎么办呢?
或在还有两轮的时候,剩下的12个盒子装有(以1000英镑为单位)1、4、5、6、9、10、12、13、15、17、19、20,而她需要额外的15 000英镑。当她看到7000英镑时叫停是不合理的;如果7000英镑曾经出现过,她就知道这时候盒子中至少有9000英镑,所以她就应该在9000英镑时叫停,显然这是更好的策略。她也可以将自己的选择限制在这剩下的12个数字中。相同的论证也同样适用于早前的几轮中——她叫停的最佳时机总是在剩下的某一个盒子里的金额出现的时候。
如果葆拉的确想要在9000英镑出现的时候叫停,她可以这么说:“12个盒子中有8个至少有这么多,所以我成功的概率就是8/12。而且如果我这轮的确成功了,在最后一轮中我只需要6000英镑,这时候11个盒子中有8个是我想要的。乘法定理告诉我们这两件事情同时发生的概率是(8/12) × (8/11) = 64/132。第一轮中有4个盒子的金额少于9000英镑,所以第一轮我什么都得不到的概率是4/12;这时我在最后一轮中就需要15 000英镑了,这个概率是4/11。再一次根据乘法定理,这种情况的概率是(4/12) × (4/11) = 16/132。这两个胜利是互斥的,所以加法定理告诉我们胜利的总概率是80/132。”
她也可以对她其他的选择策略进行相似的分析,例如在第一轮中期待6000英镑或是12 000英镑。我请你来做这些计算——附录中描述了她的最佳选择。
在这个电视节目的筹划阶段,有人出过一个主意,请一位专业数学家来提供及时的策略建议。葆拉可能会讲她会在8000英镑的时候叫停,这名专家也许会说:“这个选择不错。如果你这么做了,你赢钱的概率就是75%。但是如果你计划在11 000英镑的时候叫停,你的成功概率就会是80%。”
你可以想到会发生什么!专家说得都是对的,但如果葆拉更改了策略,却最终失败了,同时的确她最初的直觉会奏效。就一定会有一些小报叫嚷:“数学研究员夺走了军事英雄遗孀的64 000英镑。”
在我们调查过电视游戏节目中的数学之后,得知他们从未引入过数学角度建议员,我们都松了一口气!
纸牌游戏
大数定律意味着我们会在长时间的游戏中公平地得到好牌或者坏牌,所以最终游戏结果展现的是能力水平。我们来看3种流行的纸牌游戏。
在“二十一点”中,庄家必须遵循关于何时发牌的固定规则,玩家想做什么就做什么。直到爱德华·索普(Edward Thorp)开始赢得数额巨大的赌金之前,赌场运营者们都相信没有任何其他系统能够击败他们内在的优势。他们的逻辑中存在一个致命的瑕疵:虽然他们可以期望在牌堆中有6或者8副牌的时候赢得奖金的1%~2%,但是几局过后局面可能会转向对玩家有利。赌场忽略了使用剩下的牌的条件概率,而只考虑到了由完整的牌堆计算得到的概率。
索普开发出了一个追踪牌堆中剩余牌的方法。当数值较大的牌占比较高的时候,可能规则会变成强迫庄家抽牌,最终导致其点数超过21点而爆牌输掉。在相同的情况下,玩家却可以选择不抽牌。只要牌堆中数值较大的牌的比例较低或者适中,索普就会下尽可能小的赌注,而当牌堆组成对他更有利时,他会下更大的注。简单,但是高效。
当牌堆的组成的确对玩家有利的时候,他应该下多少注呢?约翰·凯利(John Kelly)在索普分析研究的几年前给出了精确的答案:下注的资金应该与他的优势大小一样。这个策略会让他资金增长的速率最大。
例如,假设他有1000英镑而且游戏对他有一点点有利——他获胜的概率是51%,失败的概率是49%。他的优势就是2%,所以他下注的比例应该是总资金的2%,即下注20英镑。下一次,他就会有980英镑或者1020英镑,如果他的优势保持在2%,按照出现的不同结果,他应该下注19.60英镑或者20.40英镑。如果他过于贪婪——在凯利指出比例仅2%时下注总资金的10%,尽管他有一定的优势,他最终还是会破产。他的资金是有限的,下的赌注过高以至于不能承受不可避免的失败的趋势。
赌场会采取措施来识别和禁止熟练的数牌者,从来没有人因理解概率的出色能力而获利。
我们注意到,在考察法庭上的证据会如何改变我们相信有罪或无罪的程度时,正确的方法是采用贝叶斯公式。在例如惠斯特桥牌的纸牌游戏中,使用这个规则会提升你做出正确决定的概率。简便起见,我使用法律相关的词汇,用“有罪”来表示一个特定的对手同时持有一组特定的牌,比如说红桃Q和K,同时用“无罪”表示她至多持有这些牌中的一张。
使用计数的方法,我们可以找到她持有全部两张牌的情况占全部情况的比例,这样就会给出对于“有罪”概率的最初评估。按照标准的习惯,最好将这个概率转化成它等效的赔率。最开始的计算完成后,我们可以说我们得到了(有罪的)先验赔率(Prior odds)。
当纸牌游戏进行下去,相关的证据就会浮现出来——但她或许是在耍花招。为了考察这些证据是如何影响“有罪”的赔率的,我们来计算一个叫作似然比(Likelihood Ratio)的量。首先,假定“有罪”(她同时持有K和Q),评估这些证据出现的概率;然后,假定“无罪”(她至多只有其中一张),评估这些证据出现的概率。似然比就是第一个值和第二个值的比值。
我们现在就可以推断出后验赔率(Posterior odds),也就是说在考虑到证据的情况下“有罪”的概率,使用贝叶斯公式,也就是:
后验赔率=先验赔率×似然比
这个定律的形式是清晰直白的:似然比越大(也就是说,你的对手的确是有罪的时候,证据越容易出现),有罪的赔率就越大——但是这个公式精确地告诉你相关证据如何影响有罪的概率。
要看这个理论是如何运行的,来思考一个现实的情况:我们的对手要么是同时持有K和Q(有罪),或者她只持有K(无罪);先验概率告诉我们这些选择差不多是同等可能的。如果她是有罪的你最好就出A牌;如果她是无罪的,你就应该出一些其他的牌。证据这时出现了,她出了K。
如果没有证据,你就只能凭空猜测,而且你也就有一半的概率会赢。如果她是无罪的(她只持有K),那么证据(她出K)出现的概率就是100%;但是如果她是有罪的(她同时持有K和Q),她可能也就会出Q而不是你看到的K,所以证据出现的概率就是50%。这两个数字比值是1/2,所以贝叶斯公式告诉你后验概率就是1/2。也就是说,她无罪(只有K)的可能性是有罪的2倍。所以现在出A就有2/3的概率获胜。
在正确使用概率的情况下,你应该希望能做得更好,如果你能够以2/3的概率获胜,就别以1/2的概率。你不能保证每局都赢,但是这样做你可以提升获胜的概率。
桥牌玩家把这种情况称为“限制选择原则(the Principle of Restricted Choice)”——如果对手只有一张K她就必须打出,如果同时有K和Q,那她可以做选择。她的确打出了K的这个事实,让概率向她不得不这么偏移了。
如今,最流行的扑克的形式是德州扑克[1](Texas Hold Em)。每个玩家发2张牌并且设法使自己手里面的牌被最有效地打出,5张公共牌随后会被陆续发放。公共牌发放之后,为了最有可能击败其余两组牌,哪一组牌是最好的?
手牌A:两张梅花2,黑桃2;
手牌B:黑桃A,方片K;
手牌C:红桃J和10。
这当然是一个陷阱问题:在仔细计算之后,手牌A会以52%的概率击败手牌B,手牌B以59%的概率击败手牌C,手牌C以约53%的概率击败手牌A。所以你就会选择A而不是B,选择B而不是C,但是你同时也会优先选择C而不是A!如果你的对手从这3组牌中选取任何一组,随后你在剩下的牌组中随机选择1组,你都有超过50%的概率获胜。
扑克游戏需要的远远不止概率技巧。你必须对对手有可能持有的牌,以及你什么时候应该虚张声势做出评估。但是有些时候概率十分有用。假设赌注总额是50个筹码,还有1张公共牌等待发放。这时你发现,如果最后一张牌是黑桃,你就能打出同花顺,这样你一定会赢;如果它不是黑桃,你的一个对手就会赢。你应该在游戏中押下更多的筹码吗?
忽略掉你已经在赌注总额中放了多少筹码。重要的是未来的情况。你能看到6张牌的牌面——2张在你手里,4张在桌上的公共牌中。在46张未知的牌中,9张黑桃会让你赢得胜利,其余的会导致失败。在赌注总额已经是50个筹码的情况下,再多付10个筹码来看最终分发的纸牌是值得的吗?再付20个呢?
通过计算得到你一定要多押的x个筹码带来的平均收益(或者损失),你可以得到一个阈值x。它将会从长远角度带来收益。附录中给出了这个问题的答案。
[1] 简称德扑,最流行的扑克衍生游戏之一。