除了主观的、客观的和频率的理解方法,还有其他理解概率的视角。例如,一定要坚持将一个概率对应于某一个数字吗?我们是否可以说一个概率更大,或者一件事情的可信度比另外一件事情更高?我们真的必须提出一组公理——不言而喻的事实——并据此建立一套理论?
许多杰出的作者都认为建立两个独立的理解概率的方法是有用的,一个是可信度,另一个是古典概率。两者应该具有相同的逻辑规律,不自相矛盾,但两者对于概率是如何生成的和被理解的可以不同。任何理论都应该与古典观点一致,基于可重复实验都会给出等可能的结果,所以我们将着眼于这些案例,寻找概率必须遵循的规则。
加法定理
从洗好的牌堆里面取一张牌。我们认为抽到所有牌都是等可能的,所以求出任何事件的概率——例如抽到梅花、黑桃或者A——就是计算这些事件占总事件的比例。我们如何求出两个事件之中的每一个发生的概率呢?
如果两个事件的所有可能结果中没有任何相同,我们称这两个事件是相互排斥(mutually exclusive)或者不相容(disjoint)的。“抽到黑桃”和“抽到梅花”这两个事件是不相容的,但是“抽到黑桃”和“抽到A”这两个事件不是,因为“抽到黑桃A”同时属于这两个事件。当两个事件互斥,这两个事件中任何一个发生的结果总数就是其分别发生的结果数之和,所以我们有一个简单的结论:
当两个事件互斥时,至少一个事件发生的概率是两个事件各自发生概率的和。
这就是概率的加法定理(the Additional Law)。它显然适用于所有我们能够以古典视角观察的试验:用袋子中的球作类比,这个定理可以被理解为抽中红或蓝球的结果总数是红球的总数和蓝球的总数之和。而且在任何可重复试验中——例如掷色子或者旋转轮盘赌轮——两个不相交事件的频率和一定是至少一个事件发生的频率。所以加法定理从频率角度看也成立。
一个持主观视角的人也能接受这个定理。否则,存在两个互斥事件,称为A和B,加法定理对它们不成立。这种情况下,主观主义者会面临三个赌局:一个赌事件A发生,一个赌事件B发生,一个赌事件A和B至少一个发生。而对他来说每个赌局都是公平的,他会接受,但他如果参与全部三个赌局,则必定会输钱。加法定理就禁止了这样的矛盾。
加法定理可以拓展到包含大量事件的集合中,前提是这些事件中任意两个都没有相同的结果——它们是两两不相交的(pairwise disjoint)。即使一个事件包含了1 000 000种不同的结果,其发生的概率也仅仅是每种结果单独的概率的和。但是假设结果的个数不再有限,例如连续掷一枚硬币直到正面出现时掷硬币的次数。
这个试验可能的结果组成一个无限长的表{1, 2, 3, 4,…},表中的每一个数值都对应着其非零的概率。正面出现时掷硬币次数为偶数的概率是多少?在{2, 4, 6, 8,…}中的结果会让这个事件发生。我们能通过计算其概率和来计算这个事件的概率吗?
数学上这个加法计算没有很大困难,但这个操作已经超出了古典概型的范围,古典概型只能处理有限多个可能的结果。这种无限长的表中的事件概率的加法定理是不是概率在起作用,人们对此还没有达成共识。有利于将其包括到概率的范畴的是:我们也许可以得到更多种类事件的概率。不利于将其包括到概率的范畴的是:对这个事件的概率计算不是古典理论的一部分,我们需要在计算中小心会带来陷阱的步骤。这个问题没有正确或者错误的答案。
我是一个实用主义者,我满意于加法定理这样的拓展应用,而且我从没有对这样拓展带来的结果失望过。这种态度是大学中讲授这门学科的大多数教材中给出的标准诠释。但是德·菲内蒂从谨慎的角度建议避免进行这种拓展,有一部分人也这样认为。
乘法定理
掷一枚普通的硬币,你会预期猜对正面或者反面的次数是总次数的一半。洗牌之后预测牌堆顶的牌是红色或者黑色,你也会估计猜对的次数是总次数的一半。当你同时猜测掷硬币的结果和牌堆顶牌的颜色,有多大可能两个都正确?
假设做这种双重试验100次。预期你大约50次猜对掷硬币的结果,当你猜对之后,预期你继续在一半的次数中猜对牌的颜色。这意味着你大约有25次两个都猜对,看起来得到了25%或者1/4作为两个都猜对的概率。对这样的试验来说,两个都正确的概率就是将两个事件单独成立的概率相乘。
10个大小和材质均相同的球被标有数字0到9,它们中的任何一个被抽中都是完全随机的。所以球上写着较小数字(0~4)或者较大数字(5~9)是等可能的。其中5个数字用绿色写成,另外5个用蓝色写成,所以绿色和蓝色也是等可能的。我们猜颜色或猜数字较小还是较大都分别有50%的概率。那么球上既标有较小数字又是绿色数字的概率是多少?
前文关于硬币和扑克牌的论断意味着答案是1/4,但是想一会儿你就能发现这不对。在有10个球的情况下,不可能其中的1/4(2.5个)是较小的绿色数字!正确的答案取决于哪一些数字是绿色的,哪一些数字是蓝色的。不妨假设1至5是绿色,其余是蓝色。
这种情况下,10个数字里面有4个(1、2、3和4)是较小的绿色数字,所以前述事件的概率是0.4。但就像我们处理第一个问题时一样,我们也可以使用两步走的过程:100次重复试验中,我们预期得到较小数字50次。5个里面有4个较小数字是绿色的,所以在我们得到较小数字的情况下,我们预测绿色次数占4/5。总体上讲,我们预期得到较小的绿色数字40次,再次指向了0.4这一答案。
在硬币和扑克牌的问题中,掷硬币的结果对扑克牌的结果没有影响。我们不会因为得知了硬币掷出正面就改变头脑中抽到红色牌的概率——在给定第一个事件发生的条件下,另一个事件的条件概率(conditional probability)就是它的正常的概率。如果这成立,这两个事件被称为是独立的(independent),两个事件同时发生的概率就是两个事件单独发生的概率的乘积。
对于10个球的问题,两个事件同时发生的概率也作为乘积出现,其中第一个乘数是一个事件(较小数字)的概率,而第二个乘数是得到较小数字时得到绿色数字的条件概率。所以两个计算在形式上是相同的,唯一的不同就是第一个事件的结果会否影响第二个事件。这两个计算中,我们都用到了概率的乘法定理(the Multiplication Law):
两个事件同时发生的概率就是第一个事件发生的概率与第一个事件发生时第二个事件发生的概率的乘积。
独立性
我们用“独立的”这个术语来描述一种情况:第一个事件的发生并不影响我们对第二个事件概率的评估。假设这是成立的。但假如我们知道了第二个事件已经发生,这可能影响我们对第一个事件概率的评估吗?
不会。一个事件的发生与否不会影响另一个事件发生的概率,第二个事件是否发生也并不会影响第一个事件的概率。当两个事件中任何一个发生与否均不会对另一个事件的概率产生影响时,这两个事件是独立的。要计算两个事件同时发生的概率,就将它们各自的概率相乘。
彼此不相互影响的事无疑是独立事件,例如突尼斯今天下雨和巴黎新生儿的性别。但有时独立性并不明显。使用一个公正的普通色子,考虑事件“得到偶数”和“得到3的倍数”,它们的概率分别是1/2和1/3。只有得到6的时候两个事件同时发生,概率是1/6。因为1/2和1/3相乘等于1/6,这两个事件是独立的。得到偶数的概率并不会在我们得知是否得到3的倍数之后改变(反之亦然)。
现在,当你有一个8面色子或者10面色子的时候,考虑相同的问题,色子的每个面都分别被标记了1~8或者1~10。再进行相应的算术过程:你会发现在其中一种情况下两个事件是独立的,但是在另一种情况下不是。判断独立性时,直觉是有用的,但是并不总是足够的。
在两个因素并不独立的时候假设它们是独立的,是评估概率过程中最常犯的错误。假设在一所大学的研究生院中一半的学生是女生,并且1/5的学生学习工程学科。随机选择一个学生:这个学生是女生的概率会被认为是1/2,这个学生学习工程的概率会被认为是1/5。然而你会发现这个学生是个女工程师的概率远远小于这两个值的乘积——1/10。
具有重叠的事件
加法定理说明了如何计算两个事件中至少一个发生的概率,只要这些事件是互斥的。如果二者不互斥会怎么样?例如,随机抽取一张卡片,是黑桃或者A的概率是多少?黑桃A同时属于这两个分类,所以如果我们只是将各自的概率相加,我们就会将黑桃A计算两次。为了计算两个事件中至少一个发生的概率,并纠正可能会被重复计算的结果,就将各自的概率相加,然后减去两个同时发生的概率。
如果两个事件是互斥的,就不可能同时发生,所以这个额外项的值为0,我们就回到了原先的加法定理。
让我们来看看在先前两个例子中这种观点的实际应用。在猜硬币和红牌黑牌的问题中,我们至少猜对一个的概率来自计算过程1/2 + 1/2 - 1/4,等于3/4。在另一个例子中,随机地抽取有标号的球,是较小数字或者绿色的概率是1/2 + 1/2 - 0.4 = 0.6。
抽到黑桃或者A的概率就是13/52 + 4/52 - 1/52 = 16/52,这可以被证明,因为52张牌中刚好有16张满足条件。
最后一个计算过程会警示你不要提前进行算术简化。的确13/52与1/4相等,4/52与1/13相等,但是要将1/4和1/13相加,你最好用原始的分数。将一个像5/13这样的美观的分数写成它的丑陋的近似小数(0.384 615 38……)几乎没有好处。
两个以上的事件
由许多事件组成的集合中的一些事件发生与否,并不影响任何其他事件的概率时,这些事件就被描述为独立的。在这种情况下,乘法定理意味着,以任何方式从这个集合中选取事件,它们均发生的概率仅仅是它们各自的概率的乘积。
但是在3个或者更多的事件不是独立的时候,我们如何得到它们均发生的概率呢?例如惠斯特纸牌和桥牌[1]游戏中,纸牌都被随机洗好然后等量地分给四个玩家。他们全都恰好抽到一张A的可能性有多大?
考虑4个单独的事件:甲恰好抽到一张A,乙恰好抽到一张A,丙恰好抽到一张A,丁恰好抽到一张A[2]。显而易见,这4个事件并不是独立的,因为如果任意3个均发生的时候,最后一个就一定发生了。我们会通过一个三段式过程来得到它们均发生的概率。
首先,我们计算甲恰好抽到一张A的概率。假设所有可能的分牌方式都是等可能的,我们有了一个计算练习:计算可能的分牌方式的总数,然后计算甲恰好抽到一张A的方式有多少种。相信我,这个概率算下来略低于44%。
假设甲只有一张A(因此有12张非A)。这就给其他的玩家留下了3张A和36张非A,同时乙随机地抽取了其中的13张。对这个较小的牌堆,相似的计数过程指出乙恰好抽到一张A的概率略低于46%。乘法定理告诉我们,两个事件,即甲和乙均恰好抽到一张A发生的概率是这两个值的乘积,略高于20%。
现在我们假设甲和乙每个人都恰好有一张A。然后丙从剩下的两张A和24张非A中随机地取13张牌:他恰好得到一张A的概率是52%。
最后一步就是再一次使用乘法定理,将最后的两个计算过程组合起来:甲、乙和丙均恰好抽到一张A的概率略高于10%。如果这发生了,丁就不可避免地得到最后一张A,所以我们找到了我们所寻求的答案。
虽然分牌是随机的,最公平的A的分配却是颇不可能的。这个答案本身没有什么实际意义,但我们使用的方法是具有普遍意义的。为了得到集合中每一个事件均发生的概率,就应该将整个过程分成若干阶段。找到一个事件的概率;然后,假设这个事件真的发生,再找到第二个事件的概率;再假设前两者均发生,找到第三个事件的概率;然后假设前三者均发生,找到第四个事件的概率——以此类推。最终,将所有的数据相乘。
在其他情形中我们是否也要依照这个过程?假设我的交通行程有三个阶段,并且我可以评估它们各自不延迟的概率:但所有阶段都会受天气影响,并且一个阶段延迟与否会改变其他阶段延迟的概率。在制造业中,一件生产设备的安全依赖于数个并不独立工作的组件——其中的一些可能使用相同的供水系统,另一些可能由同一个不可靠的员工做了不充分的测试。在手术中,可能会出现问题的事情和其他事情是否独立会对全部过程能够顺利进行的概率产生巨大的影响。
如果事件是相互独立的,那么它们全都发生的概率就只是它们各自概率的乘积。但我们很少会足够幸运地处于这种情况,实际上在一个分段的评估中,随着工作的推进概率在不断变化,这是一种常态。
三个或者更多的事件中至少一个发生的概率是多少呢?加法定理的确可以拓展到这种情况,然而因为这个表达式实在是难以处理,我不会在这儿写下来。它的推导过程与之前描述过的将乘法定理应用于许多事件均发生时所使用的过程一样:一步一步来。
将独立当作互斥是常见的错误,反之亦然。随机地抽取一张牌的例子会帮助你认识到如何避免它。这里,“抽到一张黑桃”和“抽到一张梅花”这两个事件是互斥的,但绝不是相互独立的,因为如果二者之中任何一个发生了,另一个就不可能发生,所以两个同时发生的概率是0。同时“抽到一张黑桃”和“抽到一张A”是相互独立的(是吗?),但显然不是互斥的。
记住:加法定理用来计算至少一个事件发生的概率,乘法定理用来推导它们全部发生的概率。
有时人们说:计数真的只有1、2、无穷大。这个说法揭示了一条真理,如果我们可以完成从处理一件事到处理两件事的过渡,那随后到第3、4、5等的过渡相比而言就不那么重要了。这个道理当然是对加法定理和乘法定理都成立的。
一个巧妙的把戏
任何事件要么会发生,要么不会发生。总概率被分成了事件发生和不发生两部分。所以如果我们能够找到事件不发生的概率,把这个概率从100%中减掉,就能够推断出它发生的概率。
举例来说,我们要计算掷两次公正的色子时,至少得到一个6的概率。任何结果都写成表示第1次和第2次的投掷结果的一对数字,例如(5, 2)或(4, 4),并且我们认为所有这样的结果都是等可能的。每次投掷都会有6个可能的结果,以至于总共有6×6=36种结果。我们的事件在没有色子是6的时候不发生,一共5×5=25种情况。没有6的概率是25/36,所以至少一个6的概率是11/36,比1/3略小一点。
这就引出了1654年布莱瑟·帕斯卡(Blaise Pascal)和皮埃尔·德·费马(Pierre de Fermat)解决的一个点数问题的初级版本。我们必须掷多少次色子才能使我们至少掷出一次6是更有可能的,即掷出一个6的概率比1/2大?我们刚刚看到,掷两次是不够的。
每一次额外的投掷都会让可能的结果数增加6倍,同时未掷出6的结果数乘以5。所以3次投掷一共有216种结果,而且其中125种(超过一半)没有包含6,3次投掷也是不够的。然而4次投掷得到1296种结果,并且其中只有625种是未掷出6的,少于一半。这就使得包括6的结果多于不包括6的结果,所以这时包含6更有可能。4次投掷就足够了。
实际上帕斯卡和费马分析的游戏中不只包含了掷一个色子,还包含了同时掷两个色子的情况;并且设问若要使两个6同时出现至少一次更有可能,需要多少次重复同时投掷两个色子。解法是相同的,但是原始的计算过程是艰难的。如今我们可以借助小型计算机或者袖珍计算器来快速地得到结果,然而直到17世纪,较便捷的对数和计算尺才被使用。直到第24次投掷没有双6产生的可能性都更大,但是第25次投掷就将扭转这一局面。
大多数具有“计算这些事件中至少一个发生的概率”这种格式的问题,都可以用这种方式解决:计算它们均不发生的概率,然后从单位1中减掉这个概率。
[1] 惠斯特纸牌(whist)和桥牌(bridge)均为经典的纸牌游戏。
[2] 原文中,甲乙丙丁分别为:Anne、Brain、Colin和Debby。