10-1 运用多项信息进行贝叶斯推理
在前面几讲中的案例,在运用贝叶斯推理时,都只是获取到了一项信息。例如,第1讲中,面前的顾客会/不会上前询问;第2讲中,只有1种癌症检查;第3讲中,女性同事会/不会送出巧克力;第4讲中,第一胎的性别,等等。每个案例中,最终获得的信息都只有一项。
但一般所指的“推理”需要多项信息作为辅助。因此,我们需要了解获得多项信息时的推理方法。而在已经获得多项信息的情况下进行推理时,贝叶斯推理有着十分重要的特性。接下来,会通过4讲内容(包括本讲)对于“获得多项信息时的推理”进行解释说明。
10-2 将两个试验结合起来
我们面对的每个案例,都有多个可能的结果。而为每种可能性分配各自的概率的这个现象,被称为“试验”。此前我们只是将其称为“信息”,而接下来会使用“试验”这个用语。例如,投掷一枚骰子并观察投出的点数,这就是“试验”的一种。还有,明天的天气可能会出现“晴天”“多云”“雨天”“雪天”这4种情况,而确认究竟是哪一种情况,也是一种“试验”。
当两种试验并存时,将它们结合起来,并将其看作另一项试验。接下来我们要做的是,思考可能发生的各种情况的概率。
为了方便理解,我们下面举一个人为的例子来进行说明。
第一个试验,抛一枚均匀的硬币,并总结抛出正面和反面的概率。第二个试验,掷一枚均匀的骰子,并总结掷出点数的概率。然后,把这两个试验的结果结合起来,组成第三个试验。例如,第一个试验的结果是“正面”,第二个试验的结果是点数“4”,把这两个结果组合起来,就得到了第三个试验的结果“正面&4点”。这样的试验称为“直积试验”,结果如图表10-1所示,共有2×6=12种情况。
图表10-1 将两个试验结合起来
如图所示,直积试验的结果用格子的形状来表示。“格子形状”的含义是:横向按照1~6的顺序排列,纵向按照正面/反面的顺序排列。像这样,将直积试验的结果用格子形状表示,有着重要的意义——使概率的计算变得简单。顺便说一下,“直积”是一个数学用语。它的含义是:用格子形状进行排列,并编成组。
10-3 用乘法运算得出独立的直积试验的概率
下面,我们针对这两个试验的独立性进行说明。
“两个试验的独立性”的含义,简单地说,就是指“两个试验的结果不会互相影响”。例如,上一节中提到的“抛硬币”的试验和“掷骰子”的试验中,硬币抛出正面的结果,不会影响掷骰子的点数;而掷骰子出现4点的结果,也不会影响硬币抛出正面还是反面。也就是说,我们可以直观感受到:“硬币的正反”和“骰子的点数”这两个结果是互相不影响的,这就是所谓的“试验的独立性”。
那么,“互相不独立的两个试验”又是什么样的呢?举一个容易理解的例子来说,“东京都明天的天气”与“神奈川县明天的天气”,不能认为这二者是“毫无关联”的吧。因为神奈川县紧邻东京都,若推测“东京都明天的天气”是“雨天”的话,那么“神奈川县明天的天气”也是“雨天”的可能性就会很高。同样,若推测“神奈川县明天的天气”为“雪天”的话,那么“东京都明天的天气”是“雪天”的可能性也会比平时要大。这样的试验在专业上被称为“从属试验”。
但是,把“试验的独立性”定义为“互不影响”或“没有关系”等方式,并不能算得上十分高明。这是因为,“一项试验对于另一项试验是否产生影响”的问题,很难用数学计算进行描述。在这里,我们将独立性定义为:“一方对另一方不产生影响”以及“直觉上认为它们有着相同意义的数学计算”,具体说明如下:
在这里,我们再一次通过之前抛硬币和掷骰子的试验进行说明。
投掷骰子的结果,出现1点或其他点数的概率均为1/6。之后,我们再来关注一下“将抛硬币和掷骰子这两个试验编为一组的直积试验”。在直积试验中,假设单独把“正面”的结果抽取出来,那么掷骰子出现各个点数的概率是多少呢?如果设定“掷出1点相对容易(概率大于1/6)”,那么,抛硬币的结果为“正面”,就会对骰子的点数产生影响。
因此,如果“正面”这一结果对于骰子的点数不会产生影响,那么,即使仅仅抽出“正面”的情况,骰子出现各个点数的概率也还是相等的。如果用格子形状的图表10-2来解释的话,即,上面一行表示结果为“正面”的6个长方形的面积(表示概率)都是相等的。同样地,下面一行表示结果为“反面”的6个长方形的面积也是相等的。
图表10-2 独立试验的面积
在这个阶段,我们还无法知晓上下两个长方形的面积是否相等。而当我们把掷骰子出现6点的情况抽取出来,并考虑到这个结果并不会对硬币抛出正面或是反面的概率产生影响,就能判断出,右侧上下的两个长方形的面积是相等的。于是,从上述的内容我们可以得知:排列成格子形状的12个长方形的面积都是相等的。
那么,用来表示各个试验(把抛硬币和掷骰子两个实验合为一组的试验)结果概率的长方形面积是多少呢?考虑到标准化条件(相加之和为1),就可以知道:每个长方形的面积都是1/12。而长方形的个数之所以是12个,原因在于抛硬币的结果共有2种情况,而掷骰子的结果共有6种情况。接下来我们可以进行以下变形:
长方形的面积
=抛硬币的结果之一的概率×掷骰子的结果之一的概率
根据上面的计算公式,各组试验的具体情况可以表示为:
“正面&1点”的概率=出现“正面”的概率×出现“1点”的概率
或者“反面&5点”的概率=出现“反面”的概率×出现“5点”的概率,等等。
换言之,各组的概率,即为各项概率的乘积。
10-4 独立试验概率的乘法公式
本节对上述内容再作一次一般性的描述。
在上一节提到的抛硬币和掷骰子的案例中,长方形被划分为完全均等的面积。这个例子具有其特殊性,这是因为抛硬币出现“正面”或“反面”的概率是相等的,而掷骰子出现从1到6点数的概率也是相等的。接下来,我们来探讨出现各种情况的概率不等的问题,并对其进行抽象处理。
例如,第一个试验的结果共有可能出现a、b、c、d四种情况,第二个试验的结果共有可能出现x、y、z三种情况。而每种情况发生的概率各自都不一定相同。当这两个试验分别独立的情况下,直积试验可以绘制成图表10-3所示的样子。
图表10-3 两个独立试验组合而成的直积试验。
抽取其中1行进行横向观察,会发现4个长方形的面积各不相等。之后,再观察其中1列,会发现3个长方形的面积也是各不相等的。但需要注意的是,抽取其中1行进行观察时,4个长方形的面积的比例关系,与其他行是一样的;而抽取其中1列进行观察时,3个长方形的面积的比例关系,也与其他列是一样的。
抽取其中1行进行观察时,长方形面积的比例关系,也就是第一个试验中的各项结果的概率比:
(a的概率):(b的概率):(c的概率):(d的概率)
而只要擦掉图表10-3的第2张图中间的横线就会明白,4个长方形可以用来表示试验的a、b、c、d四种结果的可能性。
同样地,抽取其中1列进行观察时,长方形的面积的比例关系,也就是第二个试验中的各项结果的概率比:
(x的概率):(y的概率):(z的概率)
而只要擦掉第3个图中间的横线就一目了然。
通过以上叙述,我们可以得知:被分割的12个长方形的横边长度按以下顺序排列为:
(a的概率)、(b的概率)、(c的概率)、(d的概率)
纵边长度按以下顺序排列为:
(x的概率)、(y的概率)、(z的概率)
在这里,需要注意的是,面积之比变成了线段长度之比,因此,
(a&x的概率)=(a&x的长方形的面积)=(a的概率)×(x的概率)
(b&x的概率)=(b&z的长方形的面积)=(b的概率)×(z的概率)
上述类别的乘法计算公式,称为“独立试验概率的乘法公式”。
第10讲·小结
1.把两个试验组合在一起的直积试验,需要把长方形分割成格子形状,并通过图来表示。
2.两个独立试验的含义是:直观来讲,一方的结果不会对另一方的结果产生影响。
3.两个试验各自独立时,下列概率乘法公式成立:{(第一个试验的结果为a、第二个试验的结果为x)的概率} =a的概率×x的概率
练习题
答案参见此处
投掷一大一小2个骰子,然后把概率填入括号中。
(1){(大的为2点)&(小的为3点)}的概率
={(大的为2点)的概率}×{(小的为3点)}的概率}
=()×()=()
(2){(大的点数为偶数)的概率}&{(小的点数为5以上)}的概率
={(大的点数为偶数)的概率}×{(小的点数为5以上)的概率}
=()×()=()