第6讲 明快而严格,但其使用场合受到限制的内曼-皮尔逊式推理(1 / 1)

6-1 运用内曼-皮尔逊式推理解答有关壶的问题

我们再来回顾一下,上一讲中提到的概率推理问题。

面前有一只壶,已知这个壶不是A壶就是B壶,但是单从外表看不出究竟是哪个。而目前已知的是:A壶中有9个白球和1个黑球,B壶中有2个白球和8个黑球。现在,如果从壶里取出1个球,并且这个球是黑色的,那么,就可以推断出面前这个壶究竟是A还是B吧。

关于该壶的情况,已知以下四点:

事实1 A或者B。

事实2’ 如果是A,则可能是白球

事实3’ 如果是B,则可能是黑球

事实4 黑球(不是白球)

在采用这些事实进行的推理中,事实2’和事实3’中由于加入了“可能”一词,因此不能用于进行逻辑性推理。但是,如果再增加一条判断,并沿着与逻辑推理基本相同的路径来操作的话,是可以进行推理的。

这一条判断是指,只要“可能”所代表的概率性数值只要满足一定的标准,就能够意识到做出错误判断的风险。

如果10次中出现1次错误,也就是说有10%的概率做出错误判断,那就没办法了,只能听天由命。不过,在此判断的前提下,倒是有可能得出以下结论。

首先,暂且假设该壶为A壶,并且,从事实2’中可以得出是白球的结论。但是,这个结论并不一定绝对正确,依然有10%错误的概率。因为从A壶中取出黑球的概率是0.1。

虽然仅有错误的概率只有10%,但把这个含有错误可能性的结论“是白球”与事实4相结合,便会产生矛盾。因此,否定该壶为A壶的假设,便可以推断出“不是A壶”的结论。这统计学中有一个专有名词,叫作“抛弃假设A”。最后,通过事实1与“不是A壶”的判断,综合得出“是B壶”的结论。

以上便是标准统计学(内曼-皮尔逊统计学)的逻辑推理过程。

推理过程中的关键是,接受“可能”这一字眼所包含的10%的判断错误的风险概率。因此,即使不知道当前所做出“是B壶”的判断究竟是正确还是错误,但如果用这个方法继续进行推理,即使仅有10%判断错误的概率,也有可能得出错误的结论。也就是说,有可能会发生“实际上是A壶,但得出的结论是B壶”的情况。

6-2 假设检验的过程

上一节讲到的概率推论方法,即标准统计学(内曼-皮尔逊统计学)中的“假设检验”法。本书对于内曼-皮尔逊统计学不做专门解说,因此不进行详细深入的介绍(读者朋友如有需要,可参考拙作《完全自学 统计学入门》(详见参考文献⑨))。以下,针对假设检验的顺序进行简单介绍。

假设检验的顺序

第一步:提出想要验证的假设A。假设A又名“解消假设”。

第二步:若假设A不成立,再提出一个假设B。假设B又名“对立假设”。

第三步:若假设A成立,再设定一个只有在小概率α的情况下能观察到的现象X。

第四步:确认是否观察到了现象X。

第五步:若能观察到现象X的情况下,则判断解消假设A是错误的,此时便可以抛弃解消假设A,而选择对立假设B。

第六步:若未能观察到现象X,则不能否决解消假设A,那么选择解消假设A即可。

以上过程可以粗略总结为,“只有A是正确的情况下,才会发生低概率α事件。如果实际观察到了的话,则判断A本来就是错误的,于是抛弃掉A;如果观察不到,因为没有抛弃A的理由,所以予以保留”。此处的概率α,成为是否抛弃假设A的基准,这在专业领域被称为“显著水平”。由于观察到了在概率为α的条件下发生的现象,因而抛弃了之前的假设,那么“弄错正确的假设A并抛弃掉它”的概率则为α。也就是说,这意味着如果一直持续数次使用该推测方法,因概率α的比例而做出了错误的判断。

下面,我们试着将上述内容应用于前一节中壶的例子。

首先,解消假设是“A壶”,那么对立假设自然就是“B壶”。此外,如果设定显著水平α为0.1,那么观察到A壶中取出黑球的概率则为α。接下来,根据观察到的黑球,抛弃解消假设A,并选择对立假设B。这与上一节所说的概率性推理过程是完全一致的。

6-3 假设检验中也存在无法做出判断的情况

即使与逻辑推理相比较,假设检验也可以认为是立足于与其基本相同的构想的、明快的方法论吧。实际上,这一方法如今已经被广泛应用,而重点在于显著水平α,将α设定为多少是一个极其重要的问题。

显著水平α,通常用来表示“极少被观察到的现象”的概率。当然,可以把它设定其为一个很小的数值,通常会设定为5%(0.05)或1%(0.01)。但是,为何要设定为5%(0.05)或1%(0.01),这一点并没有相应的科学依据。有的说法认为,这是因为费希尔以“在每年都进行推测的情况下,研究20年中大约会有1次弄错,这也是没办法的事情”为理由,对其进行了设定。(详见参考文献①)。

那么,如果将显著水平设定为5%(0.05)或1%(0.01),第一节中解说的概率性推论便不符合假设检验的标准。这是因为,把假设A(是A壶)设置为抛弃的标准,采用“观察到取出黑球”的情况,而这个概率是10%,大于5%。同样,把假设B视为解消假设,也不符合假设检验。这种情况下,即使想把取出白球的情况设为现象X,但由于概率为20%,是不满足显著水平的。

第6讲·小结

1.标准的概率推论是根据内曼-皮尔逊统计学产生的。

2.首先,设定解消假设与对立假设。

3.设定显著水平α。通常α=0.05或α=0.01。

4.关注在解消假设的条件下,只有在显著水平α以下才能观察到的现象X。

5.如果观察到现象X,则抛弃解消假设,选择对立假设。

6.如果未能观察到现象X,则选择解消假设。

7.检测假设在显著水平α概率下,有一定的错误风险。

练习题

答案参见此处

现在,我们已经知道面前的壶不是A就是B。A壶中有96个白球和4个黑球。设“是A壶”为解消假设,“是B壶”为对立假设。从壶中取出一个球,结果是黑球。请在符合的一方画圈。

(1)显著水平为5%(0.05)时,假设检验的结论为

(被抛弃/不被抛弃)

(2)显著水平为1%(0.01)时,假设检验的结论为

(抛弃/不被抛弃)

(3)在(2)的情况下,把取出的黑球放入壶中,之后再取一次球,结果还是黑球。此时,假设检验的结论为

(被抛弃/不被抛弃)