9-1 贝叶斯逆概率的悖论
在第5讲到第8讲中,我们更倾向于用哲学的角度来解释,作为概率性推理的贝叶斯推理,究竟有着怎样的理论结构。在本讲中,我会和大家谈一谈围绕着贝叶斯推理的一些悖论问题。
贝叶斯推理只是运用了大家所熟知的概率公式(高中阶段学习的知识),并不能说是一种很离奇的方法。但是,所运用到的先验概率带有主观性,从这个层面来讲,可以说贝叶斯推理能够实现一种处于数学和哲学边界线上的理论。这样说的证据是:如果在特殊设定中运用贝叶斯推理的话,便会得出与我们的常识和直觉截然相反的结果,就如同悖论一般。
因此,在本讲中会介绍关于贝叶斯推理的两个悖论,希望可以帮助大家站在与逆向思维的角度,来理解贝叶斯推理的内涵。
9-2 悖论① 蒙蒂霍尔问题
关于贝叶斯推理的悖论,最出名的当属蒙蒂霍尔问题,以下是问题设定。
蒙蒂霍尔问题
面前有A、B、C三道帘子。其中一道帘子后面停着一辆轿车作为奖品。你需要在这三道帘子中任选一道,如果揭开帘子,后面有轿车的话,那么轿车就归你所有了。而当你选择了A帘之后,主持人会从剩下的两道帘子中,选择B帘打开,而B帘后面并没有轿车。这时,主持人会问你:“现在只剩下你所选的A帘和尚未打开的C帘这两种选择了,那么现在你要不要改变主意呢?”这时,你认为该不该改变最初的选择呢?
这个问题源于美国的一个让现场观众参加游戏的电视节目,节目主持人的名字叫作蒙蒂霍尔。这就是“蒙蒂霍尔问题”“蒙蒂霍尔悖论”得名的由来,这个理由着实令人感到有些意外。
实际上,这个问题的正确答案是:应该选择换帘子。理由是,在C帘后面停有轿车的概率比A帘大。
但是,很多人对于上述观点表示了异议。他们认为,既然已经打开了一道帘子,那么,轿车肯定停在剩下的两道帘子其中之一的后面,而轿车停在这两道帘子其中之一的后面的概率是相同的。因此不管最终选择哪个,回答正确的概率都不会变。事实上,在美国,关于这个问题的答案的讨论,确实引发过一阵**。
关于上述“正确答案”,我们稍后再作讲解。接下来,先为大家介绍另一个悖论。
9-3 悖论② 三个囚犯的问题
接下来要介绍的三个囚犯的问题,和蒙蒂霍尔问题有着不同的版本。
三个囚犯的问题
艾伦、伯纳德、查尔斯三个囚犯,他们的名字简称为A、B、C。所有人都知道,这三人中,有两人要被处死,剩下一人被释放,但不知道被释放的会是谁。这时,艾伦对看守说:“反正三个人中有两人要被处死,所以伯纳德和查尔斯中两个人中,至少有一个是要被处死的。即使你告诉我这两人中谁要被处死,对我来说也没什么益处。那么,能不能请你告诉我,究竟谁要被处死呢?”看守听后,同意了艾伦的看法,于是告诉他:伯纳德将要被处死。艾伦听了这话,心中窃喜。因为艾伦是这样考虑的:在什么情况都不了解的时候,我被释放的概率是1/3;但现在,我知道了伯纳德要被处死,那么我和查尔斯之中,如果一方被处死,另一方肯定会被释放。这样一来,我被释放的概率就上升到了1/2。
现在我们可以了解到,三个囚犯问题和蒙蒂霍尔问题具有相同的结构。艾伦相当于A帘,伯纳德相当于B帘,查尔斯相当于C帘,而将要被释放的人则对应藏在帘子后面的轿车。看守人告知艾伦,伯纳德会被处死这一消息,则对应主持人打开B帘之后没有轿车这一信息。而A帘后面有轿车,则对应为艾伦要被释放的信息。
之所以将三个囚犯的问题称为“悖论”,是因为艾伦的理由无法让大多数人信服。艾伦仅仅通过知道除自己之外的将要被处死的人的名字,他被释放的概率就得到提升,或者说被处死的概率降低,这总让人觉得有些奇怪。事实上,即使艾伦被告知,将被处死的人是查尔斯,结果也是一样的。也就是说,即使完全不知道查尔斯、伯纳德谁将被处死,艾伦也可以推断出自己被释放的概率是1/2。
在此需要提醒各位,蒙蒂霍尔问题与三个囚犯的问题有着十分紧密的联系。其共同点在于:如果对于其中一个答案存有异议,那么,就不得选择相信另一个答案。
9-4 这两个问题的本质是相同的
这两个问题的关键点都在于:由于获得了一定信息而导致概率发生变化。之前,我们也一直将“概率因获得信息而发生变化”的各种案例作为贝叶斯推理的精华来进行解说,先验概率和后验概率就是其体现。另一方面,在这两个问题中的概率均因获得信息而发生了变化,这一点与大多数人的直觉是相反的。
大家都知道,在蒙蒂霍尔问题中,当游戏的参加者在选择A帘时,A帘后面藏着汽车的概率是1/3。因此,当主持人掀开B帘,且游戏参加者知道了B帘后没有汽车之后,那么自己先前选择的A帘后面有汽车的概率究竟是会发生变化,还是与之前的概率相同呢?以下列出了关于这个问题的两种想法:
想法1:因为汽车一定藏在A帘和C帘这两者之一的后面,所以概率也变为了两种可能性各占一半。因此,A帘后藏有汽车的概率从1/3上升到1/2。
想法2:即使知道了B帘后面没有汽车,A帘后面藏有汽车的概率仍然不会变化。因此,A帘后藏有汽车的概率仍然是1/3不变。而这同时意味着,C帘后藏有汽车的概率从1/3上升到了2/3。
多数人会选择上述两种想法中的前者,而二者区别的关键在于:究竟是A和C的概率同时发生变化,还是仅仅C的概率发生了变化。随着B的可能性被排除,那么理所当然地,A和C的概率至少有一个会发生变化(标准化条件),而问题是究竟是其中只有一个发生了变化,还是两者都发生了变化呢?
下面我们试着针对同样的问题,用三个囚犯的案例进行讨论。艾伦在向看守询问关于死刑的消息时,给出的理由是:反正伯纳德和查尔斯两个人中,总会有一个会被处死,所以即便告诉我被处死的人的名字,对我来说也没有什么好处”。这句话中的“对我来说也没有什么好处”,可以理解为“自己被处死的概率不会发生变化”。那么,我们在这个案例中也试着套用一下上述两个想法:
想法1:因为被释放的人肯定是A和C中的一人,所以概率也变成了二者各占一半。那么,A被释放的概率从1/3上升到1/2。
想法2:即使已知B将会被处死,但A被释放的概率仍然不会变化。因此,A被释放的概率仍是1/3。而这意味着,C被释放的概率从1/3上升到了2/3。
艾伦以想法2为依据,从看守那里打探到了消息,之后又套用了想法1。这样得到的结果让他兴奋不已。
至此大家应该已经理解:如果多数人在蒙蒂霍尔问题中选择了想法1的话,那么在三个囚犯问题中也会选择想法1,结果就会和艾伦的想法一样。相反,如果觉得三个囚犯问题中,艾伦高兴的理由很奇怪的话,就会选择想法2,那么在蒙蒂霍尔问题中,也不得不改变之前选择的帘子。
很多文献都认为想法2是正确的,并对此进行了如下解释:选择者自身的概率不会发生变化,而非选择者那一方的概率会发生变化。在网上,也经常会看到类似下面这样的试图说服读者的说明。
现在,假设你从海量的彩票中选出1张。之后,主持人在剩余的所有彩票中只选出1张留下,剩下的彩票全部销毁,并告诉你:刚才撕碎的彩票中没有头奖。这时,你是应该改选主持人留下的那1张彩票,还是继续坚持自己最初选择的那张彩票不变呢?
在这种情况下,大多数人会毫不犹豫地认为“改选主持人留下的那1张胜算更大一些”。这是因为,在最初自己选择那1张彩票的时候,这张彩票为头奖的概率非常低;另一方面,头奖在主持人手中剩余的海量彩票之中的概率具有压倒性优势。而现在,主持人手中所有不是头奖的彩票都被销毁了,因此可以推算出剩下的那1张彩票是头奖的可能性非常大。
如果按照这个理由来思考的话,那么因获得信息而发生概率变化的,其实并不是你选择的一方,而是你未选择的那一方。
乍一听似乎很有道理,但笔者顺着这个思路来解决蒙蒂霍尔问题时,却发现行不通。这是因为,该案例可以理解为“将帘子的数量增加到极大值”之后的模型,这与原本在三个帘子之中选择其一的问题是完全不同的类别。当然,以上解释只是打比方而已,不能算是科学的讨论。不过,这里提到的“概率”本身就是主观性的概念,而基于传统科学依据的“正确答案”根本就是不存在的。这是因为,在你选出某1张彩票的时刻,它是不是头奖就已经是固定不变的事实了,后来发生变化的只是“你的主观推测值”。既然是主观的东西,那么答案自然不止一个了。
下面,我们用主观概率方面的代表性理论——贝叶斯推理,来探讨这个问题。
9-5 通过贝叶斯推理推导出矛盾
下面,我们试着用贝叶斯推理来探讨一下这一类问题。这几个案例具有共性,我们选择其中的蒙蒂霍尔问题来进行具体分析。
首先,设定类别和先验概率。
用A、B、C分别来表示“A帘后面藏着汽车”、“B帘后面藏着汽车”、“C帘后面藏着汽车”这三种情况。最终结果肯定是这三种情况之一,因此可以认为:共有三种可能性。那么,可以将这三种情况先验概率均设为1/3,各自相等,如图表9-1所示。
图表9-1 根据理由不充分原理得到的先验分布
现在的问题是,之后该如何设定条件概率。在你选择了A帘的时刻,就必须对于主持人一会儿将打开B帘还是C帘的问题设定条件概率,设定的标准如下所示。
条件概率的设定
如果A帘后面藏有汽车的话,那么主持人打开B帘和C帘的概率各为1/2。如果B帘后面藏有汽车的话,那么主持人打开C帘的概率为1。如果C帘后面藏有汽车的话,那么主持人打开B帘的概率为1。
在以上设定的背景下,我们将打开B帘记录为“开B”,将打开C帘记录为“开C”,导入条件概率之后,共有4种可能性,如图表9-2所示。
图表9-2 条件概率的设定
译者按
图中“B帘且开C”意思是,已选择A帘的游戏者头脑中预想下一步主持人会“开C”(主持人知道B帘中有汽车且只会打开后面没有汽车的帘子),本图其他说明含义同此。
之后,通过主持人打开B帘的行为(开B),我们得知B帘后面并没有汽车。也就是说,因为不需要再打开C帘,所以“选择A帘且开C”和“选择B帘且开C”的两种可能性被排除掉。那么,表示剩余可能性的图表便如图表9-3所示。
图表9-3 排除不可能发生的情况
根据上图,通过标准化条件对后验概率进行求解,如下所示:
(是A帘的后验概率):(是C帘的后验概率)
=1/3×1/2:1/3×1
=1:2
=1/3:2/3
至此,A帘后面藏有汽车的概率变为1/3,C帘后面藏有汽车的概率变为2/3。因此,如果你相信上述推算结果的话,就应该改变最初的选择。
对于三个囚犯的问题,也可以采用相同的思路进行贝叶斯推理,这样得出的结论是:艾伦被释放的概率为1/3,查尔斯被释放的概率为2/3。
对于上述结果,如果从哲学的角度进行解释的话,会给人以“因为主持人和看守并未提供与提问者相关的信息,所以提问者的后验概率不会发生变化”的感觉。然而,会出现这样的想法,是因为还没有摆脱“解释”或“印象”的影响。判断这种解释正确与否的确很困难,说到底,这还是一种哲学性解释。
9-6 结论因模型的设定自身而发生变化
那么,在蒙蒂霍尔问题中,“应该改变最初的选择”这一结论,似乎已经是板上钉钉的结论了。但实际上,笔者并不这样认为。因为“A帘的后验概率为1/3,C帘的后验概率为2/3”的结果,毫无疑问依存于模型的设定。
当然,将A、B、C的先验概率都设定为1/3,这一点是没有异议的。问题在于,关于主持人会打开帘子的条件概率的设定存在恣意性。如果“恣意性”一词听起来略具批判性的话,也可以用“如何对模型进行设定”来表达。
在上一节的模型中,在A帘后面藏有汽车的情况下,我们设定:主持人以打开B帘或C帘的概率各占一半。但其实并没有证据表明,必须做出这样的判断。实际上,在C帘后面藏有汽车的情况下,主持人除了打开B帘之外,并没有其他的选择,所以他会立刻打开B帘。但是,在A帘后面藏有汽车的情况下,由于有B帘和C帘两个选项,主持人可能会有一瞬间的犹豫,来思考究竟要打开B帘和C帘哪一个为好。如果聪明的游戏参加者看穿了主持人那一瞬间的犹豫,便能以此为线索来推算汽车究竟藏在哪个帘子后面。而主持人为了避免这种情况的发生,可以采取“事先准备好根据汽车的所在位置来决定打开哪一个帘子,并预先进行练习”的策略。
例如,事先准备好“在游戏参加者选择了A帘,并且A帘后面的确藏有汽车的情况下,便打开B帘”。这样一来,图表9-2就需要进行相应的调整,如图表9-4所示。
图表9-4 条件概率的设定
像这样,在使用考虑到分配条件概率的模型时,结论会有所不同,如图表9-5所示。
图表9-5 排除不可能发生的情况
通过图表9-5我们可以了解到,A和C的后验概率会变为相等,各为1/2。这与想法1的结论相一致。
然而,该模型可能会受到如下批判。应该再设定“在游戏参加者选择了A帘,并且A帘后面的确藏有汽车的情况下,便打开C帘”这样的模型。这种情况下,反而会得出“一定要改选C帘”的结论。然而,如果对该批判进行深入思考的话,结论会是这样的:由于不能判断汽车的确切位置,或许还是应该对等地处理B和C会更好一些。然而,这是将“理由不充分原理”扩展到条件概率的思路,超出了通常的贝叶斯推理范围。
总之,说到底,概率性推论依存于“主观”因素——对概率现象结构的想象,因此结论会根据模型的构建方式而不同。因此可以说,概率性推论并不存在“正确的答案”,至多是“妥当的推论”罢了。这一点在贝叶斯统计学和标准统计学(内曼-皮尔逊统计学)中是相同的。
第9讲·小结
1.蒙蒂霍尔问题和三个囚犯问题,以两种不同的形式表达了相同的内容。
2.如果认为一方的观点奇怪,就不得不接受其他的观点。
3.这两个问题都可以通过贝叶斯推理来进行解答。
4.笔者认为,由于结论依存于模型的设定(如何想象概率现象),所以没有所谓的“正确答案”。
练习题
答案参见此处
在蒙蒂霍尔问题中,假设有4个帘子,请尝试通过贝叶斯推理进行求解,并将正确答案填入括号中。
如果选择了A帘,则共有9种可能性。
之后,设定主持人打开了B帘。
那么此时,
“A帘且开B”的概率=()×()=()
“C帘且开B”的概率=()×()=()
“D帘且开B”的概率=()×()=()
于是,如果要使其满足正规化条件,那么在获得信息“B帘被打开”的情况下,各后验概率为:
“汽车在A帘后面的后验概率”=()
“汽车在C帘后面的后验概率”=()
“汽车在D帘后面的后验概率”=()
因此结论是,应该(移动/不移动)帘子为宜。
专栏 column 关于“幸运”的两条法则
很多人相信“运气”有某种征兆。比如“茶叶棍立起来是吉兆”“找到四片叶子的三叶草会得到幸福”“木屐带断开是凶兆”等。实际上,对于这类“运气”,有两种典型的思考方式:第一种是“幸运定量法则”,第二种是“幸运唤起幸运的法则”。
第一种思考方式认为:“幸运”这种东西有一定的量,如果一段时间内接连发生幸运的事,那么后面幸运将会枯竭,接下来会发生不好的事情。用壶的例子打比方:从装有一定数量的白球(好事)和黑球(坏事)的壶中取出球,如果接连取出的都是白球的话,那么壶中剩余白球的数量将会减少,于是后面就会很容易出现黑球。
与之相反,第二种思考方式认为:走运的时候,好事会连续发生。这正是基于贝叶斯推理学的思维方式。用第7讲中的案例来解释:假设有两个壶,A壶中白球的数量多于黑球,而B壶中黑球的数量多于白球。再假设,一个人拿着A壶或B壶中的某一个,并通过从中取出球来决定自己的命运。但他并不知道自己手里拿着的是A壶还是B壶,因此只能根据取出的球来推断。正如第7讲中说明的那样:如果取出的是白球,则壶A的可能性增大;如果取出的是黑球,则壶B的可能性增大。于是,如果第一次取出的是白球,这一事实暗示着下次取出白球的可能性会很高,而这正意味着“幸运唤起幸运”的道理。
至于怎样才能收获“幸运”,根据所选择的立场不同,答案也会发生变化。如果采取第一种思路,那么在发生了好事之后,应该做的是“防止余下的幸运流失”;而如果采取第二种思路,那么在发生了好事之后,应该“顺势争取更多的幸运”。