第八章 适应纷繁复杂的信息社会的更新机制(1 / 1)

应该对预测进行更新

我们周围的环境时时刻刻都在发生变化,大家必须根据这种变化选择自己应该采取的行动。许多人能够认识到这一点,但是难以根据“变化”进行预测,并通过数值进行冷静的分析、判断。

在此,我将向因为信息爆炸而处于变化旋涡中的人提供明确个人行动指南。为了决定如何行动,我们需要对前途难料的状态进行预测,这一点非常重要。所谓前途难料的状态,是指每当新的信息出现时,都会改变状态的局面。

比如,在足球比赛中,如果自己的球队先进球取得1分的领先,那么取胜的可能性就比开始比赛时更大了。同样,在考试时,完成解题后自己的感觉会发生变化,因此自己在考试前和考试后对于考试分数的预测也是完全不同的。

获取新信息一般有两种结果:一种是排除不可能出现的事件的概率,另一种是可能发生的事件的概率之间的关系出现变化。当情况发生变化时,我们可以排除未来不可能发生的事件的概率,并且剩余概率之间的或然性也会发生变化。这种预测随着信息发生变化的情况,被称为更新(变更预期)。在本书中,我将统一使用更新(updating)这一术语。概率论最早问世于17世纪,自那以后,关于更新的观点就层出不穷。我将从这些观点中选择最著名的两个在本章中进行介绍。

条件概率的简单机制

关于更新,最具代表性的观点就是“条件概率”的思维方式。如果用一句话来归纳,那就是“可以理解为在获取信息后,关于剩余概率的比例关系”。下面,我将结合简单的实例进行说明。

比如,当你约朋友一起参加酒会时,那位朋友对你说:“我要带一个熟人一起来。”那么,我们来推测一下这个熟人到底是男性还是女性。

在这种情况下,除了上述内容以外,没有任何其他信息。因此,最合理的推论是“那位熟人是女性的概率为50%”。这是因为人类的男女比例大约就是0.5∶0.5。

但是,如果掌握了上文中提到的朋友是女性,并且同行的“那位熟人是女子大学的同班同学”的信息,那么关于那位熟人性别的概率比例就会发生急剧变化。也就是说,通过这些信息,完全可以排除那位熟人为“男性”的可能性。在这种情况下,你的推论就会发生更新,从“那位熟人是女性的概率为50%”变为“那位熟人是女性的概率为100%”。这就是通过“排除可能性”完成的更新。

另一方面,当通过朋友了解到同行的熟人是“公司的同事”时,就会发生与上面完全不同的更新。根据这一信息,可以完全排除熟人是公司外人士的可能性。不仅如此,假设朋友公司的男女比例为4∶1,你就应该使用这一比例更新自己的推论。在两种概率相加为1的前提下,男女的比例关系就应该是0.8∶0.2。你的推论自然应该发生更新,从“那位熟人是女性的概率为50%”变为“那位熟人是女性的概率为20%”。

如果总结起来,这种更新的方法具体是由下述步骤构成的:

第一步:获取信息。

第二步:根据信息,排除不可能出现的事件的概率。

第三步:关于不能排除的剩余事件的概率,重新变更比例关系。

第四步:根据修改后的比例关系,计算条件概率。

下面,我们试着将上文提到的具体实例套入四个步骤中。

首先,当获取的信息为“那位熟人是女子大学的同班同学”时:

第一步:获取“那位熟人是女子大学的同班同学”的信息。

第二步:排除是男性的概率。

第三步:在剩余概率中,男女比为0∶1。

第四步:在上述信息的前提下,那位熟人是女性的条件概率为100%。

其次,当获取的信息为“那位熟人是公司的同事”时:

第一步:获取“那位熟人是公司的同事”的信息。

第二步:排除来自公司以外的人的概率。

第三步:在剩余概率,也就是公司内的同事中,男女比为4∶1=0.8∶0.2。

第四步:在上述信息的前提下,那位熟人是女性的条件概率为20%。

当然,这些推理都是建立在事先对朋友带来的熟人没有任何了解的前提下的。比如,如果事先知道朋友总喜欢带男性的信息,那么条件概率也会随之发生变更。

顺便提一下,如果巧妙地使用这一方法,就会出现贝叶斯定理,也就是更新状态。贝叶斯定理是18世纪的数学家托马斯·贝叶斯提出的关于更新的方法论。在19世纪末20世纪初费希尔和内曼构建了现代统计学之后,贝叶斯推理就被完全遗忘了。

将这一理论重新挖掘出来并带入人们视野的是此前多次提到的沙万奇。沙万奇认为对于统计学而言,贝叶斯定理是非常重要的。沙万奇通过自己的方法重新激活了这一理论。他构建了主观概率理论,明确了贝叶斯定理的意义。在此后的50年中,统计学面临的大环境发生了重大变化,现在许多统计学家都将贝叶斯定理奉为基本理论,倍加重视。但是,关于贝叶斯定理,本书并未涉及更多内容。因此,如果想详细了解贝叶斯定理,请参照其他图书。

面对信息不够精确的情况应该如何处理呢?

根据上述条件概率实施的更新,是一种非常标准的思维方式。但是,使用条件概率也有比较多的限制,只有在精确了解信息结构的情况下才可以使用条件概率。然而,这种情况一般只会发生在数学领域,日常生活中很难遇到如掷骰子、掷硬币、抽卡片等符合数学要求的不确定现象。可以说,在这些现象中,没有任何受环境影响的模糊性因素。

日常生活中的不确定现象往往难以具备像掷骰子、掷硬币和抽卡片那样明确的结构,必须在不精确的结构中进行推理。

邓普斯特是正面对待推理结构的不精确性,并深入研究是否可以在这种状态下对概率进行预测的早期学者之一。针对产生不确定性的结构,邓普斯特认为不一定要极为精确地了解每一个因素,并提出了针对不确定信息状况的模型化方法。这些来自20世纪60年代的论文,是对第二章中提到的基于概率的思维方式,也就是针对状态的集合分布数值的方法论进行若干变更后的内容。

比如,遥控飞机起飞后,在某个视线所不及的地方坠毁。我们可以用数字1~100对它坠毁的区域用编号进行划分。也就是说,我们能够确定的只是这架遥控飞机肯定坠落在100个区域中的某个区域内。

在这种情况下,假设我们关注的焦点是这架遥控飞机究竟是坠落在陆地上,还是坠落在水中。我们用事件“陆”来表示“坠落在陆地上”,用事件“水”来表示“坠落在水中”。如果可以明确区分100个区域究竟是在陆地还是水面,那么事情就简单了,只要通过概率模型就可以完成计算。比如当40个区域是陆地,60个区域是水面时,可以判断出现“陆”这一事件的概率是0.4,出现“水”这一事件的概率是0.6。

邓普斯特真正关注的是无法进行精准分类的情况。比如,在上述100个区域中,有30个是陆地,有60个是水面,但是无法判断剩余的10个区域到底是陆地还是水面的情况。也就是说,必须按照下述对应关系考虑状态的情况:

区域1~30→“陆地”;

区域31~90→“水面”;

区域91~100→“陆地、水面”。

在三组区域中,最后的那组“对应多种不同的情况”,呈现出了“结构的不确定性”,这与标准的概率模型之间存在本质差异。

邓普斯特的上限概率和下限概率

在这种由于对应多种可能性导致结构不精确的情况下,邓普斯特的推理方法具体如下所示。这种方法并不晦涩难懂,是一种非常自然的思维方式。

首先,最保守地预测“坠落在陆地上”的概率。可以说“肯定落在陆地上”的是坠落在区域1~30的情况。关于区域91~100,“虽然可能落在地上,但是也存在不确定性”,可以忽略不计。因此,邓普斯特将“落在区域1~30之间”的概率0.3称为“坠落在陆地上”的下限概率(lower probability)。下限概率指的是“概率确实都高于这个值”,可以说是最保守的概率评估值。

其次,最乐观地预测“坠落在陆地上”的概率。“绝对不会坠落在地上”的是坠落在区域31~90的情况,其概率为0.6。因此,坠落在陆地上最大的可能性为0.4(1-0.6),邓普斯特将这一数值称为上限概率(upper probability)。如果换种方式进行说明,那就是“坠落在陆地上”的上限概率是“最乐观预测的概率”,等于“确实坠落在陆地上的概率”加上“可能坠落在陆地上的概率”。

针对这种结构中存在不精确性和不确定性的情况,邓普斯特提倡先计算上限概率和下限概率,然后将两者作为两个端点,并将两点之间的部分作为概率范围。

疾病诊断的问题

前文说明了“与日常生活中的不确定性结构相关的知识是不确定的、不够精确的”。证明这一观点的最好实例的就是医生诊断疾病。

美国有一部非常经典的医疗题材连续剧,名字叫作《豪斯医生》,讲述的就是诊断专家(diagnostician)豪斯进行医学推理的故事。豪斯是一位性格古怪的医学天才,经常会引起很多争议。诊断专家是指根据医学知识,彻底查清患者所患疾病的专业医生。也就是说,诊断专家从症状中推理出病因,并寻找适当的治疗方法。豪斯将“人人都会说谎”当成自己的座右铭。因此,他经常会潜入患者家里,搜索有毒物质和污染源,或者查看患者的日记和背景信息,从中找到做出诊断所需要的关键证据。遇到紧急情况时,他还会采取特殊措施,甚至故意加剧患者病情来验证自己的假设,有时还会诊断出罕见的病症。

只要你看过《豪斯医生》,就会深切地认识到诊断病症的难度。如果各种症状对应的病症只有一种,那么诊断起来就非常简单。但令人遗憾的是,现实并非如此。在实际诊断过程中,每个症状都会对应多种病症。

比如,《豪斯医生》中经常出现关于“传染病”和“自身免疫疾病”的诊断。传染病是指由于感染细菌等引起的疾病,主要通过抗生素进行治疗。自身免疫疾病是指由于患者的免疫系统出现问题,转而攻击患者自身导致的疾病,因此主要依靠类固醇等免疫抑制剂进行治疗。

诊断这两种病的难点在于:根据相同的症状,可以做出不同的判断,既可以怀疑患者得了传染病,也可以怀疑患者得了自身免疫疾病。也就是说,由于同一症状对应多种病症,因此具有模糊性和不确定性。在这种情况下,可能会出现患者得的是传染病,却被误诊为自身免疫疾病的情况。这样一来,医生可能会误用强效免疫抑制剂进行治疗,从而导致免疫系统停止工作,严重时甚至会造成患者死亡。针对这类患者,如果想实施安全合理的治疗,医生就必须考虑到“存在的所有可能性”,只能采取相对保守的治疗方案。

对于医疗领域出现的一种症状对应多种病症的实例而言,与通常的条件概率相比,可以说邓普斯特的上限概率和下限概率是更为合理的推理形式。

鉴别古董“陶罐”真伪的方法

继承并发展邓普斯特上限概率和下限概率理论的是一位名叫格伦·谢弗的数学家。谢弗的著作《证据的数学理论》(A Mathematical Theory of Evidence)提出了新的推理理论。谢弗提出的理论的关键在于需要考虑具体有多少“证据”用来对关注事件的可能性大小进行预测。下面,我们将引用谢弗列举的实例进行说明。

比如,有一件典型“中国风”的陶罐,我们需要推理判断它究竟是明朝的古董,还是赝品。我们将这件陶罐是明朝古董的事件简称为“明”,将其是赝品的事件简称为“赝”。然后,我们对这两种事件发生的可能性大小进行评估。事件“明”的可能性大小是指你对这一事件拥有多大信任度。对此,谢弗用“Bel(明)”表示。

Bel是Belief(信念)一词的缩写,表示的是对“明”的信任度。同样,针对“赝”的信任度,也可以用“Bel(赝)”来表示。

“明、赝”代表的事件是“陶罐要么是明朝的古董,要么是赝品,肯定属于其中一种情况”。由于这种假设肯定是成立的,因此其信任度为1。也就是说,Bel(明、赝)=1。

这一特点与概率推理是完全相同的。“陶罐要么是明朝的古董,要么是赝品,肯定属于其中一种情况”,出现这一事件的概率必然为1。

然而,信任度函数是一种与概率完全不同的思维方式。我们可以通过下述方法进行分析。

你现在完全没有“明”的证据,也没有“赝”的证据。在这种情况下,针对两者中的任何一种情况,分配的信任度都应该是0。也就是说,Bel(明)等于0,Bel(赝)也等于0。

这样一来,大家肯定就明白了为什么信任度函数与所谓的概率是不同的。因为在概率的情况下,如果“明”的概率为0,那么“赝”的概率肯定为1。与之相反,如果“赝”的概率为0,那么“明”的概率肯定为1。根本不会出现双方均为0的情况。但是,在谢弗的信任度函数中,非常重视证据。虽说一方缺乏证据证明自身成立,但这并不意味着另一方就一定有证据证明自身成立。因此,即使Bel(明、赝)等于1,也可能会出现Bel(明)等于0且Bel(赝)等于0的情况。

我们再来看一下多少存在一些证据的情况。假设陶罐的所有者是精通中国古董的人。由此,可以评估“明”的信任度为0.3。此外,陶罐看起来不太旧,可能不是古董。根据这一证据,可以评估“赝”的信任度为0.6。有一点希望大家特别注意,即使在这种情况下,Bel(明)与Bel(赝)之和也只有0.9,还是不足1。这就意味着缺乏足够的证据。

如果运用邓普斯特的上限概率和下限概率理论进行分析,结果就会变成下述情况。在遥控飞机坠毁的实例中,如果将区域1~30(陆地区域)作为事件“陆”的证据,则Bel(陆)等于0.3;如果将区域31~90(水面区域)作为事件“水”的证据,则Bel(水)等于0.6。此外,区域91~100(不能说一定是陆地,也不能说一定是水面),可以解释为证据不足的部分,也就是0.1。

主犯究竟是谁?

下面,我们结合一个稍微复杂一些的例子,对谢弗的理论进行更加深入的说明。

假设有嫌犯a、嫌犯b、嫌犯c三个涉嫌同一案件的犯罪嫌疑人,他们需要接受法庭的审判裁决。上述三人都接受有罪的指控,但都不承认自己是主犯。因此,必须通过审判决定到底谁是主犯。法官将根据三位嫌犯以及证人的证词,最终审议判决谁是主犯。

现在假设你是一名法官,请根据谢弗的方法,模拟自己是如何形成主观判断的。

首先,你要根据证人的证词,依次对嫌犯a、嫌犯b和嫌犯c为主犯的证据的信任度进行预测。

①嫌犯a为主犯的证据→0.2;

②嫌犯b为主犯的证据→0.1;

③嫌犯c为主犯的证据→0.1。

这些分别是关于每个“个人”的证据。但是,根据证人的证词不同,有些证据暗示“主犯是嫌犯a或嫌犯b”。这与单独证明嫌犯a为主犯或者嫌犯b为主犯的证据是完全不同的。你可以按照下述方式,预测这种证据的信任度。

④嫌犯a或嫌犯b中的一方为主犯的证据→0.2;

⑤嫌犯b或嫌犯c中的一方为主犯的证据→0.2;

⑥嫌犯a或嫌犯c中的一方为主犯的证据→0.1。

如果将①至⑥中的数据相加,所得之和为0.9,仍不到1。由于这是缺乏证据的部分,因此可以认为⑦嫌犯a或嫌犯b或嫌犯c为主犯的证据→0.1。

在这种情况下,对你而言,根据①进行推理,“嫌犯a为主犯”的信任度Bel(a)自然就是0.2。“嫌犯a或嫌犯b中的一方为主犯”的信任度Bel(a、b)就是①、②和④三个证据信任度数值相加之和,等于0.5。

由此可见,在嫌犯a单独为主犯的基础上,增加嫌犯b为主犯的可能性后,信任度由0.2增加至0.5。虽说如此,嫌犯b为主犯的信任度却不是两者之差的0.3。根据②,“嫌犯b为主犯”的信任度Bel(b)为0.1。

这与使用概率进行推理存在本质的区别。在依赖证据进行推理的谢弗理论中,存在许多不明确单独针对嫌犯a或嫌犯b,却又针对两者中某一方的证据。

如上所述,谢弗的信任度函数是在证据叠加的基础上计算出来的。因此,其判断标准与数学概率是不同的。

此外,在前文中曾经介绍过逻辑概率的概念,那是指根据证据赋予裁决概率或然性的思维方式。我们可以认为在这一点上,其与信任度函数之间是非常接近的。

D-S证据理论的更新

正如上文所述,无论是邓普斯特提出的一对多的上限概率和下限概率,还是谢弗提出的信任度函数,都不同于普通的概率理论。因此,其更新的机制自然也不相同。

上限概率、下限概率和信任度函数的更新,又被称为“D-S证据理论的更新”。下面,我们将结合上文中提到的法院裁决的实例进行分析说明。

现在,假设在审判过程中发现了新的证据,从客观上证明嫌犯c不可能是主犯。在这种情况下,应该如何更新“嫌犯a为主犯”这一判断的或然性呢?

在这种情况下,应该先删除③“嫌犯c为主犯”的证据。但是,应该将⑤“嫌犯b或嫌犯c中的一方为主犯”的证据纳入考虑范围。这是因为这一证据对证明无法完全排除嫌疑的“嫌犯b为主犯”具有强化支撑作用。因此,在目前将焦点对准嫌犯a和嫌犯b的情况下,应该试着按照“仅对嫌犯a一方不利的证据”“仅对嫌犯b一方不利的证据”以及“对两方都不利的证据”进行分类。

仅对嫌犯a一方不利的证据包括:

①嫌犯a为主犯的证据→0.2;

⑥嫌犯a或嫌犯c中的一方为主犯的证据→0.1。

①+⑥ = 0.3。

仅对嫌犯b一方不利的证据包括:

②嫌犯b为主犯的证据→0.1;

⑤嫌犯b或嫌犯c中的一方为主犯的证据→0.2。

②+⑤ = 0.3。

对两方都不利的证据包括:

④嫌犯a或嫌犯b中的一方为主犯的证据→0.2;

⑦嫌犯a或嫌犯b或嫌犯c中的一方为主犯的证据→0.1。

④+⑦ = 0.3。

由此可见,证据数值的比例关系为:

(嫌犯a为主犯的证据)∶(嫌犯b为主犯的证据)∶(嫌犯a或嫌犯b为主犯的证据)

=0.3∶0.3∶0.3

=1∶1∶1

因此,在获悉嫌犯c绝对不是主犯的信息后,你认为“嫌犯a为主犯”的可信度增加到1/3。在获悉信息之前,这一判断的可信度原来为0.2,现在增加了约0.13。这就是D-S证据理论的更新机制的实例。

有的读者可能会觉得从0.2变为1/3的变化不大,因此认为并不是多重要的事情。但是,如果仔细思考一下,你就会发现事实并非如此。我们每个人都有自己“无法忍受”的底线,用专业术语来说,就是阈值[1]。它代表着一个区间的极限值,如果超过这一数值,人们就会改变自己的行为。在学校中,关于旷课的最高课时数是有明确规定的。一旦超过这个数值,哪怕只超出一课时,也无法顺利毕业。这是一种典型的阈值。此外,朋友在我们心中的地位和形象,也是随着他的言行而不断更新的。一旦某位朋友的负面言行超过了我们能够接受的范围,恐怕我们只能将他从朋友列表中“拉黑”了。

在这种情况下,最终数值超出阈值的量可能很小,但确实会改变我们的行为。

这一特点在机械和人工智能领域表现得更为明显。在编程计算中,一旦超过了预先设置的阈值,就会发生急剧变化。

D-S证据理论的关键在于:即使明确嫌犯c不是主犯,也只是删除与嫌犯c相关的证据,不会影响嫌犯c与其他嫌犯相互关联的证据继续发挥作用。也就是说,进行更新,从获取的信息中删除“绝对不可能”的证据,但需要继续发挥其他证据的作用。

当需要谨慎决策时

D-S证据理论的更新机制,可以为医疗诊断提供谨慎的决策。

我们可以结合前文提到的实例,将嫌犯a、b、c分别替换为疾病a、b、c,并试着将①至⑦的证据解释为患者的症状。在这种情况下,通过对D-S证据理论的更新,可以排除疾病c的可能性。在此基础上,将③以外的症状全部列为考虑对象,用来判断患者患的是疾病a还是疾病b。在将具体疾病锁定在疾病a或疾病b之后,会发现针对各个疾病的信任度之和为2/3,并不满1。这是因为症状④至⑦增加了一定的模糊性和不确定性,“虽然症状表明患者所患的疾病属于疾病a或疾病b中的一种,但无法明确究竟是其中的哪一种”。在这种情况下,即使医生拥有明确的诊断——当信任度超过50%(0.5)时,就可以确诊疾病——也不足以判断症状就是疾病a或是疾病b引发的。也就是说,医生无法做出非疾病a就肯定是疾病b的诊断。

由此可见,与概率的更新相比,D-S证据理论的更新是一种更适合于医疗诊断的推理方法。

综上所述,与单凭直觉判断形势变化,临机采取应对方式相比,更新是一种更加理性的决策方法。正所谓“数字胜于直觉”,在真正掌握这种更新机制的基础上,积极思考并形成自己独特的运用证据的方式,是非常有意义的。

专题4 当你感到纠结无法做出决定时,帮你迈出关键一步的技巧

“羞耻心”是导致人们在沟通过程中态度消极的最大诱因。

人们在暗恋某人时,不敢轻易表白就是由于“羞耻心”作祟而难以迈出关键一步的典型代表。除了小部分人以外,大多数人都会对表白望而却步。这是因为一旦被表白对象拒绝,就会让人感到非常尴尬。

此外,虽然不是“表白”,但主动与很长时间没有联系的朋友搭话,也是需要非常大的勇气的。尽管突然联系不是什么大不了的事情,却容易被对方看成是自己在主动献殷勤,因此会令人感到非常“尴尬”。

另一个“羞耻心”束缚手脚、令人踌躇不前的例子是请求别人给自己“分配工作”。这种请求会令对方感受到你的弱小无能,需要你放下面子、抛弃羞耻心,主动放低姿态去求别人。然而,每个人心中都有一种难以言表的自尊,都不想被人轻视。因此,很多人对于这种事情往往都保持沉默,无论如何都不愿意主动向前迈出一步。

下面,我将介绍一种克服“羞耻心”的好方法,那就是充分利用“节令问候”。

我就曾经在元旦接到过来自许久未联系的朋友的问候邮件。我之所以不发邮件只是因为觉得没有什么特别的话题可以聊而已。但是,后来见面时听朋友说,他还担心我是因为什么事情生气了,所以才音信全无的。朋友耐心地对我解释了他发那封问候邮件的真正用意,“如果在元旦接到一封表达祝福的邮件,无论是谁都不会感到厌烦”。听完之后,我恍然大悟,觉得“确实如此”。

顺便提一下,我也有利用“节令问候”赢得人生转机的经验。

那是我30多岁时发生的事情,当时的我刚开始写书。但是,在出版了第二本书后,我就陷入了漫长的空窗期,一直拿不到下一本书的约稿合同,内心处于焦虑之中。在这种状态下,我的情绪非常低落,甚至有了放弃写作的想法。虽然身处困境,我却依然不愿意主动联系出版行业合作过的编辑,不想放下面子试着问问“能不能给个工作机会”,因为我觉得这种行为是非常丢面子的。

话虽如此,如果一直这样下去我就要陷入绝境了。面对山穷水尽的局面,我想到了一个巧妙的策略,那就是向所有我认识的编辑发送明信片。当时恰逢我刚刚搬完家,是一个非常好的时机。通过发送明信片告知别人自己搬家的消息是再自然不过的事情,接到的人根本不会感到唐突和惊讶。于是,我就向自己认识的编辑都寄送了明信片,上面特意写上“期待着与您合作”的字样。

当时,我根本没指望这样做能有什么立竿见影的效果。令人意想不到的是,明信片竟然发挥了重要的作用。恰好有一位之前在杂志社合作过的编辑刚刚转行到图书出版部门不久,需要大量稿件。对我而言,这是一个绝佳的机会。因此,虽然我只是一个初出茅庐的作者,却幸运地赢得了执笔新书的机会。以这本新书为契机,我涉猎的创作领域得到了大幅拓展。一些编辑在读了我的新书之后,也纷纷向我抛来橄榄枝,为我提供新的工作机会。现在,我在出版行业内也算是有一些知名度了。很难想象如果没有当初那些明信片,我的图书写作工作会发展到什么程度,恐怕早已画上终止符了。这样看来,“节令问候”真的可以发挥很大的作用。

[1]阈的意思是界限,故阈值又叫临界值,是指一个效应能够产生的最低值或最高值。阈值广泛用于很多领域,包括建筑学、生物学、化学、电学、心理学等。