一方面,进行调查,根据得知的结果进行进一步的调查,这样的思路很重要。另一方面,并不是所有的调查都能全部实施。在已知信息的范围内推测发生了什么情况,然后接着进行下一步分析,这种基本预测法目前比较流行。基本预测法是怎样的思维方式呢?
现在要招募临时的学生兼职者,有较多应聘者,最终有几名职员来进行面试。每个职员负责面试3人,人员随机分配。你拿到3人的简历,偶然取出来的简历是一位女性的。我们试想一下,你负责面试的3人全是女性的概率有多少?前提是应聘者中的男女人数相同。
我们罗列出所有可能的情况。为了方便说明,3人分别称为A、B、C。以下是所有的情况。
你取出来的简历碰巧是女性的,所以从上述的表格中选择女性的话,有以下12种可能性。(为了便于说明,添加编号)
最后,我们从推测取出来的简历是哪一份简历开始梳理。
如果取出来的简历属于女性1至女性3,那么就是情况2、情况3、情况4,这3种情况都是只有1名女性;如果取出来的简历属于女性4、女性5,就是情况5;如果取出来的简历属于女性6、女性7,就是情况6;如果取出来的简历属于女性8、女性9,就是情况7,这些情况都是有2名女性;如果取出来的简历属于女性10至女性12,就是情况8,这种情况有3名女性。
偶然选取的简历属于女性,说明简历有可能是属于女性1至女性12之一,共12种可能。那份简历如果是从3名都是女性的状态中选取出来的,就是情况8,共有3种可能。因此,概率就是3÷12=0.25。
关键点1. 把所有可能发生的情况列举出来
关键点2. 将情况分类并记录频率
关键点3. 对照确认想调查的情况是否符合条件
1. 把所有可能发生的情况列举出来
首先,把有可能发生的情况全部列举出来。
如果只考虑本次例子的最终状态,那么将男性与女性的人数分别表示出来的话(男性的人数、女性的人数),有(3名、0名)、(2名、1名)、(1名、2名)、(0名、3名)4种模式。而从上表知道,
3名都是男性的情况,有1种可能
2名是男性的情况,有3种可能
1名是男性的情况,有3种可能
0名是男性的情况,有1种可能
概率并不相同。
可以想象一下,类似于一个硬币投3次都是正面朝上的概率,跟硬币投3次有2次正面朝上的概率相比,后者的概率是前者的3倍,这样比较容易理解。要记住,需要把所有的情况都仔细罗列出来。
2. 将情况分类并记录频率
把所有的情况都罗列出来之后,数一数本次发生的情况可能会发生的频率。要认真确认,防止遗漏。
3. 对照确认想调查的情况是否符合条件
最后,计算出想调查的情况发生的概率。在本次的例子中,偶然取出的一份简历属于女性,我们要计算的是3份简历都属于女性的概率,所以想调查的情况是,取出3份女性的简历,总共有12份,那么3÷12=0.25。
同理计算其他的情况。3份简历中只有1名女性的情况也是有3种可能,所以概率是3÷12=0.25;3份简历中有2名女性的情况有6种可能,所以概率是6÷12=0.5。
练习题
在与上述背景相同的前提下,一个职员要负责4人的面试,当偶然取出的简历属于1名女性时,请思考一下,你负责的应聘者中,有2名男性、2名女性的概率是多少。
解答
与刚才一样,为了便于说明,我们把4名应聘者称为A、B、C、D,有可能发生的情况是以下16种。
抽到女性简历的可能性有32种。(为了方便说明,编上编号)
我们想调查的情况是,4份简历中有2名男性、2名女性的情况。表中的情况6至情况11符合条件。
在这个范围内抽取出的简历是女性有12种可能,即女性5至女性16之一。因此,4份简历包含2名男性、2名女性的概率是12÷32=0.375。
STEP UP!
在每个职员负责4人面试的前提下,偶然取出的简历是女性,4份简历包含2名男性、2名女性的概率刚才已经进行了计算。那么我们也算出其他情况的概率,计算的结果如下。
男性4名、女性0名的概率 0
男性3名、女性1名的概率 4÷32=0.125
男性2名、女性2名的概率 12÷32=0.375
男性1名、女性3名的概率 12÷32=0.375
男性0名、女性4名的概率 4÷32=0.125
这次碰巧抽取出女性的简历,所以以此为前提进行了概率的计算,而本身男性与女性的人数构成是怎样的概率呢?以下是计算的结果。
男性4名、女性0名的概率 1÷16=0.0625
男性3名、女性1名的概率 4÷16=0.25
男性2名、女性2名的概率 6÷16=0.375
男性1名、女性3名的概率 4÷16=0.25
男性0名、女性4名的概率 1÷16=0.0625
如果把原本的状态作为事前概率,把中途追加了信息、根据信息计算出来的概率作为事后概率的话,可以总结如下。
我们从左边开始解读。如果没有任何信息,男性、女性的构成比例等于事前概率。在增加了“包含1名女性”的信息后,男性、女性的构成比例就相当于事后概率。也就是说,在增加了信息后,概率会发生变化。另外,信息增加以后,从不确定的状态变化为增加了一个确凿的信息,所以精确度会提升。这种思路称为“基本预测法”。
这种思路还可以适用于以下的情境。请稍作思考。
假设有同样用黑布做成的不透明袋子共100个,其中有20个里面有金币。我们如果有一台装置可以在不打开袋子的情况下辨别是否有金币在内,且这个装置的实力情况如下:
·在有金币的时候,能正确辨别的概率为90%
·在没有金币的时候,能正确辨别的概率为95%
现在,从100袋中取出1袋,让这个装置辨别有没有金币在内,装置判断袋子内有金币。那么,这个袋子里真的有金币的概率是多少呢?
为了便于思考,我们假设100袋都让这个装置进行辨别。
首先,关于有金币的20袋,装置能准确辨别的概率是90%,也就是说装置将会判断出20×90%=18袋。
另一方面,有10%的概率会判断错误,即有2袋虽然是有金币的,但却会被判断为没有金币。
接着,关于没有金币的80袋,同样让装置去辨别的话,装置能准确判断的概率是95%,也就是说会判断80×95%=76袋是没有金币的。另一方面,因为错误率是5%,所以有4袋虽然是没有金币的,但却会被判断为有金币。
把整体情况进行整理后,如下表所示。
因此,这个装置判断有金币的次数是18+4=22次。在这里面,真正有金币的是18次,所以其概率是18÷22≈0.82。
本来在100袋里面,只有20袋装有金币,所以如果只是随便猜的话,猜中的概率是20%,而通过利用这个装置,猜中的概率可以提升到约82%。
我们在以上的部分说明了能够辨别袋子内是否有金币的装置,而这个装置也可以换成以下的内容来想象。
·根据图像数据辨别有没有生病的AI
·根据照片辨别问题位置的AI
·根据文字信息读取内容的AI
·预测明日天气的AI
我们不一定要依靠AI,其实在我们身边有许多方法,虽然准确率不是100%,但也可以以一定的精确度得出结论。在考虑应该如何解释AI判定的结果时,可以运用这些方法。
假设一个概率,根据所得的信息,再对假设的概率进行进一步修正,在无法预测下一步的情况下,这种方法被认为比较有效。如上文提到的,可以在解释AI算出的结果的时候使用这种方法,而且本来AI中应用的机器学习等技术背后也蕴藏着这种思路,大家有兴趣的话可以深入学习研究。
小结
√ 有一种方法是先算出事前概率,然后根据获得的信息更新概率
√ 罗列出所有可能的情况
√ 确认其中符合条件的情况
√ 根据所有情况的数量和符合条件的信息计算概率
√ 这是AI背后蕴藏的思路,是当今重要的方法,请大家掌握好