本书的特点
0-1 从零基础达到应用水平
本书是“贝叶斯统计学”的超级入门书。“超级”的含义:
● 从零基础开始学习
● 抛开烦琐的符号和计算过程,学习运用贝叶斯统计
● 不只是随便说说,而是毫无保留地传授知识
对贝叶斯统计学感兴趣的人不在少数。然而此前的教科书,导入部分编写浅显,中途却难度骤增,这使很多读者大受挫折。这是因为在尚未理解贝叶斯统计的本质时,就被灌输了一大堆概率符号,使得理解起来更为困难。
为了不再重蹈这样的覆辙,本书编写之时做了一些功课,具体会在下节进行说明:
0-2 仅使用面积图和简单算术
贝叶斯统计的基础是概率公式——“贝叶斯公式”,它立足于“条件概率”的发展事项。“贝叶斯公式”是高等数学中很难理解的一个概念,原因有二:第一,公式复杂而不够直观;第二,条件概率在某种程度上属于“不可靠的”概念,对于思维缜密的人来说总觉得“哪里有些奇怪”。
事实上,上述第二点在贝叶斯统计中是至关重要的。因为正是这份“不可靠”,才是贝叶斯统计的本质,它与便利性息息相关。后面我们会讲到,贝叶斯统计在20世纪初曾因为其“不可靠”而遭到批判,一度被斥于统计学之外。但由于贝叶斯统计的“不可靠”与“便利性”为表里一致的关系,“正因为不可靠才得以运用”。在一部分学者对于这种“便利性”的关注下,贝叶斯统计于20世纪后半期恢复了其应有的地位。在21世纪的今天,贝叶斯统计已经成为统计学的主流。
笔者着重考虑了这两点,在编写过程中也有所侧重,并做了如下功课。
功课1 将不出现“贝叶斯公式”(极少一部分除外)的方针贯彻到底
以“通过面积图进行图解”的方针作为贝叶斯公式的替代。从本质上来讲,二者是相同的,然而对于大多数读者而言,图解的方式更加直观且易于理解。同时,通过“面积图”可以更清晰地看出“贝叶斯公式”的“不可靠”和“便利性”究竟体现在哪里。
功课2 只需简单算术的计算水平即可
这意味着,只需要会做四则运算就可以掌握了,连开方和文字式计算都不需要。而且这其中的四则运算,即使是不擅长手算的人也可以借助计算器轻而易举地完成。
当然,在本书末尾会出现“贝塔分布”“正态分布”这些有难度的概念。因为如果不介绍这些概念,是无法达到前文所述“毫无保留的传授”程度的。全面理解这些概念,需要用到大学的微分积分知识,这对于许多读者来说是很大的负担。因此在本书中也只能作一些相对简单的解说。
这也就是说,本书的方针——向读者灌输仅通过四则运算就能掌握的公式。这也是本书编写时所做的功课之一。在这个意义上,本书并非“充分齐全”的教材。然而如果想要“充分理解”贝叶斯统计学的人,不妨在读过本书之后再试着挑战一下专业书籍。本书的目的是抛开烦琐的数学概念,将“贝叶斯统计学隐藏的本质”剖析呈现出来。
0-3 比尔·盖茨也在关注它!贝叶斯统计在商业活动中的应用
随着因特网的普及和同步技术的发展,贝叶斯统计开始运用于商业领域。通过互联网可以实现自动收集顾客的购买和检索记录,从而推测顾客的类别。在这一点上,贝叶斯统计学完胜传统意义上的统计学。
如今,许多互联网企业都在实际应用贝叶斯统计。其中,微软由于很早就开始在商业活动中运用贝叶斯统计学而闻名。Windows的操作系统帮助功能中就导入了贝叶斯统计。此外,在网上搜索“小孩病症”的时候,优先显示可靠结果的软件也已经开发出来。微软的前董事长比尔?盖茨在1996年曾在报纸内容中称,微软之所以在激烈的市场竞争中胜出,正是由于采用了贝叶斯统计。比尔?盖茨还在2001年关于基本方针的演讲中称,微软的21世纪战略正是贝叶斯统计战略,公开表示,已经在全世界范围内挖到了许多贝叶斯统计研究人才。该发言引起了很大关注。
谷歌搜索引擎的自动翻译系统中也引入了贝叶斯统计技术。
当然,贝叶斯统计技术在IT企业之外的各个领域也有着广泛应用。例如,消除传真图像中的杂音就运用了贝叶斯统计技术。此外,医疗领域的“自动诊断系统”等也需要用到贝叶斯统计。
通过阅读本书可以得知,贝叶斯统计的优势在于,“在数据少的情况下也可以进行推测,数据越多,推测结果越准确”,以及“对所获的信息可做出瞬时反应,自动升级推测”的学习功能。了解了这一点之后,就完全可以理解为什么贝叶斯统计是非常适合应用于高端商业的技术了。
从事商业活动的人,如果能够熟练使用贝叶斯统计,那是再好不过的。本书中的案例和解说,为这一类人群提供了很好的参考。
0-4 贝叶斯统计依存于人的心理
在0-2节中有提到,“贝叶斯统计在某种程度上是不可靠的”。究其原因,是由于贝叶斯统计中所涉及的概率是“主观的”。换言之,通过贝叶斯统计得到的概率并非客观的数值,而是依存于人的心理的主观数值。在从这个意义上讲,贝叶斯统计具备了一定的“思想”。也正是因此,注重客观性的科学界为贝叶斯统计打上了“假冒伪劣”的烙印,并导致它一度消亡。
然而,遗憾的是,关于贝叶斯统计学的绝大部分书籍中,并未对这一问题进行记载。也许是作者们不愿将其公之于众,抑或只是因为他们对此不甚了解罢了。实际上,几乎没有一本教科书对于这个问题正面进行过阐述。然而,所谓的“主观性”和“思想性”,才正是贝叶斯统计学的本质和它具有便利性的根本原因所在。因此,在解说贝叶斯统计学的时候,如果忽视掉这一点,是难以将贝叶斯统计学的本质传达给读者的。
本书不刻意避开贝叶斯统计的“主观性”和“思想性”,而是将这些特点展现出来进行解说,特别是对于贝叶斯统计学与传统的统计学之间的差异进行详解。希望众多读者能够为贝叶斯统计学的神奇和有趣拍手称赞。
0-5 附带简单的填空练习题,适合自学
本书沿袭之前出版的《完全自学 统计学入门》(钻石社)的编写方法,用最详尽的语言解释说明,并在每一讲之后设置简单的填空练习题。学习数学的最佳方法是做一些简单的练习题。本书中收录的练习题并非应用题的形式,而是用来对讲义内容进行巩固的,希望各位读者认真练习,加深理解。
读完这本书,您一定会产生这样的想法:
“咦?明明没有经过登山训练,却不知不觉到了山顶呢!”
那么,就让我们向着山顶,出发吧。