二、经济统计专业发展历史(1 / 1)

统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会末期,特别是进入资本主义社会以后,社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成不同的学派。统计学的产生和发展分为三个时期:古典统计学、近代统计学和现代统计学。统计学的发展主线:以社会经济问题为主要研究对象的社会经济统计,以方法和应用研究为主的数理统计。

统计学一词Statistics,源出于意大利文Stato,兼有“国家”和“情况”的意义。统计学家一词Statistician,源出于意大利文Statista,意为“处理国家事务的人”:a man who deals with affairs of the state,所以,统计学可理解为“国务活动人员感兴趣的事实的汇集”:a collection of facts of interest to a statesman.

在早期,统计学就是国情学。这种说法流行于16世纪的意大利,后来传播到法、德、荷等欧陆国家。在17~18世纪,这些国家大学里教授的“统计学”课程,实际上就是“国情学”,包括有关人口、经济、地理、乃至政治方面的内容。到19世纪初,逐步演变为现代西方统计学——Statistics。

(一)古典统计学时期(17世纪至18世纪)

1.政治算术学派

产生于17世纪中叶的英国,代表人物:威廉·配第和约翰·格朗特。产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。威廉·配第的代表作是《政治算术》。马克思称他为“政治经济学之父,在某种程度上说是统计学的创始人”。约翰·格朗特的论著《对死亡表的自然与政治观察》,第一次编制了初具规模的“生命表”。研究方法:从数量方面研究社会经济现象。

2.国势学派

创始人:17世纪德国的康令和阿亨瓦尔。产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。

海尔曼·康令(H.Conring)在大学开设“国势学”课程,对人口、版图、政体、财政、军备等方面进行了文字性记述。阿亨瓦尔称此学科为Statistik(德文:统计学),将统计学明确定义为“把国家的显著事项全部记述下来的学科”,其主要著作是《近代欧洲各国国势概论》。研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。

(二)近代统计学时期(19世纪初~20世纪初)

1.数理统计学派

该学派产生于19世纪中叶,代表人物是拉普拉斯和凯特勒。当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派。

法国数学家、统计学家拉普拉斯所著《概率论分析》,最早把概率论与政治算术联系起来。比利时统计学家、数学家、天文学家凯特勒把国势学派、政治算术学派和古典概率学派加以统一改造,融合成近代意义的统计学。凯特勒是数理统计学派的奠基人,国际统计学界有人称他为“统计学之父”。研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。

统计学在这个兴起阶段,还是一门意义和范围不太明确的学问,在它用文字或数字如实记录与分析国家社会经济状况的过程中,初步建立了统计研究的方法和规则。到概率论被引进之后,才逐渐成为一项较成熟的方法。最初卓有成效地把古典概率论引进统计学的是法国天文学家、数学家、统计学家拉普拉斯。因此,后来比利时统计学家、数学家和天文学家凯特勒指出,统计学应从拉普拉斯开始。

凯特勒(1796—1874),他被统计学界称为“近代统计学之父”“国际统计会议之父”。他一生著作颇丰,其中有关统计学方面的就有65种之多。1851年积极筹备国际统计学会组织,并任第一届国际统计会议主席。在此之后,先后被选为欧洲各国科学院的院士。他的最大贡献是将统计方法用于研究人类。他记录了苏格兰士兵的胸围,法国军队应征入伍者的身高,以及其他诸如此类的项目,并发现这些数字与平均值偏离的变化方式与掷骰子或弹在靶心周围散布的方式相同。1835年他第一次记下了这一点。后来,他将1846年比利时人口普查的数字用于他的统计分析。在这样做的过程中,他研究出来的许多法则,仍是现代人口统计工作的依据。他将结果制成图,画出各种测量值出现的频率,得到一条钟状曲线。(由于高斯经常使用这类曲线,所以人们常称这为高斯曲线。)于是,随机性闯入了人类王国。这又一次表明,支配着无生命宇宙的一些法则,也同样为生命(特别是包括人类在内)所遵守。从凯特勒的工作引出了“平均人”的概念,“人口统计”的思想也是由他的工作形成的,后者则决定了保险金额的大小。

拉普拉斯的主要贡献体现在以下几个方面:

(1)发展了概率论的研究。拉普拉斯第一种关于概率论的表述发表于1774年。从1812年起,先后出过四版《概率的解析理论》,是他的代表作。书中,拉普拉斯最早系统地把数学分析方法运用到概率论研究中去,建立了严密的概率数学理论。该书不仅总结了他自己过去的研究,而且还总结了前一代学者研究概率论的成果,成为古典概率论的集大成者。

(2)推广了概率论在统计中的应用。由于拉普拉斯是通过结合天文学、物理学的研究来从事概率研究的,所以,他能相当自觉、相当明确地指出:概率论能在广泛范围中应用,能解决一系列的实际问题。他在实际推广中的成绩是多方面的,主要表现在人口统计、观察误差理论和概率论对于天文问题的应用。1809—1812年,他结合概率分布模型和中心极限思想来研究最小二乘法,首次为统计学中这项后来最常用的手段奠定了理论基础。

(3)明确了统计学的大数法则。拉普拉斯认为:“由于现象发生的原因,是为我们所不知或知道了也因为原因繁复而不能计算;发生原因又往往受偶然因素或无一定规律性因素所扰乱,以至事物发展发生的变化,只有进行长期大量观察,才能求得发展的真实规律。概率论则能研究此项发展改变原因所起作用的成分,并可指明成分多少。”这是他通过天文学上的研究后所得的体会。他发现在观察天体运动现象中,当次数足够多时,能使个体的特征趋于消失,而呈现出某种同一现象。他指出这其中一定存在着某些原因,而非出于偶然。

(4)进行了大样本推断的尝试。在统计发展史上,人口的推算问题,多少年来成为统计学家苦苦探索的难题。直到十九世纪初,拉普拉斯才用概率论的原理迈出了关键的一步。在理论上,1781年拉普拉斯在“论概率”一文中,建立了概率积分,为计算区间误差提供了有力手段。1781—1786年提出“拉普拉斯定理”(中心极限定理的一部分),初步建立了大样本推断的理论基础。在实践上,拉普拉斯于1786年写了一篇关于巴黎人口的出生、婚姻、死亡的文章,文中提出根据法国特定地方的出生率来推算全国人口的问题。他抽选了30个市县,进行深入调查,推算出全国总人口数。尽管其方法和结果还相当粗糙,但在统计发展史上,他利用样本来推断总体的思想方法,为后人开创了一条抽样调查的新路子。

另一位对概率论与统计学的结合研究上做出贡献的是德国大数学家高斯(Carl Friedrich Gauss,1777—1855)。

高斯的主要贡献体现在以下几个方面:

(1)建立最小二乘法。在学生时代,高斯就开始了最小二乘法的研究。1794年,他读了数学家兰勃特(J.H.Lambert,1728—1777)的作品,讨论如何运用平均数法,从观察值中确定线性关系中的二个系数。1795年,设想了以残差平方和为最小的情况下,求得估计值。1798年完成最小二乘法的整个思考结构,正式发表于1809年。

(2)发现高斯分布。调查、观察或测量中的误差,不仅是不可避免的,而且一般是无法把握的。高斯以他丰富的天文观察和在1821—1825年间土地测量的经验,发现观察值x与真正值μ的误差变异,大量服从现代人们最熟悉的正态分布。他运用极大似然法及其他数学知识,推导出测量误差的概率分布公式。“误差分布曲线”这个术语就是高斯提出来的,后人为了纪念他,称这分布曲线为高斯分布曲线,也就是今天的正态分布曲线。高斯所发现的一般误差概率分布曲线以及据此来测定天文观察误差的方法,不仅在理论上,而且在应用上都有极重要的意义。

正态分布又称高斯分布。德国的10马克纸币,以高斯为人像,人像左侧有一正态分布的密度表达式及其图形。高斯在数学上有诸多贡献,但在10马克的纸币中与他相随的,是正态分布,可见正态分布不只在统计上,在数学上亦很重要。不过高斯倒不是第一位提出此分布的人,法国数学家德莫佛(De Moivre,1667—1754)早于他给出此分布。甚至一般认为丹尼尔·伯努利(Daniel Bernoulli,1700—1782)更早就发现了。有人称这种现象为误称定律(Law of Misnomer)。

正态分布之所以重要,原因很多,我们给出三个主要的原因:首先是正态分布在分析上较易处理。其次是正态分布的密度函数的图形为钟形曲线(bell-shaped curve),再加上对称性,使得很适合当作不少总体的机率模式。钟形且具对称的分布不少,但通常不像正态分布,在分析上如此容易驾驭。第三是由于中心极限定理(Central Limit Theorem),使得在不太强的条件下,正态分布可当作不少大样本的近似分布。

德国的10马克纸币

2.社会统计学派

19世纪后半叶,在欧洲兴起了社会统计学派。产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。德国大学教授尼斯首创,主要代表人物有恩格尔和梅尔。研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性。德国统计学家恩格尔在《比利时工人家庭的生活费》一文中提出了著名的“恩格尔法则”,引申为“恩格尔系数”。该学派认为统计学的研究对象是社会现象,统计应当包括资料的搜集、整理,以及对其分析研究。

近代描述统计学形成期间大致在19世纪中叶至20世纪上半叶。由于这种“描述”特色由一批原是研究生物进化的学者们提炼而成,因此历史上称他们为生物统计学派。生物统计学派的创始人是英国的高尔顿(F.Galton,1822—1911),主将是高尔顿的学生卡尔·皮尔逊(Karl Pearson,1857—1936)。

高尔顿的主要贡献体现在以下几个方面:

(1)初创生物统计学。为了研究人类智能的遗传问题,高尔顿仔细地阅读了三百多人的传记,以初步确定这些人中间多少人有亲属关系以及关系的大致密切程度,然后再从一组组知名人士中分别考察,以便从总体上来了解智力遗传的规律性。为了获得更多人的特性和能力的统计资料,高尔顿自1882年起开设“人体测量实验室”,在连续六年中,共测量了9337人的“身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、色觉及个人的其他资料”,他深入钻研那些资料中隐藏着的内在联系,最终得出“祖先遗传法则”。他努力探索那些能把大量数据加以描述与比较的方法和途径,引入了中位数、百分位数、四分位数、四分位差以及分布、相关、回归等重要的统计学概念与方法。1901年,高尔顿及其学生皮尔逊在为《生物计量学》(Biometrika)杂志所写的创刊词中,首次为他们所运用的统计方法论明确提出了“生物统计”(Biometry)一词。高尔顿解释道:“所谓生物统计学,是应用于生物学科中的现代统计方法”。从高尔顿及后续者的研究实践来看,他们把生物统计学看作为一种应用统计学,其研究范围,既用统计方法来研究生物科学中的问题,更主要的是发展在生物科学应用中的统计方法本身。

(2)关于变异。变异是进化论中的重要概念,高尔顿首次以统计方法加以处理,最终导致了英国生物统计学派的创立。1889年,高尔顿把总体的定量测定法引入遗传研究中。高尔顿通过总体测量发现,对动物或植物的每一个种别都可以决定一个平均类型。在一个种别中,所有个体都围绕着这个平均类型,并把它当作轴心向多方面变异。这就是他在《遗传的天赋》一书中提出的“平均数离差法则”。

(3)关于“相关”。统计相关法是由高尔顿创造的。关于相关研究的起因,最早是他因度量甜豌豆的大小,觉察到子代在遗传后有“返于中亲”的现象。1877年他搜集大量人体身长数据后,计算分析高个子父母、矮个子父母以及一高一矮父母的后代各有多少个高个子和矮个子子女,从而把父母高的后代高个子比较多、父母矮的其后代高个子比较少这一定性认识具体化为父母与子女之间在身长方面的定量关系。1888年,高尔顿在《相关及其主要来自人体的度量》一文中,充分论述了“相关”的统计意义,并提出了高尔顿相关函数(即现在常用的相关系数)的计算公式。

(4)关于“回归”。1870年,高尔顿在研究人类身长的遗传时发现:高个子父母的子女,其身长有低于他们父母身长的趋势;相反,矮个子父母的子女,其身长却往往有高于他们父母身长的趋势,从人口全局来看,高个子的人“回归”于一般人身长的期望值,而矮个子的人则作相反的“回归”。这是统计学上“回归”的最初含义。1886年,高尔顿在论文《在遗传的身长中向中等身长的回归》中,正式提出了“回归”概念。

皮尔逊的主要贡献体现在以下几个方面:

对生物统计学倾注心血,并把它上升到通用方法论高度的是皮尔逊。皮尔逊的一生是统计研究的一生,他对统计学的主要贡献有:

(1)变异数据的处理。生物统计中所取得的数据常常是零乱的,很难看出其所以然。为此,皮尔逊首先探求处理数据的方法,他所首创的频数分布表与频数分布图如今已成为统计方法中最基本的手段之一。

(2)分布曲线的选配。19世纪以前,人们认为以频数分布描述变异值,最终都表现为正态分布曲线。但是,皮尔逊从生物统计资料的经验分布中,注意到许多生物上的度量不具有正态分布,而常常呈偏态分布,甚至倾斜度很大;也不一定都是单峰,也有非单峰的。说明“唯正态”信念并不可靠。1894年,他在《关于不对称频率曲线的分解》一文中首先把非对称的观察曲线分解为几个正态曲线。他利用所谓“相对斜率”的方法得到12种分布函数型,其中包括正态分布、矩形分布、J型分布、U型分布或钟型分布等。后来经费歇尔(R.A.Fisher,1890—1962)的进一步研究,皮尔逊分布曲线中第Ⅰ、Ⅱ、Ⅲ、Ⅳ及Ⅶ型出现在小样本理论内。尽管,皮尔逊的曲线体系的推导方法是缺乏理论基础的,但也给人们不少启迪。

(3)卡方检验的提出。1900年皮尔逊独立地又重新发现了χ2分布,并提出了有名的“卡方检验法”。在自然现象的范围内,χ2检验法运用得很广泛。后经费歇尔补充,成为小样本推断统计的早期方法之一。

(4)回归与相关的发展。回归与相关,经皮尔逊进一步作了发展后,这两个出自于生物统计学领域的概念,便被推广为一般统计方法论的重要概念。1896年,他在《进化论的数理研究:回归、遗传和随机**》一文中得出至今仍被广泛使用的线性相关计算公式。皮尔逊还得出回归方程以及回归系数的计算公式。此外,在1897—1905年,皮尔逊还提出复相关、总相关、相关比等概念,不仅发展了高尔顿的相关理论,还为之建立了数学基础。

(三)现代统计学时期(20世纪初至今)

1.数理统计学发展的主流:这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。从描述统计转向推断统计学。20世纪初,英国统计学家戈塞特创立了小样本理论,开创了统计学的新纪元。其后,费歇尔、皮尔逊等人进一步发展,建立了统计假设理论,建立了统计学的数学框架。20世纪50年代以后,受计算机、信息论等现代科学技术的影响,新的研究领域层出不穷。例如:多元统计分析、现代时间序列分析、贝叶斯统计、非参数统计等。

现代推断统计学形成期间大致是20世纪初叶至20世纪中叶。人类历史进入20世纪后,无论社会领域还是自然领域都向统计学提出更多的要求。各种事物与现象之间繁杂的数量关系以及一系列未知的数量变化,单靠记录或描述的统计方法已难以奏效。因此,相继产生“推断”的方法来掌握事物总体的真正联系以及预测未来的发展。从描述统计学到推断统计学,这是统计发展过程中的一个大飞跃。统计学发展中的这场深刻变革是在农业田间试验领域中完成的。因此,历史上称之为农业试验学派。对现代推断统计的建立贡献最大的是英国统计学家戈塞特(W.S.Gosset,1876—1937)和费歇尔。

t分布是统计中的一个重要分布,它与标准正态分布的微小差别是戈塞特(Gosset W.S.1876—1937)提出的。戈塞特是英国一家酿酒厂的化学技师,在长期从事实验和数据分析工作中,发现了t分布。但在当时,Gosset的公司害怕商业机密外泄,所以禁止员工对外发表文章。所以,Gosset在1908年以“Student”笔名发表此项结果,故后人又称它为“学生氏分布”。在当时正态分布一统天下的情况下,戈塞特的t分布没有被外界理解和接受,只能在他的酿酒厂中使用,直到1923年英国统计学家费歇尔给出t分布的严格推导并于1925年编制了t分布表后,t分布才得到学术界的承认,并获得迅速的传播、发展和应用。

1908年,戈塞特首次以“学生”(Student)为笔名,在《生物计量学》杂志上发表了《平均数的概率误差》。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。后来,戈塞特又连续发表了《相关系数的概率误差》(1909)、《非随机抽样的样本平均数分布》(1909)、《从无限总体随机抽样平均数的概率估算表》(1917)等等。这些论文的完成,为“小样本理论”奠定了基础;同时,也为以后的样本资料的统计分析与解释开创了一条崭新的路子。由于戈塞特开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把戈塞特推崇为推断统计学(尤其是小样本理论研究)的先驱者。

费歇尔一生先后共写作论文395篇。在世界各国流传最广泛的统计学著作是:《供研究人员用的统计方法》(1925)、《自然选择的遗传原理》(1930)、《试验设计》(1935)、《供生物学、农学与医学研究用的统计表》(1938)、《统计估计理论》(1938)、《对数理统计的贡献》(1950)、《统计方法和科学推断》(1956)等。当时,他在统计学方面居世界领先地位,他的贡献是多方面的。

(1)“通用方法论”。费歇尔非常强调统计学是一门通用方法论,他认为无论对各种自然现象或社会生活现象的研究,统计方法及其计算公式“正如同其他数学科目一样,这里同一公式适用于一切问题的研究”。他指出“统计学是应用数学的最重要部分,并可以视为对观察得来的材料进行加工的数学”。

(2)“假设无限总体”。费歇尔认为,在研究各种事物现象,包括社会经济现象时,必须把具体物质内容的信息舍弃掉,让统计处理的只是“统计总体”。比如说,“如果我们已有关于一万名新兵身长的资料,那么,统计研究的对象不是新兵的整体,而是各种身长尺寸的总体”。显然,费歇尔只是对构成统计总体各因素的某些标志感兴趣而不是各因素的本身。其目的就是为了使问题简化,便于统计上的处理。他在1922年所写的《关于理论统计学的数学基础》(1922)一文中,提出了一个重要的概念:“假设无限总体”。所谓假设的无限总体,即现有的资料就是它的随机样本。

(3)抽样分布。费歇尔跨进统计学界就是从研究概率分布开始的。1915年,他在《生物计量学》杂志上发表《无限总体样本相关系数值的频率分布》(1915)。由于这篇论文对相关系数的一般公式作了论证,对后来的整个推断统计的发展有一定贡献。因此,有人把这篇论文称为现代推断统计学的第一篇论文。1922年,费歇尔导出相关系数的分布,后来还编制了《Z曲线末端面积为0.05、0.01和0.001的t数值分布表》。1924年,费歇尔对t分布、χ2分布和Z分布加以综合研究,使戈塞特的t检验也能适用于大样本,使皮尔逊的χ2检验也能适用于小样本。1938年,费歇尔与耶特斯合编了《F分布显著性水平表》,为该分布的研究与应用,提供了方便。

(4)方差分析。方差和方差分析两词,由费歇尔于1918年在《孟德尔遗传试验设计间的相对关系》一文中所首创。方差分析也称变异数分析,其系统研究开始于1923年费歇尔与麦凯基(Macken、ie,WA)合写的《对收获量变化的研究》一文。而于1925年,费歇尔在《供研究人员用的统计方法》中对方差分析以及协方差分析进一步作了完整的叙述。“方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”。方差分析简单实用,大大提高了试验分析效率,对大样本、小样本都可使用。

(5)试验设计。自1923年起,费歇尔陆续发表了关于在农业试验中控制试验误差的论文。1925年他提出随机区组法和拉丁方法,到1926年,费歇尔发表了试验设计方法的梗概;这些方法在1935年进一步得到完善,并首先在卢桑姆斯坦德农业试验站中得到检验与应用,后来又被他的学生推广到许多其他科学领域。

(6)随机化原则。费歇尔在创建试验设计理论的过程中,提出了十分重要的“随机化”原则。他认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。所以,他把随机化原则放在极重要的地位,“要扫除可能扰乱资料的无数原因,除了随机化方法外,别无他法。”1938年,他和耶特斯合作编制了有名的Fisher Yates随机数字表,利用随机数字表保证总体中每一元素有同等被抽取的机会。这样,费歇尔就把随机化原则以最明确、最具体化的形式引入统计工作与统计研究中。费歇尔在统计发展史上的地位是显赫的,这位多产作家的研究成果特别适用于农业与生物学领域,但它的影响已经渗透到一切应用统计学,由此所提炼出来的推断统计学已越来越被广大领域所接受。因此,美国统计学家约翰逊(P.O.Johnson)于1959年出版的《现代统计方法:描述和推断》一书中指出:“从1920年起一直到今天的这段时期,称之为统计学的费歇尔时代是恰当的”。

2.社会统计学的发展趋势:这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。

(1)理论统计:研究统计方法的数学原理。

(2)应用统计:研究理论统计学在各领域的具体应用。例如:生物统计、管理统计、医疗卫生统计。

(3)社会经济统计学:在德国社会统计学的影响下,以苏联为首的社会主义国家逐步建立和发展了社会经济统计学,其理论和方法曾成功地应用于社会主义的计划经济分析。然而由于当时国际意识形态上的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。

(4)中国的统计学:新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。在1953年,中国人民大学首先创立了统计学系,并招收了第一批本专业的学生,但由于当时缺乏资金和教师,招收的人并不多。随后,华中科技大学、清华大学相继设立了统计学专业,为统计学专业培养了许多优秀的人才。过去,由于政治思潮的影响,全国各高校陆续被停止招生,统计学专业也不例外,那个时期基本上没有招生。直到1978年,改革开放后,中国各方面的建设都逐渐步入正轨,与此同时,由于经济发展的需要,各种统计信息显得尤为重要。

80年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。1913年,顾澄教授翻译了统计名著《统计学之理论》,这是英国统计学家尤尔在1911年新出版的关于描述统计学的著作,也就是英美数理统计学传入中国之始。之后有1922年翻译英国爱尔窦登的《统计学原理》、1929年翻译美国金氏的《统计方法》、1938年翻译鲍莱的《统计学原理》、1941年翻译密尔斯的《统计方法》《经济和商业应用统计方法》。密尔斯的著作对中国统计学界影响较大,曾被推崇为统计学范本。费歇尔的理论和方法也很快传入中国,在20世纪30年代,“生物统计与田间试验”就作为农学系的必修课程,最早有1935年王绶编著出版的《实用生物统计法》,随后有范福仁著于1942年出版的《田间试验之设计与分析》。新中国成立后,中国科学院生物物理研究所的杨纪柯在介绍、推广数理统计学上做了大量工作。1963年他与汪安琦一起翻译出版了G.W.斯奈迪格著《应用于农学和生物学试验的数理统计方法》,同年,他编写出版了《数理统计方法在医学科学中的应用》。

接着,郭祖超的《医用数理统计方法》(1963),范福仁的《田间试验技术》(1964)、《生物统计学》(1966),赵仁熔的《大田作物田间试验统计方法》(1964)相继问世。到了20世纪70年代,中国科学院数理研究所数理统计组先后出版了《常用数理统计方法》(1973)、《回归分析方法》(1974)、《方差分析》(1977)、《正交试验法》(1975)、《常用数理统计用表》(1974)。薛仲三的《医学统计方法和原理》(1978)、上海师范大学数学系概率统计研究组的《回归分析及其试验设计》(1978)等,这些都有力地推动了数理统计方法在中国的普及和应用。

1978年12月,国家统计局在四川峨眉召开了“全国统计教学,科研规划座谈会”会上明确提出“统计工作部门应该更好地运用数理统计方法”,带动了统计专业的大发展。全国许多院校陆续设立统计学专业,有北京交通大学、北京大学、山东大学、首都经济贸易大学等,并开始扩招学员。同时,各地教委也增设了中专、夜大,来培训统计人才。不少统计学家认为,统计学正面临着一个新的突破时期,或者说,导致了一个需要改革的时期,主张统计学要重视理论联系实际,要“推倒围墙”重视与其他学科的交流和渗透,主张在统计教育上实行这种变革,以适应时代的发展需要。各高等院校相继扩大招生,吸引了一批致力于统计学专业研究和开发的优秀教育者们,为统计学的发展共同努力。到目前为止,统计学专业又设立了硕士研究生,其学历层次有硕士、学士和专科,每年招生量不断扩大。

这以后有关统计学的教材与论著如雨后春笋般涌现,如南京农业大学主编农业院校统编教材《田间试验和统计方法》(1979年第一版、1988年第二版)、贵州农学院主编农业院校统编教材《生物统计附试验设计》(1980年第一版、1989年第二版),林德光编著的《生物统计的数学原理》(1982),张尧庭、方开泰编著的《多元统计分析引论》(1982),莫惠栋编著的《农业试验统计》(1988年第一版,1994年第二版)、明道绪主编的《兽医统计方法》(1991)、吴仲贤主编的《生物统计》(1994),俞渭江、郭单元编著的《畜牧试验设计》(1995)等,译著有:杨纪珂、孙长鸣翻译出版的R.G.D.斯蒂尔、J.H.托里著的《数理统计的原理与方法适用于生物科学》(1979),关彦华、王平翻译[日]吉田实著《畜牧试验设计》(1984)等。随着计算机的迅速普及,统计程序SAS,SPSS等的引进,统计学在中国的应用与研究出现了崭新的局面。

现在,中国的经济将和世界融合,随着社会经济的发展,要求统计提供更多的统计方法,社会科学本身不断地向细分化与定量化发展,也要求统计能提供更有效的调查整理、分析资料的方法。这样一来,社会对统计人才的要求就更多了,这种社会需求,促使统计学专业的教育发展已迫在眉睫。而且,由于国际化的产生,中国的统计学专业也要和国际接轨,以便于更好地为宏观和微观主体服务。就以上而言,本专业的发展趋势将会有三种。

第一,本专业要改进和完善国民经济的换算体系,逐步与联合国SNA接轨。随着数学的发展,本专业将越来越广泛地应用数学方法。本专业的新分支或以数理统计为基础的边缘学科将形成,新分支如抽样理论,非参数统计,多变量分析和时间序列分析等;边缘学科如经济计量学,工程统计学,天文统计学等等。今后尤其要借助计算机,促使本专业的教学逐步完善。

第二,本专业将进一步推进中国官方统计与国际教育接轨,首先是统计标准体系的接轨,其次是统计调查方法的国际化,再次是调查表设计的国际化,统计指标计算方法的国际化,再次是统计信息发布的国际化,最后是严格遵循为调查者保密的原则。

第三,本专业要着力于改进有关统计指标体系的教学,包括清理现行统计指标体系,规范统计指标的名称、定义、口径及计算方法,使之尽量与国际通用标准一致。计算一些派生指标,以反映我国经济,特别是服务业的现状。进一步加强“三资”统计,了解外资进入我国的情况,为宏观决策提供准确、可靠的依据。

中国经济发展的对外合作度明显增大,风险也随之增加,各个贸易、外资独资、合资伙伴出现得越多,风险就会越大,因而,统计学专业的教学,将加大力培养人才,尽快建立健全我国国民经济运作的安全预警监测系统,以保障国家的安全。