三、数据资料的分析——假设检验(1 / 1)

根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分,其目的在于根据已知的情况,在一定概率意义上估计、推断未知的情况。总体参数估计可参阅王孝玲著《教育统计学》第六章,该书主要讨论假设检验。

(一)假设检验的概述

假设检验是为了确定统计量的差异是什么原因引起的。有两种原因可引起统计量的差异:一种是由于它们来自两个不同的总体,统计量之间的差异是两个总体的差异;另一种是由抽样误差引起的,不是本质的差异。

在一般的教育科学研究中,研究人员获得了样本的相关信息,但真正关心的是能否通过研究样本间的差异,推断到总体间的差异。假设检验就是根据一定的概率,通过建立假设,并根据已知条件验证假设的真假,从而由样本的差异推论总体差异的过程。如假设为研究两个城市大班幼儿创造性思维发展的差异情况,在两城市分别随机抽取了一定数量的样本进行测试,并得到了测试成绩的平均数和标准差。那么该研究就是要根据一定的概率,通过建立假设,并根据两个样本的平均数、标准差等,来验证假设的真假,从而由样本的差异推断总体间(两个城市大班幼儿创造性思维发展)的差异情况。

假设检验是在建立假设的基础上进行的,没有假设,就没有假设检验。假设一般有两种,即虚无假设(又称零假设)(H0)和研究假设(又称备择假设)(H1)。虚无假设是关于当前样本所属的总体与假设总体无区别的假设,即认为两者之间没有差异。研究假设是在假设检验前,研究者根据有关理论和已有的经验,或者是根据对总体和样本的了解,对研究结果预先作出的一个大致的假设,是研究者希望证实的假设。

假设检验的基本思想是运用“反证法”进行的推理,即通过检验H0的真伪来反证H1的真伪:证实了虚无假设的真,研究假设就为假;证实了虚无假设的假,研究假设就为真。

统计学上把拒绝虚无假设的概率称为显著性水平。一般常用的显著性水平有两种:一种是以概率等于或小于0.05的事件作为小概率事件;一种是以概率等于或小于0.01的事件作为小概率事件,用p≤0.05,p≤0.01表示。根据p值的大小,判断假设H0成立与否,从而判断出样本与总体参数之间的差异性程度。表11-5是根据p值推断假设检验的规则。

表11-5 统计学意义上的假设检验推断规则

平均数的差异显著性检验是常用的参数检验方法,分两种情况。

一是关于样本平均数与总体平均数差异的显著性检验:在大样本前提下(样本总数超过30个),且总体服从正态分布,总体方差已知的情况下,用Z检验;而在小样本前提下,总体方差未知的情况下,则用T检验。

二是关于两组样本平均数差异的显著性检验,如两个总体都服从正态分布,总体方差已知的情况下,用Z检验;而在总体方差未知的前提下,用T检验。

方差及方差差异的显著性检验也分为两种情况:一是样本方差与总体方差差异的检验,用卡方检验(Χ2检验)。二是两个样本方差差异性的检验,用F检验。

计数资料的统计检验主要用Χ2检验,可以用来同时检验一个因素的两项或多项分类的实际观测数据,与某理论次数分布是否一致的问题,或有无显著性差异的问题;还可以用于检验两个或两个以上因素的各项分类之间,是否有关联或是否具有独立性问题。

(二)Z检验和T检验(平均数差异的显著性检验)

1.平均数差异的显著性检验

(1)平均数差异的显著性检验是研究两个平均数的差异是否显著的问题,包括两种情况:

(2)教育科学研究中Z检验和T检验常用来进行平均数差异的显著性检验,但因两者是基于不同的统计分布原理进行的检验,因此各自适用的条件有所不同,简单来说,Z检验一般是对大样本平均数差异的显著性检验,T检验是对小样本平均数差异的显著性检验。应用时请务必明确各统计检验方法及公式的使用条件!

上述两种统计检验的步骤基本类似,具体如下。

①建立虚无假设(根据检验的要求有下列几种)。

H0:μ1=μ2——双侧检验

H0:μ1 ≥μ2或μ1≤μ2——单侧检验

选择双侧还是单侧检验,是由研究假设决定的,当只想检验参数是否有差异而不考虑方向时,用双侧检验,当须知道两个参数谁大谁小时,用单侧检验。

②计算统计量。根据数据资料的特点及研究需要,选择适当的公式代入相关数据进行计算。

③确定显著性水平并查表得出相关统计量的临界值。α的值,在教育科学研究中一般取0.05或0.01。当α=0.05时,Z检验的临界值查Z分布表后得知为1.96;当α=0.01时,临界值为2.58(均为双侧检验,单侧检验的临界值也可查表得知)。而T检验的临界值因受自由度df的影响,事先无法给出,具体应在自由度计算出后,再查T分布表。(自由度df是指任何变量中可以自由变化的数目,df一般为n-1)

④进行统计决断,详见表11-6。

表11-6 Z检验和T检验的统计决断对比表

2.Z检验

Z检验在教育科研中常用它来进行大样本(n≥30)平均数差异的显著性检验,根据具体条件的不同,可分别应用以下公式来计算。

(1)单总体Z检验。

单总体Z检验是对一个样本平均数与一个已知的总体平均数的差异是否显著的检验。

其检验所使用的统计量公式如下表11-7所示。

表11-7 单总体Z检验的公式

(2)双总体Z检验。

双总体Z检验是对两个样本平均数所来自的两个总体的平均数差异是否显著检验。双总体Z检验主要适用于两个独立大样本(n1≥30,n2≥30)平均数差异的显著性检验。独立样本是指两样本来自两个没有关系的总体。其计算统计量的公式如表11-8所示。

表11-8 双总体Z检验的公式

3.T检验

T检验是应用范围较广的一种检验,它通常用于小样本(n<30),总体为正态分布,总体方差未知的情况。

(1)单总体小样本的T检验。

检验统计量公式为:

(2)双总体独立小样本的T检验。

独立样本检验的统计量公式为:

当n1=n2时,公式变为:

说明:双总体独立小样本的T检验,要求进行方差齐性检验。(详见F检验)

(3)相关样本的T检验。

相关样本是指两个样本的数据之间存在一一对应的关系。相关样本的判断可以从两个角度确定:

①如果两个样本的数据来自同一组被测对象,这两个样本为相关样本;

②如果两个样本的数据来自两组彼此配对的被测对象,这两个样本也称为相关样本。

表11-9 相关样本T检验的公式

(三)F检验

F检验是基于F分布进行的统计检验,可用来进行方差齐性检验(即方差差异是否显著的检验)和方差分析(本书略,具体内容可参考相关教育统计教材)。

前面在双总体独立小样本的T检验部分,其公式的适用条件之一是:总体方差未知,但差异不显著。F检验可用来进行方差齐性的检验。

F检验公式:

S2大、S2小分别代表两样本的方差

df1=df分子-1=n分子-1,df2=df分母-1=n分母-1

查F值表[7](P=0.05或0.01)的临界值F0.05和F0.01,若F<F0.05(或F0.01),则P>0.05(或0.01),两样本方差差异不显著;反之,则差异显著。

(四)X2检验(计数数据差异的显著行研究)

1.X2检验的意义

教育科学研究中,我们会收集到连续性数据,同时也有非连续性的计数数据。前面介绍了主要用于连续性数据显著性差异检验的Z检验、T检验和F检验,现在来介绍主要用于对计数资料进行的两组或两组以上数据差异的X2检验。

2.X2检验的常用范围

(1)正态性检验。

正态性检验主要看实得次数是否为正态分布。例如,假设教师的身体健康水平是呈正态分布的,某幼儿园42名幼儿教师体检后的健康状况分别是良好15人,一般16人,较差11人。可用X2检验该分布是否符合正态分布。

(2)独立性检验。

独立性检验用于检验两个或两个以上的多项分类的变量之间是否有关联,主要用于对双项表中的数据进行检验。如检验父母教养态度与幼儿人际交往能力(高、中、低)这两个变量之间是否为独立或某种相互影响的关系。

(3)适合性检验。

适合性检验用于检验实际观测到的次数分布是否与有关理论分布有差异。这一检验主要是对单项表中的数据进行检验。例如:假设幼儿喜欢红、黄、蓝、绿的人数无显著差异。经实际测定,最喜欢红、黄、蓝、绿的幼儿分别为20人、15人、18人和21人。X2检验就可用来对该人次分布与期望次数(平均次数)之间的差异进行显著性检验。

3.X2检验的基本公式

其中,f0为实得次数,fe为理论次数或期望次数,n表示计数所得的次数,P表示某种属性出现的概率,X2的df=r-1,r 表示原始数据的组数。

由于统计分析要处理的数据量往往很大,许多统计方法,尤其是现代发展的统计方法又常常十分复杂。可以说,自产生统计学以来,计算方法问题就一直困扰着人们。随着计算机技术的飞速发展,人们开发出各种统计软件,极大地提高了我们的数据处理和分析能力。对一名教育研究者来说,要求每个人都熟悉统计方法的“内情”(如相关公式的推导过程)是不现实的,也是没有必要的。关键是要懂得各种统计方法的作用、适用条件、结果的解释,会上机操作,从而不至于误用,尤其是不要从一堆无序的数据中得出一些低价值甚至误导研究的信息。今天在教育研究中可供使用的软件很多,例如Excel、SPSS等都可以用于进行统计分析。