二、数据资料的分析——描述统计(1 / 1)

对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。其目的在于将大量零散的、杂乱无序的数据资料进行整理、归纳、简化、概括,使事物的全貌及其分布特征清晰、明确地显现出来。描述统计数据常用的特征量有:集中量、差异量和相关量。平均值、标准差、相关系数分别是最常用的集中量、差异量和相关量。

(一)数据集中趋势的描述

集中量是反映一组数据集中趋势的量,反映频数分布中大量数据向某一点集中的趋势。描述这种集中趋势的量数主要有算术平均数、加权平均数、中位数、众数等。

1.算术平均数

算术平均数常用来估计、比较研究对象总体水平。例如,要想比较两组幼儿的身高,不能将其身高一一列出来进行比较,这种个别的比较是看不出什么结果的。如果将两组的平均数加以比较,就会既简洁又明了地得出结果。

必须注意的是,当数据较多,可靠性要求较高的时候,可用平均数说明问题。如果数据较少,或者其中含有极端数值,用平均数作代表值就未必合适。

2.中位数和众数

(1)中位数。又称中数,指按大小顺序排列的一组数据中居于中央位置的数,用Md 表示。若数据的个数是奇数,就以位于中央的数据作为中位数;如数据的个数是偶数,则以最中间的两个数据的平均数作为中位数。

例2:2,5,7,9,10,11,12的中位数Md =9

中位数对位于两端的数据不像平均数那么敏感,它还适用于当分布的两端有未知数据,数据个数已知的情况,但中位数的可靠性程度不如平均数。

(2)众数。众数即一组数据中出现次数最多的数值。

例3:25,37,21,37,45,50,37,25这一组数据中,众数为37。

众数的计算比较简单,但众数不稳定,代表性不好,教育统计中一般不采用众数来反映数据的集中趋势。只有当数据分布中出现极端数据时,才用众数作为集中量的粗略估计。

(二)数据离散程度的描述

要全面地描述数据的分布情况,仅仅用集中量说明分布的集中趋势是不够的,还必须指明各个数据之间的差异程度(即离散程度)有多大,因为数据之间的差异程度是次数分布的另一个重要特征。

例4:甲、乙两组幼儿教师教育理论的测验分数分别为:

甲组:82,85,79,79,83,82,84;乙组:90,92,80,75,76,74,87。

两组分数的平均数均为82,但离散程度却不同。甲组比较集中、整齐,即变异较小;乙组比较分散、参差不齐,即变异较大。可见在描述一组数据分布特征时,仅仅用集中量是不够的,还必须用该组的差异量加以辅助说明。应用最广的差异量是标准差S(δ)。其计算公式如下:

S甲<S乙,说明甲组测验分数变异程度小,即数据比较集中。

标准分数又称Z分数,是原始分数与平均数之差除以标准差所得的数值,可表示一个数据在团体中所处的位置,所以也叫相对位置量数。其计算公式为:

Z分数若为正值,表示相对应的原始分大于平均数,Z分数若为负值,表示相对应原始分小于平均数。

由于Z分数有正负,使用不便,因此,也可以采用T分数。

T分数50以上越高越优;50以下越低越差。

标准分数在教育科研中的应用,比较多地用在成绩评定和录取新生工作上。

(三)数据关系的推断

在学前教育实践中,常常需要研究变量与变量之间的关系,如幼儿的家庭环境与同伴交往能力之间的关系;某一试题的得分与试卷总分之间的关系;家长的文化水平与儿童智力水平的关系等,都要用相关量来描述。

相关是指两列变量之间的相互关系。一般有三种性质的相关:一是正相关,即两列变量的变化方向一致,当一种变量变动时,另一种变量也发生或大或小的同方向变动,如儿童身高和体重的关系,一般来说,儿童身高越高,体重越重。二是负相关,即两列变量的变化方向相反,当一种变量变动时另一种变量发生或大或小的反方向变动,如坚持锻炼身体的时间长短与身体患病率的关系,坚持锻炼身体的时间越长,身体的患病率就越小。三是零相关,即两列变量的变化方向无一定规律,如人的外貌与智力发展水平是毫无关系的零相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数,一般用r表示。其取值范围在-1.00到+1.00之间。正负号表示相关的方向,正号表示正相关,负号表示负相关,其绝对值大小表示相关的程度。当r=0时为零相关,表示两个变量的变化互不相关。r的绝对值接近1,r为高相关;r的绝对值接近0,为低相关;介于其中的为中等相关。

计算相关系数时,要求两列变量必须成对。相关系数的计算有许多公式,不同的情况要使用不同的公式(可参见王孝玲著《教育统计学》第十一章),这里所介绍的是积差相关(也称为皮尔逊相关),用于计算两组连续性数据的相关程度。基本公式为:

相关系数在教育和心理的科学研究中应用较多,如对考题或测验量表进行质量分析,就要用相关的方法来检验其信度、效度等。需要注意的是,相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系。