中国托幼机构教育质量评价研究(李克建)_三、研究结果（1 / 1）_中国托幼机构教育质量评价研究最新章节免费阅读无弹窗

（一）描述性统计

班级特征变量的描述性统计结果表明，178个样本班级，平均班额为35名幼儿（范围11～63），生师比均值为18∶1（范围3∶1～46∶1）；班级教师平均年龄为31岁，教龄为9年；其中38%为本科及以上学历，76%持有幼师资格证。

表4-1 样本班级《量表》得分的描述性统计与相关系数（N=178班级）

在《量表》得分上，由表4-1可见，178个样本班级的量表总分均值为3.33；基于7点评分量表的界定（1分=不适宜，3分=合格，5分=良好，7分=优秀），这一得分意味着样本班级总体质量水平不高，刚刚达到合格水平。在8个子量表得分上，大多刚刚达到合格水平；其中“游戏活动”子量表得分最低（M=2.51），未达到合格水平；“家长与教师”子量表得分最高（M=4.13），接近但仍未达到良好水平。总体而言，子量表得分之间的相关系数相对较高（r=0.64 ～ 0.86），表明这些子量表密切相关，但又不太过类似。

（二）测量信度

1.评分者间一致性

本研究采用同组的两位评分员的原始评分（合议之前各自的独立评分），在子项目、项目、子量表和总量表水平上分别计算了量表的评分者间一致性。纳入统计的173个子项目中，两位评分者评分完全一致的比例为75%。51个项目中，两位评分者评分完全一致的比例为64%，1分以内一致性的比例为91%；项目水平的评分者间一致性系数上，仅1个项目低于0.60（“游戏活动”子量表第36个项目“音像设备和电脑的使用”，因为该项目在82%的样本班级被评为“不适用”），4个项目得分在0.60～0.70；其余46个项目的评分者间一致性信度估计值为0.70～0.90（总体均值为0.77）。考虑到该类观察性量表单个项目的测量误差通常较大，因此本研究中项目水平上的评分者间一致性信度表现已相当令人满意。8个子量表的评分者间一致性信度估计值处于0.85～0.94，均值为0.89。在量表总分水平上，评分者间一致性信度是0.94。对于这样的观察性等级评分量表而言，这些估计值显示了较高的评分者间一致性信度。与ECERS-R作者们报告的数据相比，[10]本量表的评分者间一致性信度表现更加出色。

2.内部一致性

由表4-2可见，整个量表的Cronbach’s α为0.98，显示了很高的内部一致性。8个子量表的α系数均大于0.83（0.83～0.93），具有较好的内部一致性。这些证据表明，不仅《量表》总体上可以用于托幼机构的教育质量评价，每个子量表也可相对独立使用，用以测量托幼机构特定方面的教育质量。

表4-2 《量表》的内部一致性系数

（三）测量效度

1.同时效度

本研究中的91所幼儿园，有81所通过了浙江省幼儿园等级评定（17所省一级园，32所省二级园，32所省三级园）；其余10所幼儿园有办学许可证但没有通过等级评定，这10所无等级园的数据没有被采用。在目前的幼儿园管理体系下，办园等级对于样本幼儿园来说是唯一有效且易于获得的质量指标。幼儿园的等级评价过程和结果是独立于本研究的，样本幼儿园的等级信息也没有透露给评分员。本研究分析了《量表》得分与幼儿园等级的相关性，以作为同时效度的一个证据。

由图4-1可知，浙江省幼儿园等级评定结果与《量表》的评价结果一致。三个等级幼儿园在8个子量表上的得分明显不同，得分变化趋势与办园等级高低完全一致：幼儿园等级越高，在各个子量表上的得分越高；反之亦然。

图4-1 不同等级幼儿园在8个子量表上的得分

研究者运用多元方差方法分析三个等级幼儿园在《量表》得分上是否存在显著差异。多元方差分析结果表明，三个等级幼儿园在8个子量表上的得分具有显著性差异（Wilk’s λ =0.415，F（df1=16，df2=302）=10.43，p＜0.001）。此外，幼儿园的三个等级在每个子量表得分上的两两比较也具有显著性差异（p＜0.001）。在效应量方面，多元R2接近0.585，表明幼儿园的三个等级在8个子量表上的得分解释了将近59%的变量。在教育研究中，这是一个相当大的效应量。[11]

此外，单因素方差分析模型下的效应量（比较幼儿园的三个等级在每个子量表上的得分）也是非常大的，对于这8个子量表而言，R2的范围从0.28 ～0.50。毫无疑问，幼儿园的三个等级在《量表》总分上也具有显著性差异（p＜0.001），同时也得到了一个相当大的效应量（R2=0.48）。这些分析结果显示，两个独立的质量评价体系（即《量表》与浙江省幼儿园等级评价体系）的评价结果具有良好的聚合性。这些结果为《量表》的同时效度提供了强有力的证据。

2.校标关联效度

本研究中使用了CDCC量表对样本班级随机抽取的5～6名儿童进行了语言、早期数学、社会认知、动作技能方面的测试，共获取了1012名3～6岁儿童的发展测试数据。研究者首先对数据进行了筛选，排除了77名入园时长少于6个月的儿童（理由是时间过短，幼儿园教育环境对儿童发展难以产生可观测的影响作用），这样，用于最终分析的样本量为来自163个班级的935名儿童。

表4-3的上半部分为《量表》得分（8个子量表得分与量表总分）与儿童发展结果（语言、早期数学、社会认知、动作技能）的零阶二元相关。分析结果表明，除了儿童的动作技能与《量表》的质量指标关系较弱，其他三个方面的发展结果得分（语言、早期数学、社会认知）与《量表》的各项质量指标均具有显著的相关性（r=0.20～0.30）。

由于儿童年龄及其家庭社会经济背景可能在《量表》得分和儿童发展结果之间产生一定的作用，进而，我们采用了偏二元相关的分析方法，以控制儿童年龄及其父母受教育背景[12]对这两组变量间相关性的影响。由表4-3的下半部分结果可见，在控制儿童年龄以及父母平均受教育年限后，相比之前零阶二元相关的结果，儿童语言、早期数学以及社会认知得分与《量表》各项得分的相关系数略有降低（r=0.10～0.20）。值得指出的是，尽管儿童的动作技能测试结果与《量表》各项得分呈现较弱的关系，但与量表总分以及“集体教学”“语言推理”“人际互动”三个子量表得分呈显著相关。

总体而言，《量表》的校标关联效度水平略优于同类研究中报告的ECERS[13]和ECERS-R[14]的有关结果。

表4-3 《量表》评分与儿童发展结果的相关性（N=935，来自178个班级）

3.结构效度

为了探明《量表》的结构效度，我们运用本次测量数据进行了探索性因素分析（Exploratory Factor Analysis，EFA）。在分析中，最后一个子量表“家长与教师”被去除，因为该子量表的项目评价内容与儿童发展并不直接相关；同时也去除了缺失值较多的项目（超过10%的班级在这些项目上被评为“不适用”），这些项目分别是：安抚和独处的空间与设施（来自子量表“空间与设施”）、课堂文化（来自子量表“集体教学”）、音像设备和电脑（来自子量表“游戏活动”）以及尊重和欣赏差异（来自子量表“人际互动”）。这样，最终纳入探索性因素分析的是178个样本班级41个项目的得分数据。

在因素分析中，基于传统特征根值大于1的办法，共可以提取四个因子[15]；然而，特征根值碎石图的拐点效应却表明只可以提取两个因子。平行分析法，即把真实的数据特征根值与随机抽样的数据特征根值做比较，[16]表明应该只保留前两个因子（如图4-2）。基于以上分析，本研究共提取了两个因子，这两个因子的方差贡献率为61%。

图4-2 探索性因素分析中的前十个特征根值

斜交旋转呈现了一个清晰的量表因子结构，两个因子之间的相关系数是0.76，表明这两个质量因子密切相关但不同。同时，这两个因子的成分相当明确（详见表4-4）：组成因子Ⅰ的项目主要来自空间与设施和游戏活动2个子量表；组成因子Ⅱ的项目主要来自集体教学、语言推理和人际互动3个子量表。基于两个因子成分项目的内容分析，我们把因子Ⅰ命名为“学习条件”，即为幼儿的学习所提供的各类条件，涉及各类空间、设施、材料及其使用，以及对各类游戏活动的安排（包括空间、材料、机会与时间、设计与指导等）；把因子Ⅱ命名为“教学与互动”，主要涉及幼儿参与其中的各类学习活动过程，包括集体教学、师幼互动、同伴互动与各类活动的指导与监护。

表4-4 《量表》两因子结构（N=178）

续表

研究者发现，这个因子结构具有实质性意义，同时，与Sakai等人[17]的关于ECERS-R的两因子结构有很大的相似性。这说明《量表》具有良好的结构效度，它既保持了与ECERS-R结构上的延续性，同时又能抓住中国托幼机构教育质量的核心要素（如集体教学），具有本土文化适宜性。但需要注意的是，子量表保育和子量表课程计划与实施中多个项目出现了交叉负载的现象，归属于哪个因子并不明确。在未来的《量表》修订中，有必要对这些项目的内容和指标进行深入检视和适当调整。