(一)《量表》第一版
《量表》第一版是在适宜我国文化和国情的托幼机构教育质量观指导下,通过对美国ECERS-R[4]指标内容的大幅度修订,并增设全新的“集体教学”子量表的基础上编制而成。《量表》第一版包含8个子量表、51个评价项目,分别为:(1)空间与设施(9个项目);(2)保育(6个项目);(3)课程计划与实施(5个项目);(4)集体教学(7个项目);(5)游戏活动(9个项目);(6)语言推理(4个项目);(7)人际互动(5个项目);(8)家长与教师(6个项目)。
为增强每个项目下评价内容的逻辑性,《量表》作者为每个项目下创设了若干“子项目”——评价的维度。这是《量表》区别于ECERS-R的重要结构性特征之一。每个子项目均包含“1-3-5-7”四个等级指标来界定不同水平的质量。这样,《量表》第一版共包含177个子项目,685个等级指标。
在评分方式上,《量表》第一版沿用了ECERS-R的李克特7点评分:1分=不适宜;3分=合格;5分=良好;7分=优秀。子项目的可能评分是:1、3、5或7。项目的评分是依据各个子项目(等级指标)的得分情况,采用由低到高推理规则进行计算,可能的得分是1~7的自然数。子量表得分为本子量表下被评分项目得分的均值(某些项目如果被评为“不适用”则不计入均分);量表总分为所有被评分项目得分的均值(而不是子量表得分的均值)。
研究团队采集了一定规模的数据,运用多种理论和方法对其进行各种信度和效度指标的检验。[5][6][7][8]各种证据表明,第一版《量表》具有良好的测量学特性,有潜力成为中国文化情境中优秀的托幼机构教育质量测量工具。该《量表》随后也被应用于一系列的研究之中。[9][10][11]
(二)《量表》第二版的优化
基于《量表》第一版效度验证研究的结果[12]和数据采集过程中的评分员反馈评价,我们对《量表》结构和评分方式进行了调整和优化,编制出《量表》第二版。
《量表》第一版的探索性因素分析结果表明,“语言推理”子量表下的四个项目分别归属不同的因子,比如“图书和阅读”归属因子1“学习条件”,而其他三个项目(鼓励沟通、日常交流、概念与推理)归属因子2“教学与互动”。通过内容分析,《量表》作者们认为,这几个项目的确应当分别归属不同的子量表,因而,“图书和阅读”被重新命名为“语言”放入“游戏活动”子量表;“鼓励沟通与表达”“概念与推理”被归入“集体教学”子量表;“日常交流”被归入“人际互动”子量表。这样,第一版中的“语言推理”子量表的评价内容在第二版中被保留,但不再作为一个独立的子量表。在项目结构上的调整还包括:“户外体育活动的场地与设施”被分成了两个项目“户外体育活动的场地”“户外体育活动的设施”;“活动指导与监护”分拆成两个项目“室内一般活动的导护”“户外体育活动的导护”;把“空间与设施”子量表的“满足教师需求的空间与设施”项目,放入子量表“家长与教师”的项目“满足教师的个人需求”中。经过调整后,《量表》第二版包含7个子量表、53个评价项目,分别为:(1)空间与设施(9个项目);(2)保育(6个项目);(3)课程计划与实施(5个项目);(4)集体教学(9个项目);(5)游戏活动(10个项目);(6)人际互动(7个项目);(7)家长与教师(7个项目)。(《量表》第二版项目概览见表6-1)
表6-1 《量表》第二版项目概览
研究发现,《量表》第一版内容略显繁多冗赘,其中一个原因是若干子项目在内容上存在交叉重复,因此,作者们努力对内容进行“瘦身”,尽可能避免和减少子项目之间不必要的交叉重复。比如,经过调整,项目25“教学支持”下的子项目从上一版本中的5个减少到4个(见表6-2)。经过子项目的调整与修订,《量表》的子项目数量从第一版的177个减少到第二版的160个。
表6-2 《量表》第二版评价项目举例:项目25教学支持
《量表》第二版中另一个重要改变是精细指标的引入。在《量表》第一版使用的过程中,尽管由于子项目的引入使得《量表》的评分比起ECERS-R相对容易,但仍然会有纠结的状况,原因是:一个等级指标涵盖的内容要点往往不止一个,所观察的班级可能仅达到了指标的部分要求,这时整个指标到底评为“是”还是“否”,往往让评分员非常纠结;这也增加了同一班级两位评分员之间出现分歧的可能性。依据评分员的反馈,《量表》作者们决定把包含了若干个相对独立评分要点的一个等级指标拆分为若干个精细指标,要求评分员依据观察对每个精细指标进行评分。这样,在《量表》第二版中,每个子项目下的四个等级指标(分别为1分、3分、5分、7分)各自包含了数目不等的精细指标(项目举例见表6-2)。精细指标成为整个量表最小的基础性评价单位。精细指标评价内容相对单一,指向性更加明确,易于观察和判断,可以有效地降低评分者判断的模糊性,减少评分员评分时的纠结状况,有利于提升评分者间一致性信度。统计结果表明,《量表》第二版中共包含814个精细指标。
由于精细指标的引入,带来了评分方式的变化。在《量表》第一版中,子项目的得分是等级指标决定的,可能为1-3-5-7四个分值中的一个。而在《量表》第二版中,作者们决定依据精细指标的评分情况,采用由低到高推理的规则来对子项目进行评分,允许出现2-4-6这样的中间分值,这样,子项目的分值在1~7变化(自然数)。项目得分取若干子项目的得分均值(保留两位小数)。子量表得分、《量表》总分的计算方法与第一版保持一致。这样的评分方式增加了子项目水平上《量表》对班级质量反应的灵敏性和评价的精确性,有助于提高测量信度(如内部一致性)。
表6-3 《量表》第一版与第二版内部一致性系数比较
《量表》第二版于2013年年初编制完成,并于当年用于湖南省、吉林省、四川省、贵州省和上海市等地的班级观察数据采集。初步的数据分析结果显示,《量表》第二版的测量信度有所提升,实现了改进意图。在内部一致性信度上,从《量表》第一版与第二版的比较中看出(见表6-3),大部分子量表的内部一致性有不同程度的增加;量表总体的内部一致性仍然保持在优秀水平(Cronbach’s α为0.96)。综合来看,《量表》第二版的内部一致性信度优于第一版。
(三)《量表》第三版的优化
通过对《量表》第一、第二版所采集幼儿园教育质量数据分析,研究者发现,现阶段我国幼儿园教育质量普遍偏低,有较高比例的班级教育质量在《量表》所界定的“合格”水平之下(在7点评分量表上得分在1~3之间),在总体得分分布上高度聚集于低端。尤其考虑到我国中西部地区、农村地区学前教育发展水平相对滞后(参阅本书第七章有关研究结果),这一问题将更加凸显。为进一步增加《量表》对全国范围内不同区域学前教育质量评价需要的适应性和反应的敏感性,增加对低端质量的区分度,我们决定在“合格”水平以下、“不适宜”水平以上,增设一个中间等级:“最低要求”,即在幼儿教育实践中不应突破的底线要求。这样,《量表》第三版变为9点评分,由低到高分别为:1分=不适宜,3分=最低要求,5分=合格,7分=良好,9分=优秀(项目举例见表6-4)。经过多次实地调研和试测,反复尝试和推敲指标内容与标准高低,历时数月,2014年5月,《量表》第三版最终编制完成。经过修订,《量表》第三版项目数量(53个)和子项目数量(160个)保持不变,但精细指标数量增加到1127个(第二版为814个)。2014年5—6月,新编制完成的《量表》第三版在联合国儿基会-中国教育部合作进行的“农村学前教育师资培训基线调研”项目中用于对云南、重庆两省(市)的幼儿园教育质量评估。[13]
与前面两个版本的《量表》相比,第三版《量表》的最大变化是从7点评分变为9点评分,即子项目下设计的等级指标从四个等级(1-3-5-7)增加到五个等级(1-3-5-7-9)。而在子项目评分的规则、项目得分、子量表得分、量表总分的计算方法上,《量表》第三版则与第二版基本保持一致。
表6-4 《量表》第三版评价项目举例:项目25教学支持
由上可见,“集体教学”子量表的增设,是《量表》内容上的重大创新,使得《量表》更加贴近中国文化和幼儿园教育实践。而每个项目下子项目(评价维度)的建构,每个精细指标进行评价的方式,是《量表》结构和评分方式上的重大改变和创新;尤其是《量表》第三版的9点评分方式,丰富了评价的内容,增加了评价指标的层级,进一步增强了项目、子项目反应的灵敏性和对不同质量水平的区分度,明显突破了ECERS-R的结构框架,为实现对其测量学特性的全面超越奠定了基础。