我国基础教育经过40年的改革与发展,已基本完成了“两基”普及,基础教育发展的重点开始从数量扩张转向内涵式质量提高。为了保证教育教学质量,课程与教学的质量评价工作稳步展开,经过多年努力,我国逐步确立了课程与教学质量评价体系。具体来说,我国明确了课程与教学质量本身的基本构成要素、课程与教学质量评价的实质,以及课程与教学质量评价指标体系建构的一般路径等。
课程与教学质量按照其内容,表现为学校教学中的很多方面,比如,课程结构是否合理、教材质量是否科学、教学目标是否符合规范、教学观念是否先进、教学管理是否有活力、学生学业成就是否达到预期目标等。将课程与教学质量的诸多因素加以概括,可以归纳为课程建设、课堂教学水平、教学管理及学生学业成就四个基本要素,形成一个层次结构,见图5-1。
图5-1 学校课程与教学质量的基本要素及其结构层次[45]
对课程与教学质量进行评价,主要是对学校教学是否达到一定质量要求做出价值判断,即依据一定的教学目标和课程标准,用理性分析、统计分析等多种方法对教学活动进行系统检测与考核,对教学过程和教学结果进行价值判断。简言之,课程与教学质量评价是对课程教材建设与教学工作质量或教学活动的整体功能所做的测量、分析和评定,有助于促进学校教学工作的规范化及教学质量的提高。[46]而评价指标体系的建立则是保证课程与教学质量评价客观、准确、有效的基础,其建构的一般过程如下:首先,明确评价标准。判断课程与教学质量要有一个标准,这个标准通常由教育决策者或学校管理者制定。其次,确定评价指标。评价标准往往比较抽象、笼统,要使标准可测量,就需要把标准不断细分,列出若干个具体的项目,这就是评价指标。再次,确定权重系数。最后,通过实验得出结果,以便对指标体系进行评价、修正。可见,评价指标体系建构的过程,也是一个深化课程与教学质量认识的过程。而在诸多课程与教学质量评价中,教材质量评价、课堂教学质量评价(教师授课质量评价)、学生学业成就质量评价是重点内容。
1.教材质量评价
教材有广义和狭义之分。广义的教材指课堂上和课堂外教师和学生使用的所有教学材料,如课本、练习册、活动册、计算机光盘、复印材料、广播电视节目、幻灯片等。教师自己编写或设计的材料也可称为教学材料。总之,凡是有利于学习者增长知识或发展技能的材料都可称为教材。而狭义的教材就是指教科书。教科书作为一个课程的核心教学材料,是师生据以进行教学活动的主要材料。教材设计质量的高低,在某种程度上影响着教师教和学生学的质量。通过对教材设计质量进行评价,可以检视教材对于特定的学校、特定的学生是否合适,以便对正在实施的教材进行改进。可见,其重要性不言而喻。
教材质量直接关系到教育教学质量和人才培养质量的关键问题,对教材质量的评价研究成为学者们关注的重点。20世纪80年代以来,对教材质量的评价日趋多元化和复杂化,开始吸收心理学、社会学、语言学、信息科学、经济学和教育哲学等方面的研究成果,从新的视角审视教材的质量,评价方式与方法逐渐多元化、多样化。无论哪一种评价方式,对教材和教学内容的评价标准大多强调:①基础性,即教学内容应该是适应现代社会、现代合格公民必须掌握而且能够掌握的。②发展性,即教学内容应有助于学生主动学习,有助于培养学生的创新意识和创新能力,体现学生发展的自主性、主动性和创造性。③实践性,即应加强与学生生活、与社会发展实际的联系。④综合性,即对教学内容的选择与重组应体现综合性。⑤灵活性,即教学内容应有一定的灵活性,应适合不同区域发展水平的需要,而且要考虑不同学校及学生的差异性。[47]在取得共识的基础上,我们可以通过评价表、问卷调查、测验等方法来建构评价指标体系。现以评价表为例,阐述中小学教材的质量评价,见表5-1。[48]
表5-1 我国中小学教材质量评价表
除了教材内容方面的要求外,也有研究者研究和制定了教材评价标准和指标体系,如李慧君(1996年)[49]、丁朝蓬(1998年)[50]、高凌飚(2002年、2007年)[51][52]。有些学者对国外教材评价的做法及评价工具等进行研究与介绍,以便为我国教材评价提供借鉴与启示,如潘丽娜、蔡敏(2007年)[53],张颖(2009年)[54],徐鹏、郑国民(2012年)[55],王晓丽(2016年)[56]。有研究者分析了新时期教材评价研究出现的新问题及发展的新趋势等,如纪文平(2011年)关注到了信息化对教材评价的影响[57],韩军民等人(2012年)提出模糊层次分析法等新方法在教材评价中的应用[58],柳叶青(2017年)指出从实体思维走向实践思维是教材评价研究的新趋势等[59]。
2.课堂教学质量评价(教师授课质量评价)
课堂教学作为教学活动的主要组织形式,是师生根据国家规定的教学内容、教学时间,以集体上课的形式进行的有目的、有计划的教学活动。课堂教学质量则是课堂教学活动满足主体明确或隐含需要的能力特性的总和。课堂教学是教师授课的主渠道,因此,人们常把课堂教学质量与教师授课质量等同理解,二者经常混用。通过对课堂教学质量进行评价,人们可以了解教师的教学状态、内容、过程、效果及学生的学习效果,同时能够及时发现并纠正课堂教学中存在的问题,从而提高课堂教学的质量。
20世纪80年代以来,我国中小学明确把提高课堂教学质量作为提高学校教学质量的中心环节。许多学者从不同角度对如何提升课堂教学质量进行了探讨,并取得了很大成绩。但是,在深化课堂教学改革中,对如何认识和评价课堂教学,即在如何衡量一节课是“一堂好课”的问题上产生了分歧,并争论至今。[60]为促使课堂教学改革进一步健康深入地进行,有学者提出了制定课堂教学质量评价标准应该遵循的三个原则:导向性、有效性、开放性。[61]导向性原则是指课堂教学质量评价标准应有明确的导向性,既要体现全面和谐发展的培养目标,还应体现正确的教学观念;有效性原则应是评价赖以进行的基本要求,要使课堂教学质量评价标准达到有效性的要求,就要做到合目的性、遵循客观规律、体现个性;开放性原则,即应给评价者在评价过程中掌握具体标准留下一定的余地。以上述三原则审视“一堂好课标准”的争论,虽说不同学者有不同观点,不同学科或同一学科不同阶段的教材也有不同特点,但从课堂教学的宏观层面来看,“一堂好课”的标准又有一些共同的价值取向。
(1)教学目标要注重基础性、发展性、多元化
基础性就是按照课程标准注重基础知识和基本技能的掌握,完成知识和技能的教学。发展性就是培养学生以学习能力为重点的学习素质和以情感为重点的良好人文素质。多元化是指教师要根据教材要求和学生发展实际,在传授知识的基础上,将过程与方法、情感态度与价值观等多元目标有机结合起来。
(2)教学内容的组织要得当
教师要注意教学内容的合理结构,便于学生在头脑中形成高效、合理、有序的知识结构,培养和发展学生的学习能力。教师要从学生实际出发,使教学内容始终落在学生的最近发展区内。教学内容要与社会生活相联系。
(3)教学过程的优化
首先,教学要体现启发性,教师要善于挖掘教材内容的启发性素材,创设“启发”的情境,调动学生的学习自觉性、积极性,引导学生积极思考。其次,教学要体现差异性,要注意因材施教。再次,教学要体现探索性,即在探究活动中,教师给予适时提醒、恰当点拨、积极引导。最后,教学要体现情感性和艺术性,要有目的地培养学生良好的情感品质,使学生的身心获得健康发展。
(4)教学效果的检查
教师在课堂上要关心学生的学习质量和学习效果,始终把教学目标放在优先考虑的位置,注重根据常规检查手段检查教学效果。
有学者结合对课堂教学质量评价标准的实证研究,进一步把课堂教学质量评价标准分为三个层次。①基础层次:激发学习兴趣,理解、掌握、会用;②提高层次:主动参与教学,充分、有效地交流;③体验层次:感受学习乐趣,体验创造的成功。上述三个层次不是并列的关系,而是一种递进关系,同时三者之间也有一定的交叉,它们之间的关系有如一个“套塔形”结构。[62]
改革开放以来,学生主体地位和主体性受到高度重视,课堂教学质量观由过去对智育第一、知识至上的尊崇过渡到对学生生命发展独特性、整体性的尊重,并开始关注教学内容、过程与学生生命意义的联系[63],课堂教学评价也更为关注对学生学习状态的考查,以及对课堂教学情境性、动态性和生态性的关照。近年来,随着研究的深入,在课堂教学质量评价标准探讨的基础上,有些研究者建立了更为全面和更具可操作性的课堂教学评价指标体系,本土化成果不断涌现,课堂教学评价系统日臻完善,其中有代表性的有:“4要素20视角68观察点”的课堂观察LICC范式[64]、“6·13(六关系维度、十三指标要素)”课堂教学评价框架[65]、发展性课堂教学评价指标体系[66]、“以学评教”的课堂教学评价指标[67]等。
除了对传统课堂教学质量评价的探讨,随着信息技术的发展及其与教育领域的融合,近年来兴起了慕课、翻转课堂等新型教学模式,研究者认为,翻转课堂与传统课堂的教学流程、教学方式和教学结构存在明显差异,传统课堂的教学评价并不适合翻转课堂[68],建立翻转课堂的教学质量评价体系便成为很多研究者探讨的话题。有研究者基于翻转课堂的满意度指标,分别设计了要素综合评价法、因子分析法和感知变量模型,为建立翻转课堂教学质量评价模型和指标体系提供了新的视角。也有研究者构建了翻转课堂教学评价体系,如蒋立兵、陈佑清(2016年)以发展性评价、过程性评价及表现性评价为理论基础,构建了翻转课堂教学质量评价体系[69];谢娟等人(2017年)基于CIPP评价模型构建了翻转课堂教学评价指标。[70]总之,课堂教学质量是学校教育的生命线,不管课堂教学的形式如何变化,提升课堂教学质量是教学理论研究者和实践者共同关注的永恒话题。
3.学生学业成就质量评价
(1)逐步形成学生学业成就质量评价体系
学生学业成就是学生在学校教育中的主要成果,也是学生发展的重要目标,它包括认知、技能、思想感情等多方面的内容。对学生学业成就质量进行测量与评价,有利于教师发现教学中存在的问题,以改进教学,提高教学质量,促进学生全面发展。对学生学业成就质量进行评价已成为课程与教学质量评价中最核心、最基本的活动,它是衡量教师教得如何和学生学得如何的一个主要标志。
为提高学生学业成就质量评价的科学性,需要努力把评价标准表述得既具体又明确,而教育目标分类学对提高评价标准的具体性和明确性有重要作用。布卢姆等把教学目标分为认知、情感和动作技能三大类,然后把每类目标分为不同层次和方面,如认知目标包括识记、领会、运用、分析、综合、评价六个层次和方面,最后又把每个层次和方面的目标再细分为若干具体项目。布卢姆的教育目标分类工作说明,一门学科所要达到的教育目标是可以做出由简单到复杂的一系列的等级分类的。在对学生的学业进行评定时,我们往往根据教育目标分类理论制定命题双向细目表。命题双向细目表是命题的依据,该表是考查内容与考查目标的联列表。它把考查内容划分成各个知识单元,或以章、节为单元列入表的左侧,把考查目标按识记、理解、应用、分析、综合等不同水平列入表的首行,再确定命题细目表中各单元、各目标的试题占分。确定占分的依据是:各知识单元在整个教学领域的重要性;各知识单元的教学时数比重。编制命题双向细目表可使试题覆盖面广,重点突出,不至于偏重某章节,也使知识点的考查目标比例恰当。
在评价方法上,对学业成就的评价大体可划分为传统评价和表现性评价两种方式。其中,学业成就的传统评价是指那些主要采用纸笔测试方法对学生在一定学习时间内的学习成效所进行的测量和评价,也就是我们经常说的考试。这种定量的评价方法技术相对成熟,种类也较全面,在教育实践中的应用也十分广泛和深入。作为已取得诸多理论与实践成果的评价方式,考试方法技术的不断改革为课程与教学评价的发展做出了重要贡献。若按测验的标准来划分,又可以把考试分为标准化测验与教师自编测验。标准化测验是学生学业成就评价的主要方式之一。它一般是由专门的机构或组织设计、组织和实施,是严格依据科学原理并按照科学方法与程序来进行的,具有较高的信度和效度。然而,标准化测验不易编制,有关要求也比较高。教师自编测验是教师依据实际的教学需要,为对学生的学习结果进行考查而自行设计与编制的测验。它的编制较简单、灵活,但教师自编测验的信度和效度要求不如标准化测验那么严格。[71]不管是标准化测验还是教师自编测验,都要考虑其效度、信度、难度、区分度等反映该测验质量特性的重要指标;否则,测验的代表性和可行性就会让人质疑,影响测验的效果。
除了以上所说的传统评价方式,随着评价观念的更新,表现性评价等评价方式在实践中也有越来越广泛的运用。表现性评价主要是针对考试并不能完全真实反映学生学业成就提出的。考试可以测查学生认知领域的发展状况,对于学生思想品德、情感、态度、价值观等方面的发展则难以测量,表现性评价可以弥补考试的这种缺陷。表现性评价通常要求学生在某种特定的真实或模拟情境中,运用先前所获得的知识完成某项任务或解决某个问题,以考查学生对知识与技能的掌握程度,或者问题解决、交流合作和批判性思考等多种复杂能力的发展状况。[72]其目的不是单纯地给学生一个评价分数或等级,而主要是为了促进学生的学习和发展。比如,体育教师评价学生游泳技能的掌握情况,他不是让学生以纸笔方式回答一些有关游泳技能的问题,而是让学生到游泳池或河水中真正游上一段距离,以真实地展现其游泳水平。又如,语文教师评价学生的口语交际能力,会设计一个问题情境,让学生针对问题进行小组讨论,通过观察每个学生在讨论中的表现来评判其口语交际的能力,这就是表现性评价。可见,表现性评价带有定性评价的性质。经过多年的改革发展,关于学生学业成就质量的评价,已逐渐形成量化评价和质性评价相结合的方式,既评价学生的学业成绩,又评价学生的行为表现;既注重学生知识、技能的掌握,又评价学生的思想品德、情感、态度、价值观;既有数量上的客观数据,又有质量上的定性分析,已逐步形成了学生学业成就质量评价体系。
随着大数据技术在课程与教学评价领域的应用日益广泛,对于数据的收集、分类、处理、分析更加便捷,基于大数据的课程教学评价系统的设计也备受关注,如大数据理念下的发展性学习评价系统设计、基于大数据的个性化学习评价系统设计、基于大数据的综合素质评价模型设计、基于大数据的教育质量综合评价等。新技术的应用,为课程与教学评价的发展提供了技术支持,也带来了诸多便利。但我们在享受技术所创造的福利的同时,也要警惕技术至上的风险,技术并不能替代一切,尤其是在对人的活动进行价值判断时,更不能陷入唯技术论。
(2)几种具体评价方法的进展
改革开放40年来,我国在学生评价方面涌现了诸多新的评价方式,它们发挥了重要作用,在此就几种具体的评价方式做简单介绍。
①基础教育质量监测。
基础教育质量监测是提高质量和促进公平的一项基础工程,各国或国际组织根据自身实际开展了形式和内容各异的教育质量监测。近些年来,我国无论是国家层面还是地方层面在基础教育质量监测工作上,都做出了许多有益的尝试。[73]
2003年,在教育部基础教育课程教材发展中心的组织下,我国成立了“建立中小学生学业质量分析、反馈与指导系统”项目组。项目组以国家颁布的课程标准为依据,主要通过纸笔测验考查学生学科学习的结果,在基础知识和基本技能的考核基础上关注与学生未来发展关系密切的核心素养,同时通过学生、教师和校长问卷了解与学生学习相关的背景因素。
2007年11月,“教育部基础教育质量监测中心”挂牌成立,中心是在教育部直接领导下,依托北京师范大学而建立的专业机构。中心的职责包括拟定基础教育质量监测标准,研发基础教育质量监测工具,受教育部委托,具体实施全国基础教育质量监测工作,指导各地开展基础教育质量监测工作,推动全国基础教育质量监测网络的逐步建立。中心目前监测的主要内容包括学生的思想品德和公民素养、学生的身体和心理健康水平、学生的学业水平和学习素养、学生的艺术素养、学生的实践能力和创新意识、影响学生发展的教育环境和社会环境六个部分。2007年12月,中心在湖北、浙江和陕西三省进行试点监测;2008年9月,中心在上海、山东、河南等八省市进行了首次监测,随后每年开展一次。
省级层面,2006年,江苏省教育厅与教育部基础教育课程教材发展中心达成协议,加入“建立中小学生学业质量分析、反馈与指导系统”项目,并约定每两年测试一次。为了全面掌握江苏省基础教育的质量状况,项目从一开始便覆盖了全省所有区县,形成了省、市、区(县)三级学生学业质量分析报告。为了进一步加大监测工作的推进力度,2008年3月,江苏省基础教育质量监测中心在江苏省教育科学研究院正式挂牌成立。这是在全国范围内成立的首个省级基础教育质量监测机构,表明江苏省在全国率先把质量监测工作纳入基础教育改革发展的整体布局。
上海市从2004年起便参加了“建立中小学生学业质量分析、反馈与指导系统”项目,连续八年参加测试,初步建立了上海市中小学生学业质量的数据库。为了全面实施素质教育,提高基础教育质量,2009年9月,“上海市教育委员会基础教育质量监测中心”正式成立,挂靠在上海市教研室。2011年9月,教育部基础教育课程教材发展中心和上海市教育委员会合作,在全国率先建立“中小学生学业质量绿色指标”评价体系。
重庆市在2009年成立重庆市基础教育质量监测中心,与重庆市教育评估院合署办公,并在2010年9月开展省级基础教育质量监测实践。
北京教育科学研究院基础教育教学研究中心在2003年便开始承担北京市义务教育教学质量监控与评价项目。2011年9月,“北京市教育督导与教育质量评价研究中心”正式挂牌成立,中心设在北京市教育科学研究院,主要职责是根据北京市人民政府教育督导室的督导规划和工作安排,开展对全市各级各类教育的督导服务和质量监测评价工作,全面把握教育质量发展状况,科学诊断教育质量问题,为教育行政部门和教育督导部门提供决策依据。
另外,浙江省杭州市下城区、江苏省如皋市等区县级层面的基础教育质量监测机构也在全国各地不断建立。全国范围内的基础教育质量监测系统正在逐步形成。
可见,经过十多年的发展,我国基础教育质量监测成效显著。开展基础教育质量监测是落实立德树人教育根本任务、深化发展素质教育、探索人才成长规律的重要举措;也是加强教育宏观管理、进行科学决策的现实要求。通过监测数据和结果的发布,基础教育质量监测在引导学校、家长和社会树立正确的教育质量观,促进青少年的健康成长方面正发挥着越来越重要的作用。
②普通高中学业水平考试。
普通高中学业水平考试起源于普通高中毕业会考制度。我国高中毕业会考制度起源于1985年在部分省市的试点。1990年,《国家教委关于在普通高中实行毕业会考制度的意见》决定在全国推行普通高中毕业会考制度。高中毕业会考是水平考试,用以评价学生的学业水平是否达到毕业规定的标准和要求。2004年,山东、广东、海南、宁夏四省(自治区)首先进行普通高中新课程实验,随着新课程改革的不断深入,15个省(自治区、直辖市)先后进入实验区。为了顺利推进高中新课程的实施,保证教育教学质量,《2003-2007年教育振兴行动计划》提出要“建立国家和省两级新课程的跟踪、监测、评估、反馈机制,加强对基础教育质量的监测”。《普通高中课程方案(实验)》又提出“教育行政部门要对高中教育质量进行监测”。已经实施了几十年的高中毕业会考制度,为构建高中新课程质量监控与评价体系奠定了很好的基础。[74]
2006年,山东、海南、宁夏、江苏、上海、天津等省(自治区、直辖市)相继出台了普通高中学业水平考试方案。可以说,普通高中学业水平考试制度就是高中毕业会考在新形势下的继承与发展。普通高中学业水平考试是省级政府设立的教育统一考试,并以国家普通高中课程标准必修课为主要考查内容。尽管普通高中学业水平考试与普通高中毕业会考都是衡量普通高中学生学业是否达到毕业标准的主要依据,也是反映普通高中教育教学质量和办学水平的重要指标,但两者是不同性质的考试。会考是过去普通高中毕业资格认定的重要条件,而普通高中学业水平考试则是高校招生录取的重要参考依据之一,按教育部要求,普通高中学业水平考试成绩将与高校录取逐步挂钩。[75]
2008年1月,《教育部关于普通高中新课程省份深化高校招生考试改革的指导意见》规定:“各地要加快建设在国家指导下由各省份组织实施的普通高中学业水平考试和学生综合素质评价制度,切实做到可信可用,逐步发挥其对普通高中教育教学质量进行管理和监控,对高中学生学业水平和综合素质进行全面、客观评价,以及为高校招生选拔提供参考依据的作用。”
2014年9月,《国务院关于深化考试招生制度改革的实施意见》提出探索基于统一高考和高中学业水平考试成绩、参考综合素质评价的多元录取机制,即“两依据、一参考”的考试录取机制。普通高中学业水平考试主要检验学生的学习程度,是学生毕业和升学的重要依据,并确定在上海、浙江先行高考综合改革试点。两省市于2014年9月同时公布了深化高考综合改革的实施方案。2014年12月,《教育部关于普通高中学业水平考试的实施意见》提出了普通高中学业水平考试成绩的呈现和使用原则,即计入高校招生录取总成绩的学业水平考试3个科目成绩以等级呈现,其他科目一般以“合格、不合格”呈现。[76]可见,普通高中学业水平考试越来越受到国家的重视,其在学生学业评价中的作用也愈加凸显。
③成长记录袋(档案袋)。
成长记录袋也叫档案袋,是一种新兴的质性评价方式。20世纪80年代,西方国家的一些教育工作者开始把这种方法运用到教育领域,用成长记录袋收集以学生作品为主的有关资料,用来评价学生在特定领域学习中的努力、进步与成就。在我国,新课改以来,随着对形成性评价的重视,成长记录袋也广泛应用到学校评价活动中。成长记录袋是指“根据教育教学目标,有意识地将各种有关学生表现的作品及其他有关证据收集起来,通过合理的分析与解释,反映学生在学习与发展过程中的优势与不足,反映学生在达到目标过程中付出的努力与进步,并通过学生的反思与改进激励学生取得更高的成就”[77]。成长记录袋的特点如下:第一,基本成分是学生作品。它主要收集学生在学习过程中自然生成的各种作品(如作业、论文、手工作品、表演录像等),真实展现学生的努力、成就与进步,客观描述学生学习的过程与结果。第二,学生作品的收集是有目的的,而不是随意的。如果目的是描述学生在某一时期内学习与发展的过程,发现其优势与不足,那么,收集的内容不仅应包括学生的最终作品,还要把过程性的东西(如一篇文章的草稿)也装进去;如果是为了展示学生的最优成果,那么,收集的内容应是学生认为最满意或最重要的作品。第三,成长记录袋给学生提供发表意见和对作品进行反思的机会。成长记录袋的创建和使用十分强调学生的参与,尤其是学生的自我评价和反思。[78]因此,成长记录袋的评价方式为教师提供了其他评价手段无法提供的很多关于学生学习与发展的重要信息,有利于形成对学生全面、真实的评价。对学生而言,参与评价过程,有利于发挥学生学习的主动性。