第一节 教育评价概述(1 / 1)

公共教育学 石中英 2751 字 1个月前

教育评价是教育活动的一个重要组成部分,它是以教育目标为依据,运用有效的评价技术和手段,对教育活动的过程和结果进行测定、分析、比较,并给以价值判断的过程。我国的教育评价理论研究虽然起步较晚,但自20世纪80年代以来,教育评价的理论和方法得到了长足的发展。从教育改革和发展的需求来看,我国当前的教育评价工作尚存在一些急需解决的问题。首先,教育评价的指导思想仍未从“升学选拔的尺度”上完全转变过来,“为促进学生的发展而评价”、“为促进教育质量的全面提高而评价”还没有真正成为大多数人的实践活动;其次,教育评价的基础理论研究还比较薄弱,例如如何对学生个体素质进行测评仍是一个难题,尤其是对学生在非认知因素、思想道德素质、心理健康水平等方面的测评,缺乏科学、有效的技术和手段;再次,教育评价指标体系的设计缺乏坚实的科学依据,可操作性较差,而且体系过于庞杂,影响了教育评价的信度和效度。此外,教育评价作为一种专业化水平很高的工作,当前我国从事教育评价工作的人员无论是在专业素质上还是在数量上,都无法适应和满足日益深化的教育改革与发展的迫切要求。

一、教育评价的定义

评价在汉语里面是指评定价值高低的意思。[1]教育评价在英文文献中过去常使用“evaluation”一词,现在更多的是使用“assessment”。从语义学的角度看,“evaluate”一词是由词干“valu”加上词头“e”和动词性词尾“ate”组成,其中“valu”意为价值,词头“e”的意义等同于“out”,即“引出”。[2]因此,评价就是引出和阐发价值或者进行价值判断,强调的是一种“自上而下”的模式。而“assessment”来自拉丁词根“assidere”,表示“随旁就座”的意思,[3]强调是多方参与和共同建构的平等模式。从评价手段看,当教育评价以“evaluation”为关键词的时候,测验(test)被认为是唯一公平有效的手段。而且这种测验更多的时候是一种标准化测试,实行正式管理,并且在设计上以差异最小化为目标呈现给被试。而当教育评价以“assessment”为关键词的时候,就嵌入了多样化的评价手段,如观察、档案袋评价、多项选择或半结构化的考试等。教育评价(assessment)是专门用于沟通各种教育干预手段之间的关系,从而更清晰地描绘儿童是如何思维、学习和工作的过程。“标准化测试关注的是个体差距,回答的是‘这个儿童与其他参加考试的儿童相比程度如何的问题’,而评价(assessment)则反映现代认知理论对某一特定儿童在学习与认知过程的兴趣。”[4]总而言之,过去的教育评价更关注结果,而现在的教育评价则是关注过程与结果如何实现效果的最大化。所谓教育评价,就是全面系统地科学搜集、整理和分析有关教育信息,并在此基础上对教育作出价值判断的过程,目的在于促进教育改革和提高教育质量。

二、教育评价的类型和功能

我们根据教育评价的不同作用可以把它分为诊断性评价、形成性评价和总结性评价。

诊断性评价一般是在教育、教学或者学习计划实施的前期阶段开展的评价,重在对学生已经形成的知识、能力、情感等发展状况作出合理的评价,为计划的有效实施提供可靠的信息资源,以获取更好的效果。它一般通过以下手段获取相关信息:(1)查阅被评价者在此之前的有关成绩记录;(2)摸底测验;(3)必要的学习要素调查表。

形成性评价主要是在教学和学习过程中进行的,一般以学习内容的一个单元为评价点,采用及时的反馈和根据学生个体差异进行有针对性的矫正。形成性评价主要通过形成性测验来判断,同时也应该辅之以日常作业和评价者的观察来共同完成。

总结性评价主要是在教学和学习后进行的评价,是对教学和学习全过程的检验。[5]

“总结性评定,形成性评定和诊断性评定之间的区别,在于所涉及问题的类型各不相同。总结性评定所关心的是最后结果,形成性评定是提供学生进步的描述,而诊断性评定描绘的则是学生成绩的轮廓。”[6]诊断性评价、形成性评价和总结性评价存在于学生评价的全过程,并各有侧重地发挥着各自的作用和功能,而且这三种评价类型在实践中是互为提供信息和依据,因此这种划分是相对而言的。“在形成性与总结性评价之间没有基本逻辑和方法论上的差别。两者都是为了检验某个实体的价值的。只有按不同时机、评价的听取人,以及使用评价结果的方法,才能区分在什么情况下的评价是形成性的,或是总结性的。而且对于同一评价来讲,在一个需求者说来可以是形成性的,而另一个看来却是总结性的。”[7]

表8-1 诊断性评价、形成性评价和总结性评价的异同表

资料来源:[日] 筑波大学教育学研究会编:《现代教育学基础》,上海教育出版社,1986年,第400页。

三、教育评价的发展历程

纵观历史的发展脉络,美国教育评价专家印第安纳大学教育学院的古巴(Guba,E.G.)和林肯(Lincoln,Y.S.)把教育评价的发展历程划分为四个阶段。第一代教育评价被称之为测量时期。最早在学校里的测试是以口试的形式进行的,学生以小论文式的方式来回答问题,以此测量学生的各种特性,主要测量学生对知识的记忆方面。第一代评价盛行于19世纪末至20世纪30年代,法国比奈量表(Binet scale)是当时测量风行一时的典型代表,在这个时期测量与评价(evaluation)这两个词是混用的。这种测量趋势的产生主要受两个因素的影响,一个是当时兴起的把科学方法应用于社会科学研究的运动,另一个是在工商业盛行起来的科学管理运动。[8]第二代教育评价被称为描述时期。一战后美国社会对课程改革的呼声非常高,人们要求进行课程改革来适应学生的需求,如何检测新开发出的课程与其预定目标是否一致也随之成为一个备受关注的问题。而第一代评价单纯提供针对学生的评价信息这个特点显然不能满足这个需要。当美国一些中学进行课程改进活动时,泰勒(Tyler,L.B.)也同时收集针对这些项目达到预期目标的程度的信息,开始了历史上著名的1933~1941年的“八年研究”。第二代教育评价以泰勒的目标模式为主要代表。古巴和林肯把泰勒提出的评价模式称为是目标导向的描述性评价。这代评价认为,评价在本质上是“描述”(description)——描述教育结果与教育目标相一致的程度。[9]古巴和林肯把第三代教育评价定义为判断时期,认为评价在本质上是“判断”(judgment)。这个时期开始于1957年苏联人造卫星发射成功之后。这个时期把评价视为价值判断的过程,评价不只是根据预定目标对结果的描述,预定目标本身也需要进行价值判断;既然目标并非评价的固定不变的铁的标准,那么评价就应当走出预定目标的限制,过程本身的价值也应当是评价的有机构成。[10]

第四代评价观是指20世纪80年代于美国兴起的一种教育评价理论,是由古巴和林肯首先提出的。他们提出的评价的本质是心理建构,发展正是在这种建构中发生的。为了实现这种建构,需要评价主体多元化,评价方式民主化,评价标准个性化,评价方法借鉴质性的方法。因此可以这样说:“在经历了20世纪初的测验时期(testing era)、世纪中的评价时期(evaluation era)之后,于80年代中期开始,悄然进入了评定时期(assessment era)。”[11]新的评价观强**育评价是一种“心理建构”过程,提倡价值多元、全面参与和共同建构,力图实现教育民主化。认为评价在本质上是一种通过“协商”而形成的“心理建构”,因此,教育评价应坚持“价值多元性”的信念,反对“管理主义倾向”。把教育评价视为评价者和被评价者“协商”进行的共同心理建构过程;评价是受“多元主义”价值观所支配的;评价是一种民主协商、主体参与的过程,而不是评价者对被评价者的控制过程,学生(被评价者)也是评价的参与者、评价的主体;在具体方法上,更强调在自然环境中,用质性研究方法,使各方人士通过各种形式的对话达成共识。评价者在协商过程中没有特权,不应采取任何控制他人的态度,而应该是一个中介人、一个条件提供者和一个创造者。当然,正如它的倡导者所说,“第四代评价也只是一种建构”,它本身并不完全排斥其他的评价模式,而应该视具体的评价任务,与其他的评价模式相互补充。

这个所谓第四代评价观和我国新阶段基础教育改革所倡导的“发展性教育评价”其实是如出一辙。进入21世纪,发展性教育评价现在已经成为世界各国教育改革的“风向标”。我国面向21世纪的基础教育课程改革,倡导“立足过程,促进发展”的课程评价,改革促使评价的功能从以往注重甄别、选拔转向重视个体生命发展,因此新课程的评价被称为“发展性教育评价”。为了体现最新的教育观念,我们必须“强调评价的民主化与人性化的发展,重视被评价者的主体性与评价对个体发展的建构作用”,淡化评价的甄别和选拔功能,关注学生的发展,不仅是“知识与技能”的发展,还包括“过程与方法”、“情感态度与价值观”的培养与发展,让评价更趋人性化。[12]这是发展性教育评价最基本的理念。而这种发展性教育评价的理念贯穿于我国现阶段基础教育课程改革的始终。正是在这个基础上,我国在这场教育改革中提出了要建立“建构主义的评价观”,这包括“目标自由的评价,即试图根据经证实的需求,提供用以评价任何过程结果的最客观的评价标准;以真实的任务为标准的评价,努力使教育更加关注真实任务的解决;以知识的建构为标准,以鼓励学习者积极参与知识的建构;以经验的建构为标准的评价,更重视对知识建构过程而不是结果的评价,并同时注意评价跟教学的整合;情境驱动的评价,由于建构主义强调在真实而富有意义的情境中进行学习与教学,所以评价的标准应源于丰富而复杂的情境;依靠学习背景的评价,正由于建构主义的学习是受到丰富的背景支持的,所以设计者和评价者必须考虑学习发生的背景;评价标准的多元化;确立多种形态的评价标准;以社会建构与协商的意义为标准的评价”。[13]2002年,教育部提出,对学生、教师与学校评价的内容要多元,既要重视学生的学习成绩,也要重视学生的思想品德以及多方面潜能的发展,注重学生的创新能力和实践能力;既要重视教师业务水平的提高,也要重视教师的职业道德修养;既要重视学校整体教学质量,也要重视在学校的课程管理、教学实施等管理环节中落实素质教育思想,形成生动、活泼、开放的教育氛围。评价标准既应注意对学生、教师和学校的统一要求,也要关注个体差异以及对发展的不同需求,为学生、教师和学校有个性、有特色的发展提供一定的空间。[14]

如果我们从学校教育的视角来讨论教育评价的内涵,那就是所谓学校的评价,而我们可以说学校的评价主要包含三个内容:学生学业评价、教师评价以及学校的评估和督导。而当我们剖析这三类内容的时候,我们都需要回答四个“W”(why,what,who & how)的基本问题。

[1] 中国社会科学院语言研究所词典编辑室:《现代汉语词典》,修订版,商务印书馆,2000年,第981页。

[2] 霍力岩:《学前教育评价》,北京师范大学出版社,国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组译,2000年,第1页。

[3] [美] W.韦伯:《有效的学生评价》,中国轻工业出版社,2003年,第7页。

[4] Bowman,B.T.et al..(Eds.,2001).Eager to Learn:Educating Our Preschoolers.Washington,DC:National Academy Press,p.233.

[5] 全国十二所重点师范大学联合编写:《教育学基础》,教育科学出版社,2006年,第267~268页。

[6] [瑞典]胡森等主编:《简明国际教育百科全书·教育测量与评价》,教育科学出版社,1997年,第10页。

[7] [瑞典]胡森等主编:《简明国际教育百科全书·教育测量与评价》,教育科学出版社,1997年,第50页。

[8] Guba,E.G.& Lincoln,Y.S.(1989).Fourth Generation Evaluation.California:Sage Publications.,Inc,pp.22~26.

[9] Guba,E.G.& Lincoln,Y.S.(1989).Fourth Generation Evaluation.California:Sage Publications.,Inc,pp.27~28.

[10] Guba,E.G.& Lincoln,Y.S.(1989).Fourth Generation Evaluation.California:Sage Publications.,Inc,p.31.

[11] [美] B.约翰逊著:《学生表现评定手册》,李雁冰主译,华东师范大学出版社,2001年,第1页。

[12] 中华人民共和国教育部:《基础教育课程改革纲要(试行)》(2001年6月7日),教基[2001]17号。

[13] 钟启泉等:《为了中华民族的复兴 为了每位学生的发展——〈基础教育课程改革纲要(试行)〉解读》,华东师范大学出版社,2001年,第26~27页。

[14] 《教育部关于积极推进中小学评价与考试制度改革的通知》,教基[2002]26号,2002-12-27。