第二节 学生评价改革(1 / 1)

反思传统学生评价的问题,结合现代学生评价的特点,改革学生评价成为历史的必然。在我国基础教育课程改革中,学生评价改革成为其中极为重要的内容。

一、学生评价改革的政策依据

关于学生评价的改革,我国《基础教育课程改革纲要(试行)》明确指出,要“建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生在原有水平上的发展”。《普通高中课程方案(实验)》指出:要“实行学生学业成绩与成长记录相结合的综合评价方式。学校应该根据目标多元、方式多样、注重过程的评价原则,综合运用观察、交流、测验、实际操作、作品展示、自评与互评等多种方式,为学生建立综合、动态的成长记录手册,全面反映学生的成长历程”。这些都为学生评价改革指明了方向。

学生评价改革的重点就是要建立促进学生发展的评价体系,这种评价体系要突出发展性、综合性、差异性、多样性、过程性和多元性。

所谓发展性就是说,评价的目的在于促进学生的发展和提高,而不是给学生贴上“好坏优劣”的标签,改变以考试分数对学生进行分类的做法,加强对考试结果的分析,形成激励性的改进意见和建议,促进学生的发展。

所谓综合性就是说,评价内容不仅关注学生学业成绩,还要发现和发展学生多方面的潜能,要关注学生道德品质、心理素质、人际交往、学习兴趣、情感体验等方面的发展,注重综合素质的考察。

所谓差异性就是说,评价标准是动态的,具有层次性和差异性,尊重学生的起点和个体发展的独特性,正确判断每个学生的不同特点和发展潜力,帮助学生认识自我,建立自信,确定个性化的发展目标,激发内在的发展动力,促进学生在原有水平上获得发展。

所谓多样性就是说,评价方法要多样,将定性评价与定量评价相结合,诊断性评价、形成性评价和总结性评价相结合,综合运用笔试、口试、情境测验、作业、课堂提问、成长记录袋、面谈等多种方法收集评价信息,形成全面、科学的评价结论。

所谓过程性就是说,评价要注重学生变化发展的过程,不仅要评价学生的过去,还要重视学生的现在,更着眼于学生的未来发展,立足于学生长远发展的需要,不断收集学生发展过程中的信息,判断学生的优势和不足,及时发现学生发展中的需求,在此基础上提出具体的、有针对性的改进建议。

所谓多元性就是说,评价主体要多元,除了教师评价,还要重视家长的评价,更要尊重学生在评价中的主体作用,重视自我评价,鼓励学生积极参与评价,使评价过程成为促进学生反思、加强评价与教学相结合的过程。

所以说,学生评价改革的基本方向就要建立发展性的评价体系。发展性学生评价强调有效发挥评价的改进和激励功能,要求教师综合运用多种评价工具和方法,诊断学生学习和发展中的困难和问题,并及时采取有针对性的改进措施,促进学生学业进步和健康发展。发展性学生评价的根本任务是促进评价对象的发展,而不是对评价对象进行分等、鉴定和奖惩,它是一种形成性评价而不是总结性评价,是一种面向未来的评价而不是面向过去的评价。

二、学生评价改革的理论基础

学生评价改革的一系列设计不是凭空想象出来的,而是建立在相关理论研究成果的基础之上的。

(一)多元智能理论对学生评价的启示

多元智能理论是由美国哈佛大学心理学家霍华德·加德纳(Howard Gardner)于1983年在《智力的结构》一书中提出来的。多元智能理论认为,过去人们认为智力主要是语言能力和逻辑—数学能力两个方面,这过于狭窄,不能正确反映一个人的真实能力。一个人的智能是多方面的,包括语言智能(Verbal.linguistic Intelligence )、数理逻辑智能(Logical.mathematical Intelligence )、音乐智能(Musical.rhythmic Intelligence)、身体运动智能(Bodily.kinesthetic Intelligence)、空间视觉智能(Visual.spatial Intelligence)、人际关系智能(Interpersonal Intelligence)、自然探索智能(Naturalistic Intelligence )、内省智能(Intrapersonal Intelligence )、生存智能(Existential Intelligence);人的智能是有差异的,不同的人有不同的智能组合,如建筑师的空间智能比较强,运动员的身体运动智能比较强,数学家的数理逻辑智能比较强,公关人员的人际关系智能比较强,等等。

多元智能理论对教育界产生了巨大影响,为树立科学的学生观和评价观提供了有利的指导。

1.学生只有差异,没有“差生”

多元智能理论认为,“每个正常的人都在一定程度上拥有其中的多项技能,人类个体的不同在于所拥有的技能的程度和组合不同”[1]。也就是说,每个正常人都不同程度地拥有9种(或更多)智能,都有自己的智能强项或弱项,9种智能的不同程度、不同方式的组合使得个体之间表现出智力差异。世界上不存在着谁聪明或不聪明的问题,只是哪一方面聪明或怎样聪明的问题。因此,学校没有“差生”,每个学生都是独特的,也是出色的,都可以在教师的有效指导下获得应有的发展。相应的,学生评价的目的就不是去判定哪个是“优等生”,哪个是“差生”,哪个学生智力水平高,哪个学生智力水平低,而是要发现每个学生不同的智力类型、特点和学习强项,寻找学生身上的闪光点和潜能所在,明确其将来的学习方向,实施针对性的教学策略,使每位学生都获得各得其所的发展。

2.学生的智能是多元的,不是单一的

多元智能理论认为,传统的智力理论将人的智力理解为语言能力和逻辑—数理能力是非常狭窄的。其实,智能是由相互独立、相互平等的多种智能组成的智能整体,每个人的智能是多元的,每一个正常人都同时拥有9种(或更多种)智能,其中每一种智能都可以自由地和其他智能结合以解决自己遇到的现实问题并创造一定社会文化背景所珍视的有效产品。每一个正常人都能够表现出多元的认知风格,都能够而且也应该采取多元的学习策略和问题解决策略。相应的,学生评价内容就不能仅仅关注学生语言能力和逻辑分析能力,还应该扩展到除知识技能以外的其他领域,如人际关系、道德品行、兴趣特长、创新精神等,即基础教育新课程所要求的建立促进学生全面发展的评价体系。

3.学生智能的发展是情境化的,不是抽象的

多元智能理论认为,“智能是在特定的文化背景下或社会中,解决问题或制造产品的能力”[2],“智能在其发展的不同阶段都是以不同的方式显现的,所以对智能的评估和开发,都要以适当的方式进行。婴儿期的方式可能不适合后续阶段,反过来也是如此”[3],“标准化的纸笔简答类的测验,只能测出智能的一小部分,而且需要的只是分析上下文的技巧。我们所欣赏的评估方法,将跨越物质条件的限制,最终真正找到解决问题和制造产品的能力”,“每一种智能(或智能的组合)的评估,应当侧重该种智能所要解决的问题”[4],“除非把评价置于现实生活和社会环境联系中,否则,我们怀疑它能否恰当地代表人类的智能表现”[5]/

显然,按照多元智能理论,学生的智能是在特定情境中分析问题、解决问题的能力,传统的单一的纸笔测验只能评价少部分学生的一小部分的智能,而对多数人的多方面的智能都被忽视了,不能真正反映每个学生的实际能力。多元智力理论主张对学生的评价要在实际生活及学习情境中,从多方面来观察、记录、分析和了解学生的优点和弱点,允许学生用多种方式展示其学习,对学生在各个领域的表现的评价应该允许变通,在某个领域的优秀操作可以弥补在其他领域的不足。教师应设计出适合学生特点的课程、教材、教法和评价标准,从而帮助学生扬长避短,发挥潜力。因此,必须对学生评价的方法进行优化,一方面要采用适合学生年龄特征的多样化的评价方法;另一方面要创设适当的情境,通过学生在不同情境中的表现来判断其发展状况。即“评价不是以单纯的客观测验,而是以观察和记录学生所完成的任务或作品、合作计划、实验、表演、展示、演说等多种方式进行;不是从单一的考试背景中,而是从广泛的背景(课堂、家庭、社区生活)中收集信息;而收集到的信息也不是单纯地针对标准呈现的试题作出反应的信息,而是在多元智力活动中诸如语言、数理逻辑、视觉空间、身体动作、音乐节奏、人际关系和自我内省等显示出来的各方面表现的信息”,“不仅注重智商,而且注重其他心理元素;不仅注重解决问题的结论,而且注重得出结论的过程”[6],使评价真正关注学生的实际发展。

4.学生智能是发展变化的,不是固定的

多元智能理论认为,智能是一个动态的发展过程,是从生理和心理潜能到解决问题和创造产品能力的一个发展过程。每个人的智能最初只是一种潜在的能力,在环境和教育的影响下,个体所具有的潜在的能力会得到激发和持续的发展。所以,对学生的评价也应该具有发展的观点。加德纳主张,评价的目的不是为了给学生排序、贴标签,而是要为学生今后的发展提供建议。

多元智能理论所倡导的智力观、评价观为“建立促进学生全面发展的评价体系”提供了坚实的理论基础,为学生评价的改革提供了重要的启示。

1.要把促进学生发展作为评价学生的首要目的

在评价学生时要看到每个学生都有自己的强项,应该把发现学生的强项和进一步发展的潜力作为评价的首要目标,并通过评价为学生今后的发展提供建设性的意见,以促进学生进一步的发展。为此,一方面要摒弃传统评价的缺陷本位取向,避免从消极的、无能的观点出发来侦察学生的失败、愚笨和缺点,并贴上一定的标签。另一方面要尽量避免在学生之间进行横向比较。因为,传统的常模参照评价或标准参照评价,将学生的考试分数与常模或标准进行比较,看学生分数处于钟形曲线何处,以此来确定学生在班级或学校中的排名,只能反映某一个体在学生群体中的相对位置,只适用于选拔性考试,并不能真实地反映学生个体所取得的发展和进步。在日常的学生评价中,过多的比较将给学生的身心发展带来消极影响。

2.评价要与学生真实的生活和学习情境相联系

按照多元智能理论,学生智力的发展是与其所处的日常生活和学习情境密不可分的,每个个体都有其独特的智力特点和表现形式,这些智力特点只有在与之相应的不同的情境之中才更能表现出来。因此,评价学生时就不能脱离学生的生活和学习情境抽象地下结论。无论是评价内容还是评价的方式都应该与学生真实的日常生活和学习情境相联系。只有对个体智力的评价与他们所处的社会文化背景相联系,我们才能使评价把握住个体在他们持续的日常活动中所获得的实践能力和创造能力的发展,才能够在自然状态下捕捉到学生能力的真实表现并客观地评价学生的发展状况。

3.学生评价的主体、内容及方法都应多元化

第一,评价主体应该多元化。除了教师以外,还应该有家长、同伴和学生本人共同参与评价,这样,可以为我们提供看待儿童个体的多元化视角,从多个渠道获得有关儿童发展的多方面的信息,从而使评价尽可能全面和客观。第二,评价内容应该多元化。学生的成长和发展是多方面的,要重视对学生个体多方面的发展作出评价。在评价时还要注意体现学生的多元化的认知风格和学习策略,促进学生个性化学习风格的形成和个性的充分展示。第三,评价方法应该多元化。要采取多种多样更具有人文关怀的评价手段来评价学生的发展状况,以便更真实地反映学生发展的全貌。

4.评价要尊重学生的差异性,引导学生个性化发展

第一,对学生发展的评价要尊重他们的文化差异性。以往的评价标准往往是为主流文化背景下的学生设置的,非主流文化背景下的学生只能“勉为其难”地接受不公平的评价。今天的评价应该努力避免主流文化一统天下的情况,在对学生进行评价时应该充分考虑学生所处的不同社会文化背景、所持有的多元文化价值观念以及所形成的多样化的早期教育经验等。第二,对学生发展的评价要尊重每个学生独特的智力发展特征。根据每个学生独特的智力发展特征,采取与之相应的评价策略,使每个学生都有公平地展示自我和发展自我的机会。第三,要设计“智力公平”的评价方式。传统评价主要指向于学生语言和逻辑智力的发展,并主要借助于书面符号来实现对学生的评价。这样,就使那些在这两个领域表现不佳的学生丧失了发展自我的机会。“智力公平”的评价就是要有多种多样的评价方式,让具有不同智力强项的学生均有展示和发展的机会,如可以通过在真实的情境中观察学生如何解决与同伴的矛盾冲突来评价他们的人际关系智力等。[7]

(二)建构主义学习理论对学生评价的启示

建构主义学习理论是在认知心理学的基础上发展起来的一种现代学习理论,其主要代表人物有瑞士心理学家皮亚杰 (J.Piaget)、美国心理学家斯滕伯格(R.J.sternberg)、苏联心理学家维果斯基(Vogotsgy)等。

建构主义理论认为,知识不是对现实的客观纯粹的反映,只不过是人们的一种解释或假说,它不是问题的最终答案,必将随着人们对世界认识的深入而不断变革、升华或改写。在具体的问题解决中,知识不是一用就准、一用就灵的,而需要根据问题的具体情境对原有的知识进行再加工再创造。世界是客观存在的,但对世界的理解和赋以意义是由每个人自己决定的。

建构主义的学习观认为,学习不是由教师简单地把知识传递给学生的过程,而是一个主动建构的过程,他们要么是自己,要么是求助他人或其他信息源的帮助来达到建构知识的目的。学习者是主动的建构者,而不是事实信息的记录者,他们在以往的生活、学习和交往活动中,逐步形成了自己对各种现象的理解和看法,是自己独特知识结构的创造者,并具有利用现有知识经验进行推论的智力潜能。任何学科的学习都不像在白纸上画画,总是要涉及原有的认知结构,以已有的经验为基础来理解和建构新的知识和信息。

建构主义理论强调,教学要以学生原有的经验作为新知识的生长点,教师不是知识的呈现者和灌输者,而是意义建构的帮助者和促进者,学生是信息加工的主体,是意义建构的主动者。在建构教学的教室里,教师设计问题,引导讨论,从旁激发,支持并适时介入学生的学习;在形成及转化知识的过程中,学生不再只是练习连串的解题技巧、策略,而是在与老师和同学的互动中,建构理论及意义。

建构主义强调知识是学习者主动建构的过程,是学习者高级思维活动过程。科学的评价应该在关注学生学习结果的同时关注学习的过程。建构主义强调学习的结果是学习者自己建构的,显然最好的评价者是学习者本人,因此应该发挥学生本人在自己学习、成长中的积极作用,帮助他们自我反思、正确评价自己学习的过程和结果,成为一个自我控制的学习者。

三、学生评价内容改革

学生评价改革的总的方向是要建立促进学生全面发展的评价体系,这个体系的建立包含多方面的工作,例如,明确评价内容和评价标准、选择和设计相应的评价工具和方法、收集和分析反映学生发展过程与结果的资料、明确促进学生发展的改进要点、制订促进学生发展的改进计划等。就评价内容来说,主要包括基础性发展目标、学科学习目标和个性化发展目标3个方面。

(一)基础性发展目标

基础性发展目标是评定学生全面发展的基本素质的评价内容,主要包括以下内容。

(1)道德品质。爱祖国、爱人民、爱劳动、爱科学、爱社会主义;遵纪守法、诚实守信、维护公德、关心集体、保护环境。

(2)公民素养。自信、自尊、自强、自律、勤奋;对个人的行为负责;积极参加公益活动;具有社会责任感。

(3)学习能力。有学习的愿望和兴趣,能承担起学习的责任;能运用各种学习方法提高学习水平,能对自己的学习过程和学习结果进行反思;能掌握知识间的内在逻辑联系,主动建构知识体系;能结合所学不同学科知识,运用已有的经验和技能,独立提出、分析并解决问题;具有初步的研究和创新精神。

(4)交流与合作。能与他人一起确立目标并努力去实现目标,尊重并理解他人的观点和处境,能评价和约束自己的行为;学会相互接纳、赞赏、争辩、互助;能不断对自己和别人的看法进行反思和评判;能综合运用各种交流和沟通的方法进行合作。

(5)运动与健康。热爱体育运动,养成体育锻炼的习惯,具有锻炼健身的能力,有一定的运动技能和强健的体魄,形成健康的生活方式。

(6)审美与表现。能感受并欣赏生活、自然、艺术界、科学中的美,具有健康的审美情趣;积极参与艺术活动,能用多种方式进行艺术表现。

(二)学科学习目标

学科学习目标是指经过学科学习应该达到的基本目标。各学科课程标准列出了学科学习目标和各学段应该达到的标准,并提出了相应的评价建议。比如,义务教育阶段语文学科的学习目标就包括10个方面的总目标和学段目标,总目标具体内容如下。

(1)在语文学习过程中,培养爱国主义、集体主义、社会主义思想道德和健康的审美情趣,发展个性,培养创新精神和合作精神,逐步形成积极的人生态度和正确的世界观、价值观。

(2)认识中华文化的丰厚博大,汲取民族文化智慧。关心当代文化生活,尊重多样文化,吸取人类优秀文化的营养,提高文化品位。

(3)培育热爱祖国语言文字的情感,增强语文学习的自信心,养成良好的语文学习习惯,初步掌握学习语文的基本方法。

(4)在发展语言能力的同时,发展思维能力,学习科学的思想方法,逐步养成实事求是、崇尚真知的科学态度。

(5)能主动进行探究性学习,激发想象力和创造潜能,在实践中学习和运用语文。

(6)学会汉语拼音。能说普通话。认识3500个左右常用汉字。能正确工整地书写汉字,并有一定的速度。

(7)具有独立阅读的能力,学会运用多种阅读方法。有较丰富的积累和良好的语感,注重情感体验,发展感受和理解的能力。能阅读日常的书报杂志,能初步鉴赏文学作品,丰富自己的精神世界。能借助工具书阅读浅显的文言文。背诵优秀诗文240篇(段)。九年课外阅读总量应在400万字以上。

(8)能具体明确、文从字顺地表述自己的见闻、体验和想法。能根据需要,运用常见的表达方式写作,发展书面语言运用能力。

(9)具有日常口语交际的基本能力,学会倾听、表达与交流,初步学会运用口头语言文明地进行人际沟通和社会交往。

(10)学会使用常用的语文工具书。初步具备搜集和处理信息的能力,积极尝试运用新技术和多媒体学习语文。

学段目标分1~2年级、3~4年级、5~6年级、7~9年级4个学段,分别就识字与写字、阅读、习作(1~2年级为写话)、口语交际、综合性学习5个维度提出具体的学习目标,并明确了评价要求:“充分发挥语文课程评价的多种功能”“恰当运用多种评价方式”“注重评价主体的多元与互动”“突出语文课程评价的整体性和综合性”,提出了各个维度评价的具体建议。

(三)个性化发展目标

基础教育新课程的评价改革要求,“评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信”。社会是丰富多彩的,社会发展对人才的需求也是多种多样的,每个人的兴趣爱好、个性特长、发展潜能也各不相同,每个学生都是独一无二的。素质教育要求促进学生全面发展的内涵之一就是让所有学生的个性得到充分、自由的发展。然而,“教育有两个根本弱点……第一个弱点是忽视了(不是单纯地否认了)个人所具有的微妙复杂的作用,忽视了个人所具有的各式各样的表达形式和手段。第二个弱点是它不考虑各种不同的个性、气质、期望和才能”。[8]基础教育课程改革要求,改革课程设置和教学方式,充分发挥评价的诊断、调节功能,及时发现学生的优势、特长、潜质,了解不同学生的不同发展需求,并为学生各种潜能、特长的发展创造机会和平台,促使潜质不同、兴趣各异、志向有别的所有学生都获得各得其所的发展。因此,学生评价不仅要关注反映学生发展共性的基础性发展目标和学科学习目标,还应该有体现学生多元化发展需求的个性化发展目标,通过成长记录等多种评价方式,全面掌握各个学生的发展特点,真正达到“创造适合儿童的教育”。

总之,学生评价不仅要关注学生的学业成绩,而且要发现并发展学生多方面的潜能。教师要本着发展的观念,综合运用多种评价方法,动态地评价学生在认知、情感、态度、创新意识和实践能力等多方面的进步和发展变化,帮助学生认识自我,建立自信,健康成长。

四、学生评价方法改革

如前所述,学生评价的方法很多,过去常用的是量化的评价方法,如考试、测验等。基础教育新课程的评价方法改革提倡量化评价和质性评价相结合,除了传统的评价方法如测验、考试外,还应该采取一些质性的评价方法,来弥补量化评价的不足。质性评价方法有很多,如表现性评价、档案袋评价、真实性评价、苏格拉底研讨评定等,这里主要介绍表现性评价和档案袋评价。

(一)表现性评价[9]

随着社会发展对人才素质水平和内容要求的不断提高,人才培养的目标发生很大变化,基础教育新课程改革提出了除知识技能目标外的过程与方法、情感态度与价值观目标。传统的纸笔测验的评价方法只能考查学生对事实性知识的掌握情况,对过程与方法、情感态度与价值观目标的达成度无能为力。因此,表现性评价方法应运而生。

1.什么是表现性评价

表现性评价就让学生在真实或模拟的生活情境中,运用所学过的知识和技能去完成某个综合性的、真实的任务,以考查学生知识和技能的掌握程度、解决实际问题的能力以及交流合作、批判思维等多方面能力的评价方法。

美国国会技术评价办公室1992年对表现性评价提出了一个描述性的定义:表现性评价是要求学生创造出答案或产品以展示其知识或技能的测验。

比如,《高中语文课程标准》要求学生“具有日常口语交际的基本能力,学会倾听、表达与交流,初步学会运用口头语言文明地进行人际沟通和社会交往”,因此,口语交际能力的培养和评价是语文教师的重要任务。那么,怎么评价学生的口语交际能力呢?传统的书面考试难以做到,于是,教师设计一个情境,让学生与同学讨论某个话题或向不知情人陈述某个事件。教师通过学生完成这一任务过程中的表现来评价他的口语交际能力,即为表现性评价。

在表现性评价中,学生面对的任务是真实的,完成任务或解决问题的情境也是真实的。评价的内容更关注高层次学习所要求的知识的整合、批判性思维和分析问题解决问题的能力。可见,表现性评价的范围不仅仅局限在认知领域,还可以评价学生的情感、态度和社会技能等。

2.表现性评价的特点

与书面考试相比,表现性评价有以下明显的特点。

(1)评价功能的激励性。表现性评价任务的完成过程和结果可以可以为学生创造一个良好的学习氛围和积极的自我形象,从而使学生增强自信心,提高学习热情,增强学习动机。

(2)评价内容的全面、综合性。表现性评价要求学生完成的任务是整体的、复杂的、综合的。任务的完成要经过多个环节,综合多种知识和技能,要求学生将所学的知识与社会政治、经济以及问题所处的真实环境相结合,有助于检测学生的综合实践能力和高级思维活动,同时还可以考查学生的情感态度和价值观,而不像书面考试只能考查单个的知识点。

(3)评价标准的开放性。表现性评价没有统一的标准答案,每个学生都可以寻找自己解决问题的方法,可以充分表现自己的个性才能,这就为学生的好的创造提供了广阔的表现空间。

(4)问题情境的真实性。学生所完成的表现性任务是真实、具体的,它强调在模拟真实或完全真实的情境中运用所学知识解决实际问题,反映的是问题解决和学习的真实面貌,特别有助于考查学生解决问题的能力。

(5)与教学活动相融性。书面考试通常是在某一教学活动结束之后进行的,以分数反映学生的学习情况,对改进教学提供的学习是有限的。而表现性评价是将评价与教学融为一体。而且评价的情境与教学的情境越一致,评价的效度越高。同时,还能为教师提供丰富的有关学生发展状况的信息,有助于教师改进教学。

3.表现性评价的实施

实施表现性评价一般要经过3个环节:设计表现性任务、指导学生完成任务、展示与交流。

所谓表现性任务就是让学生参与的活动,通过这些活动让学生表现出某些特定的技能,或创建出符合某种特定标准的成果或作品。通过表现性任务不仅评价学生“知道什么”,更重要的是评价学生“能做什么”;不仅要评价学生行为的结果,更要评价学生行为表现的过程;不仅对学生某个领域、某个方面能力进行评价,更要对学生综合运用所学知识进行操作、解决问题的能力进行评价。

设计表现性任务一般有以下6个步骤。

第一步,明确要评价的展示、技能和认知行为以及什么是能够反映学习成绩的证据;

第二步,创造情境,即选择一个有意义或重要的问题,使学生置身其中;

第三步,写出指导,即用清晰的语言描述希望学生知道什么和做什么;描述出学生做的作品和应有的行为表现;

第四步,确定受众对象,即告诉学生完成这个任务是为什么人做的,什么人将从这个任务中受益;

第五步,给出评分规则;

第六步,回顾前面设计的任务,进行修改。

设计表现性任务要紧扣学习内容,尽可能增强任务的趣味性,以激励学生更好地完成任务,对任务及要求的说明要明确具体,充分体现评价的要求,保持与评价目的的一致性。

表现性任务的形式主要有口头表述(如课堂演讲、辩论等)、项目调查(小组合作进行一些社会问题的调查研究)、模拟表现(让学生在模拟的情境中扮演某一角色完成特定的任务)、科学实验、喜剧表演、学习日志(学生回顾、反思自己的学习情况,包括学习内容、对问题的认识、解决问题过程的成功与挫折、自我感受等)、艺术作品、撰写论文等。

表现性评价任务的基本内容包括:要完成的任务、进行方式和最终要求以及完成的时间。

由于表现性评价任务通常没有统一的标准答案,为了提高评价的信度,在设计表现性任务的同时,还应该编制具体、明确、可操作的评分标准和评分规则,它包括表现性评价的内容、行为目标、表现水平标准等。

表现性评价任务设计好之后,教师要与学生进行充分的交流,向学生说明任务目标的要求、评分规则的内涵,并采取有效的方法引导学生积极认真地完成任务,同时给予必要的指导。在学生完成任务的过程中,教师要根据评分规则对学生的实际操作情况、行为表现进行仔细观察和记录,这是教师评分的依据。当学生完成任务之后,可以将其学业成果——作品进行展示和交流,教师给予点评,必要时可以进行作品的评选,以引导学生参与评价过程,培养和提高学生自我评价的意识和能力。

实施表现性评价要注意的是,尽管它有纸笔考试等评价方法所不具备的优点,但也存在一些局限,如评价结论的客观性不足、操作上有些困难等,所以,不能用表现性评价来取代纸笔考试,应根据两者各自适用的方面结合起来使用。

相关链接

案例:高中语文课中的表现性评价

为杂志撰稿

艾滋病是人们普遍关注的一个话题。假设你现在应一家杂志社之邀,写一篇文章来比较现在和十年前我们对艾滋病的了解情况。你要按以下要求来完成任务。

1.找到最新的有关艾滋病病因、危险因素及治疗方法的文章或其他资料。列出所有的资料来源,并附上所有资料的摘要。

2.从去年的出版物中选出五篇最好的文章或其他资料。

3.依照同样的程序选出过去十年中出版的五篇最好的文章。

4.写文章比较两组文章和资料。叙述过去十年中人们对艾滋病的病因、危险因素的认识,以及治疗方法方面的改变。

5.把你的文章寄给杂志的读者看。把你的文章限制在4页打印纸内。你可以按需要加入插图和图表。

6.把参考资料列在文章的末尾。

我们将从以下几方面对你的工作进行评价:资料的数量和种类、资料的质量、文章所用表达方式的多样性、问题的适合性和文章的内容、叙述的清晰性和效果。

(选自国家基础教育课程改革“促进教师发展和学生成长的评价研究”项目组培训资料。)

(二)档案袋评价

1.什么是档案袋评价

档案袋评价是以档案袋为依据对评价对象进行评价的质性评价。学生档案袋评价也称作“学生成长记录袋评价”,是20 世纪90年代伴随西方教育评价改革运动而出现的一种新型质性评价工具。

档案袋是指用以显示学生学习成就或持续进步信息的各种作品、表现、学习反思等相关记录和资料的汇集。

档案袋评价要求评价者有目的、有组织、有计划地收集反映学生学习表现、成长进步的材料和证据,如考试成绩、作业、笔记、作品、照片、录音带、录像带等,并附上学生自评、教师评语、同学互评、家长评语,既注重学习结果,也注重学习过程,强调形成性,关注学生的行为表现和成长过程,是一种典型的发展性评价方式,这正是其在我国基础教育课程改革中备受推崇的原因。

实施档案袋评价需要评价者根据评价目标的要求,有意识地将学生的相关作品及其他有关的证据收集起来,一段时间以后,通过合理的分析和解释,发现学生的优势和不足,明了学生的进步和发展状况,为后续的教育教学策略的选择提供依据。可见,档案袋里的材料是实施评价的主要依据,所以,档案袋的收集和制作就显得非常重要,一般要注意以下几点。

(1)档案袋里的材料主要是学生的作品。例如试卷、作业、小论文、手工作品、表演录像、日记、学习心得、学习反思、教师和同学的评语等,材料呈现方式可以各式各样,如文字资料、手稿、照片、图画、剪报、证书、录像、录音、报纸杂志等。

(2)档案袋里材料的选择是有目的的。档案袋里究竟要收集哪些内容,并没有一个硬性规定,但不是学生的任何东西都可以随意放进档案袋,必须服从于建立档案袋的目的,要根据评价的目的收集相关的内容,比如,为了考查学生某一时期成长进步的状况,那么收集的材料就不仅是学生最终作品,还应该包括反映学生学习过程的材料(如一篇文章的草稿)。材料的选择要有代表性,不能千篇一律。

(3)档案袋材料收集的过程要结合学生的反思。档案袋不仅要记录和反映学生的成就和成长变化的过程,还要收集学生对“成长”“作品”以及对制作档案的历程进行自我反思的证据,让材料收集的过程成为是学生自我反思的过程,一方面使学生更深入地理解学习内涵;另一方面也有利于培养学生的自我评价、自我反思、自我选择、自主成长的能力和品质。

(4)档案袋里的材料必须是真实的。不能弄虚作假,伪造事实证据。这是保证档案袋评价的信度和效度的基本前提。

(5)档案袋评价的主体可以是教师,也可以是学生本人、同学或家长。评价对象可以针对学生个人,也可以针对小组或全班,前者着重学生个人发展、进步、努力和成就,后者着重小组或全班同学合作学习的成果与状况。

一个完整的档案袋通常要有以下几个部分的内容:封面(包括评价对象的姓名、年级、学科领域等)、目录、档案袋材料内容(对每份材料要标明时间)、对作品的反思等。

2.档案袋评价的优点

档案袋评价与传统的评价相比,有其明显的优点。[10]

(1)有助于展示学生的真实表现。档案袋的最大优势是向老师、家长和学生展示一个真实、丰富的学习过程,比起纸笔测验和传统评价更能说明学生知道什么和能够做什么。如果设计合理,能够展示学生的思考能力和解决问题的能力、所使用的策略和过程性技能以及知识的建构,还可以表明学生的持续力、努力以及意愿的改变情况。

(2)有助于发展学生的自我反思能力。在表现性评价中需要学生参与对自己或他人作品的判断和选择,可以帮助学生发展自我评价能力,并认识个体差异。

(3)有助于促进学生的积极参与和师生的合作。在档案袋评价中,需要学生与老师一起参与作品收集的全过程,如确定标准、选择项目、收集作品;定期在师生会议上一起浏览档案袋,一起阅读档案袋里的作品,共同讨论学习过程中的成绩和需要提高的方面。所有这些都有助于学生的积极参与和师生的合作。

(4)有助于促进学动机水平的提高。在档案袋评价中,把学生自己的作品和过去相比较,更容易让学生看到自己的进步,并且关注学生最好的作品,有助于对学生产生积极的影响,提高动机水平。

3.档案袋的类型

档案袋依据使用的目的、参与者及其结构、功能的不同可以分为多种类型,国内外学者对此有不同的划分,下面介绍两种分类法。

(1)美国南卡罗来纳大学教育心理学教授格莱德勒(Gredler M.E)将学生档案袋分为理想型、展示型、文件型、评价型和课堂型五类,它们的目的和构成如下表。

(2)约翰逊(Johnson)提出的最佳成果型、精选型和过程型。

①最佳成果型档案袋的主要内容可以包括:a.语言艺术:一系列写作类型的最佳作品,如说明的创作的(诗歌、戏剧、短篇故事)、报刊的(报告、专栏作品、评论)、广告副本、讽刺作品或幽默作品等。b.科学:学生做的最佳实验室成果;开发的最佳原创假设、对教师提出的科学问题的最佳解决、对科学问题阐述自己主张的最佳论文、对儿科学杂志或期刊上的文章的最佳记录或日记。c.社会研究:学生写的最佳历史研究论文、学生参与的一定量的最佳争议和讨论、学生提出的最佳原创历史理论、对历史的最佳一篇短文、关于当前事件的最佳评论、对学生所读历史传记的最佳评论。d.数学:对教师所提问题的最佳解答、学生开发出的最佳原创数学理论、对数学期刊的最佳评论或学生写的数学家传记、对问题解决的最佳描写(描写问题解决的过程)、学生探究过的数学理念的一张照片、图解或概念图。

②精选型档案袋要求更广泛的学生成果。它要求学生提交他们感到困难的成果例证,其时间往往要持续一年以上,使之成为深刻反映学生成长的概要和揭示学生一般成绩的证据。

③过程型档案袋则寻求发展性成果证据。它要求学生一步一步地检查他们在一定领域中取得进步的成果。提交内容的类目也许由教师决定,但学生负责收集必要的成果。学生成为他们自己成果和进步的积极评价者。

实践中用得多的还是复合型档案袋。复合型档案袋是以上多种档案袋的综合,其内容不仅包括学生选择的作品,也包括教师选择的作品。无论是学生选择的作品还是教师选择的作品,都应该有对为何选择这些作品的反思的记录。学生通过选择作品和反思为何作出这样的选择,可以学会如何评判作品以及如何进行自我评价。教师通过选择作品及对选择过程的思考,可以加深对学生个人的情况及学习过程的了解。这样,就可以把档案袋的创建过程转化为师生有意义的学习过程。

4.档案袋评价的实施

实施档案袋评价一般包括以下几方面的工作。

(1)明确评价的目的或所要评定的教学目标。通常把那些用传统是纸笔测验无法评价的方面作为档案袋评价的目的。

(2)根据评价的目的和内容,确定档案袋材料的类型和数量。如果是为了展示学生的学习成就,那就要收集反映学生学习成就的最好的作品;如果是为了评价学生学习进展的情况,那就要收集反映学生学习进步的性质和程度的材料;如果是要评价学生实验操作动手技能,那就要收集学生的实验设计、实验报告、实验过程的记录等材料。档案袋所放的材料包括必要材料(所有学生都要放的)和自选材料(学生自己决定要放的材料)。

(3)设计档案袋评价的标准、方法、时间及次数。

(4)做好对学生的指导及相关人员的沟通工作。向学生说明建立档案袋的意义、使用的方法等,必要时提供档案袋的样例。将实施档案袋评价的计划告诉家长和相关教师,取得他们的支持。

(5)收集材料,创建档案袋。在这个过程中教师要对学生的活动进行指导,并随时观察、记录学生的表现。档案袋的内容要充分展示所设立的目标。

(6)师生共同对档案袋进行评价,包括对档案袋所收集的材料的评价和综合评价。

(7)将评价结果报告给学生及其家长,说明评价结果的意义。

(8)必要时组织档案袋的展示,邀请相关教师、家长和学生观看学生的发展成果。

相关链接

反映学生学习过程的档案袋——练琴的录音[11]

一位学生在学习拉小提琴的过程中,家长在不同的阶段分别为他做了录音。例如:“今天是某月某日,从今天开始,我练习某个曲子。”然后是断断续续、不成曲调的练琴声。接着是“今天是我练习这首曲子的第十天”,接下来大家听到的是已经连贯的练习曲。这组录音的最后是该学生将登台演出的前一天录的,“明天我将在公众场合下演奏这首曲子”,这时该学生拉出的这首曲子欢快、流畅,显然已经十分娴熟。

试想,听到这一组录音的人,包括该学生自己,谁能不被该学生的成长所感动呢?

拓展阅读

国际学生评价项目(PISA)简介[12]

一、PISA的概念

“国际学生评估项目”(Program for International Student Assessment,PISA)。它是经济合作与发展组织(Organization for Economic Co.operation and Development,OECD )负责组织实施的国际评价比较测试。该项目旨在评估OECD成员国接近义务教育末期的15岁学生在阅读、数学及自然科学方面的知识、能力和技巧,以及跨学科的基础技能,并通过国家间的比较找出造成学生能力差异的经济、社会和教育因素,从而进一步为各国改善自身的教育体制提供必要的参考指标和数据。

PISA认为,在当今这个知识爆炸、信息激增的时代,青少年不可能在学校里学到成年以后所需要的一切知识和技能,因此,PISA的评价体系是基于终身学习的理念所设计的。PISA报告强调指出,PISA评价的重点并不是学生掌握了多少学科知识,而是他们在实际生活中创造性地运用这些知识和技能的能力。虽然它的评价领域与学校学习科目紧密相关——阅读、数学和科学,但它并不局限于对学生在校学习的课程进行测评,而是把着眼点放在实际的社会生活情境中,测评学生为迎接当今知识社会的挑战而做的准备情况,即学生应用其知识和技能应对实际生活挑战的能力。

二、PISA的实施

PISA测试三年举行一次,测试学生的阅读素养、数学素养和科学素养。每次测试的重点都有所变化,按照阅读、数学、科学的顺序循环。该测试在2000年首次举行,当年的测试以阅读为重点,2003年的测试以数学为重点,2006年的测试以科学为重点(除此以外还兼顾测试学生的跨学科基础技能,如在第一循环中就有能反映学生自学能力和计算机运用水平的试题)。其中重点测试项目的权重约占总体项目的2/3左右。在2000年和2003年两次测试完成之后,其新颖科学的评价理念与框架设计、详细具体的评分标准引起了世界范围的广泛关注和强烈反响。参加PISA的国家和地区在不断发展和扩大之中,从2000年的43个发展到2009年的65个,参加PISA的国家和地区的GDP总和占了全球的90%。每个国家和地区至少有150所学校、4500名学生参加测试。

三、PISA的内容

PISA对阅读、数学和科学能力的测量依据三个标准:熟知知识的内容或结构,如熟悉科学概念或者不同的文章类型;阐述所掌握的信息,如能够清晰地表达从一篇文章中所获取的信息;应用所学的知识和技能,如学生在个人生活方面自己作出判断。PISA项目的评价检测均为三维设计。阅读素养的三个方面是:阅读材料或文本的形式、阅读的内容、文本建构的情境或背景;数学素养的三个方面是:数学内容和一般数学能力的数学化过程、使用数学的环境、从私人情境延伸到广阔的科学与公众场景;科学素养的三个方面是:为了理解特定的自然现象所需的科学概念以及为了理解人类活动变革的科学概念、设计科学过程(再认识科学问题、确认证据、勾画结论、交流结论、演示科学概念的理解,主要集中在获取、理解和论证上)、理解科学情境。

四、PISA的特点

1. PISA评价的功能。首先,通过PISA,OECD成员国可以收集信息来改进测量学生成绩的相对指标。OECD每年会在《教育概览》(Education at a Glance)上发表一系列的指标,这些指标提供了投入到教育上的人力、财力资源信息,教育体系和学生学习体系如何运用及发展的信息,个人、社会和国家转向教育投资的信息。其次,PISA是在国与国之间可以监控教育成果的独特参考指标。PISA项目由经济合作与发展组织的参加国家政府组织开展,由国际专家共同进行评估工作,使得其结果在不同的国家和文化背景下都具有可比性。

2. PISA评价的主体。PISA突破了传统的单一学校评价方式,形成多元化的评价主体。PISA的评价主体包括学生、家长、校长和教师四个方面,从各个方面对叙述作全面的评价。

3. PISA收集信息的方式。从表面上看,PISA是让学生参加笔试,但它不同于传统的笔试形式,表现在其宽泛的评估条款、广泛的覆盖领域、标准的评估准备和运行程序。

4. PISA评价的方法。(1)实效性。PISA调查每三年举办一次,这样可以使各国定时监控教育情况。(2)可比性。OECD在PISA的设计中选择在绝大多数国家的学生完成义务教育的年龄点(15岁)进行测量,这保证了其指标的可比性。(3)科学性。PISA拥有严格的学生样本、案例指示的综合评判标准和可比的观测变量。

五、PISA测试样题举例

1.PISA阅读测试样题

■在阅读两封有关“涂鸦”的信件基础上,回答下列问题:

涂鸦

【阅读材料1】

为了去掉墙上的涂鸦,这次已经是第四次清洗学校墙壁,这真的使我气极了。创作本来是值得欣赏的,但创作的方式不应该为社会带来额外的开支。

为什么要在禁止涂鸦的地方乱画东西,损坏年轻人的声誉?专业的艺术家不会把自己的作品挂在大街上,对吗?相反,他们会透过合法的展览来赚取收入和名声。

我认为楼房、篱笆和公园的长椅本身就是艺术品了,在它们上面涂鸦,只会破坏其风格,而且,这样做更会破坏臭氧层。我真不明白这些可耻的艺术家为什么在其“艺术品”被一次又一次的清理后,还要不断地乱涂乱画。

——海尔格

【阅读材料2】

品位是无法言喻的。社会上充满了各种各样的沟通方式和广告宣传,如公司的标志、店名,还有矗立在大街两旁的各种扰人的大型广告牌。它们是否获得大众接受?没错,大多数是。而涂鸦是否获得大众接受?有些人会接受,但有些人则不接受。

谁负责涂鸦所引起的费用?谁最终负担广告的费用?对,就是消费者。那些树立起广告牌的人事先有没有向你请示?当然没有。那么,涂鸦者应该要事先请示吗?你的名字、组织的名字,和街上的大型艺术品,这些不都只是沟通的方式吗?

试想想数年前在商店里出现的条纹和花格子服装还有滑雪服饰。这些服饰的图案和颜色就是直接从多姿多彩的墙上偷来的。可笑的是,这些图案和颜色竟然被欣然接受,但是那些有同样特色的涂鸦却被认为是讨人厌的。

现在要做艺术真的不容易。

——索菲娅

■问题1:这两封信的写作目的都是:

A.解释什么是涂鸦

B.发表对涂鸦的意见

C.证实涂鸦的流行程度

D.告诉读者清除涂鸦的成本。

■问题2:为什么索菲娅会提及广告宣传一事?

■问题3:我们可以讨论一封信件叙述的事情(它的内容);我们可以讨论一封信件写作的手法(它的风格)。不论你同意哪个作者的论点,你认为哪一封信写得比较好?请根据其中一封信或者两封信的写作手法来解释作答。

■问题4:你同意哪一封信的论点?请参照两封信件内容,并用自己的文字解释作答。

2. PISA数学测试样题

苹果

农夫将苹果树种在正方形的果园。为了保护苹果树不怕风吹,他在苹果树的周围种针叶树。在下图里,你可以看到农夫所种植苹果树的列数(n),和苹果树数量及针叶树数量的规律:

问题1:完成下表的空格

问题2:你可以用以下的2个公式来计算上面提到的苹果树数量及针叶树数量的规律: 苹果树的数量=n2,针叶树的数量=8n,n代表苹果树的列数,当n为某一个数值时,苹果树数量会等于针叶树数量。找出n值,并写出你的计算方法。

_________________________________________________

问题3:若农夫想要种更多列,做一个更大的果园,当农夫将果园扩大时,哪一种树会增加得比较快?是苹果树的数量还是针叶树?解释你的想法。

_________________________________________________

3. PISA科学测试样题

唇油

下面的表格中给出了你可以自己制作的化妆品的两种不同配方。

口红比柔软的、乳状的唇油要硬一些。

问题1:

在制作唇油和口红时,先把油和蜡混合在一起,然后再把有色物质和调料加入。

使用这种处方制作的口红是硬的,同时也不好用。为了制造一个软一点的口红,你该如何改变这些成分的比例?

_________________________________________________

问题2:

油和蜡是可以较好混合在一起的物质。但油不能与水混合,蜡也不能溶于水。

如果很多的水溅入了正在加热的口红混合物中,以下哪一种情况最可能发生?

A. 将生产出一种更像乳脂的,更柔软的混合物。

B. 这个混合物将变得更加坚硬。

C. 这混合物一点都没有改变。

D. 混合物的脂肪小块浮在水面上。

问题3:

当一种称为乳化剂的物质加入时,它可以让油和蜡较好地溶于水。为什么肥皂和水能洗掉口红?

A. 水中含有可以使肥皂和口红混合的乳化剂。

B. 肥皂担任乳化剂的角色让水和口红混合。

C. 口红中的乳化剂让肥皂和水混合起来了。

D. 肥皂和口红结合起来形成一种乳化剂使它们能与水混合。

[1] 霍华德·加德纳:《多元智能》,沈智隆译,16页,北京,新华出版社,1999。

[2] 同上。

[3] 同上,32页。

[4] 同上,34页。

[5] Linda Campbell Bruce Campbell,Dee Dickinson:《多元智能教与学的策略》,王成全译,432页,北京,中国轻工出版社,2001。

[6] 钟启泉、崔允漷、吴刚平:《普通高中新课程方案导读》,16页,上海,华东师范大学出版社,2003。

[7] 霍力岩、赵清梅:《多元智力理论的评价观及其对学生发展评价的启示》,载《比较教育研究》,2005(4)。

[8] 联合国教科文组织:《学会生存》,105页,北京,教育科学出版社,1996。

[9] 胡小萍:《表现性评价的设计与实施》,载《江西教育》,2004(23)。

[10] 李风华:《档案袋评价——关注学生的发展》,载《现代中小学教育》,2003(3)。

[11] 新课程实施过程中培训问题研究课题组:《新课程与评价改革》,93页,北京,教育科学出版社,2001。

[12] 胡中锋:《教育评价学》,256页,北京,中国人民大学出版社,2008。