学校工作质量评价是教育评价的一个组成部分,它是从微观层次上,对学校内部的教育活动包括思想教育、教学、体育卫生、后勤、领导、办学条件的改善与发展等方面工作进行的检查和督励。它以一定的价值观念和具体的标准体系为准绳,对学校各方面工作质量状况进行科学的调查和判断,确定所考察的对象达到什么水平,是否符合人们对它所提出的要求,并进而提出改进的意见。评价不同于测量,后者侧重于对教育现象的描述,前者却要对后者所描述的情况进行价值分析并对分析结果提出改进意见。
科学的教育评价对促进学校各个方面工作有十分重要的意义,它为学校各个方面的工作提出标准,发挥指导的作用;它是管理者监督工作运行的工具,诊断工作中出现的问题和失误;它作为一种管理机制,不断提高工作人员规范治校的自觉性,激发广大干部和教职工的工作干劲。
一、教育评价的发展历程
为了更好地理解学校质量评价,回顾一下教育评价的发展历史是必要的。
教育评价是与考试制度联系在一起的。起始于中国隋朝的科举制度,是以文字考试形式鉴定文人学力的一种古老评价制度,由于它突破了传统的“荐贤”所固有的“举人唯亲”的痼疾,原则上可以实现“举人唯贤”的政治要求,所以在相当长的历史时期内,它是中国统治者选拔政治人才的基本手段,并成为以后资本主义政治生活中选任文官的示范。
20世纪初,在美国首先形成了心理测量运动,心理学家桑代克于1904年发表了《精神与社会测量导论》,宣称“凡是存在的东西都有数量,凡是有数量的东西都可以测量”。此书的出版标志着心理测量运动的开始。到了30年代,心理测量已发展为学力测验、智力测验和人格测验三种类型,步入高峰。30年代以后,有些学者批评心理测验试图用数字指标表征人的全部心理状况是不现实的,因为人格中的某些方面,如社会态度、兴趣、爱好、情绪等,仅凭测量是无法把握的,而应该用非数量化的方法去进行描述、比较和评定。这种批评是教育评价发展的舆论准备。
1929年,资本主义发生经济大萧条,大批重工和少年工人失业,如何为他们提供适当的课程以利其重新就业成为社会关注的一个问题。从1933年起,以拉尔夫·泰勒(Ralph Tyler)为首的课程评价委员会,对此进行了8年研究,不但对课程提出了有益的改进意见,而且对教育评价提出了较为系统的见解,如:评价不应是临时性的孤立行为,而应有组织地连续进行;评价不应只依据个人的经验,更应该采用科学的方法;评价不应只针对学生个别方面的发展,而应是全面的。这些观点为教育评价科学、全面的发展奠定了基础。
1948年,美国教育学家集会芝加哥城,提出探讨将教学活动的评价建立在一个更为科学、系统的指标体系上的问题,这一任务由布鲁姆(B.S.Broom)领导一个委员会进行。该委员会在50年代初提出了分类为认知、情感意志和技能技巧的教育目标体系,这一体系的提出为学科教学任务指明了方向,同时使教学评价规范化了。
近20年来,教育评价的发展呈现了以下特点:
1.教育评价形成多种互补模式
教育评价自Tylor正式提出以后,占主导地位的是“行为—目标”模式。这一模式就是由权威机构提出评价教育活动的目标体系,教育工作者遵从目标要求去开展工作,之后将结果对照目标要求进行评价。这一模式是迄今为止的基本模式,它的优点是目标明确,指导性强,有利于加强管理者的权威,评价活动规范,各方面人员行为的可预见性强,有助于形成默契配合的关系。但这一模式也潜藏着三个问题。①权威机构提出的目标体系就那么正确吗?它会不会存在错误?有没有不够完全的地方?②这一模式由于重权威性,因此它必须照顾多数被评价对象的共性,体现普遍要求,这就容易忽略个别人的特殊性。③这一评价模式强调稳定性,其价值指导和指标内容有可能滞后于环境的变化。如果这些问题是存在的,那么这种模式可能会掩盖某些问题,甚至会产生误导。
基于上述考虑,米歇尔·斯克里温(Micheal Scriven)于1972年提出了“目标游离模式”,这一模式重视结果胜于重视意图,只从结果来判定教育活动的价值,而不管当初的目的何在。在实践中这一模式具有发散性的特点,评价者具有独立性,他只从自己的价值观和标准进行评价,不拘泥于原有目标,从而提出具有启发性的结论。当然,这一模式由于随意性较大,作为评价的主体模式也是不适宜的,只能作为前一种模式的补充。
另外一种较有实际意义的评价模式是司法式评价模式(Judical Evaluation),又称为对手模式。这一模式是基于管理者想在复杂的教育活动中充分听取各种不同评价意见的前提而诞生的,比如评价一项重大的改革方案,或讨论在关键岗位上举用一个优缺点均很突出的人员是否适当等。这一模式借用法律诉讼程序的做法,设置控辩对立双方,在各自研究资料的基础上进行讨论,详陈观点并举证说明,最后由决策者根据双方叙述的观点和情况作出决断。
2.形成性评价的地位不断上升
传统的评价把重点放在终结性评价,即只关心活动的结果,这种倾向导致教育者和管理者以主要精力开展对最后成果的检查、评比,忽视对生成过程的管理,这导致缺乏对教育过程规律的研究,也就不能有针对性地提出改进意见,从而使结果缺少合理、科学的过程保障。现代教育评价注意到了这种做法的片面性,将形成性评价的地位大大提高了。所谓形成性评价是对教育过程所进行的评价,它的功能是揭示问题、改进工作,只有通过评价教育过程的各个环节,实施质量约束和保证,才能培养出合格人才。
3.评价方法日益科学化、多样化
随着教育评价深入发展,方法的科学性问题越来越受到重视,人们力图使评价结论真实可信。从总体而言,系统科学的方法受到广泛应用,人们不是孤立地评价某一对象,而是把它放在一定的背景下进行考察,从而获得对问题公正的认识;计算机技术也被引入到评价手段中来,使得原来难以处理的某些模糊现象(价值、情感、品德、智力)能够在一定程度上得到合理加工和综合。从微观上看,教育评价的各个环节都得到深入的研究,更加科学化,比如制定评价目标阶段,广泛运用了专家会议法、特尔裴法等;在收集信息阶段运用了观察法、问卷调查法、标准化考试、问题情景法等。
4.评价主体范围日益拓展
传统教育评价局限于组织内部管理者对被管理者的评价。当代教育评价则根据民主化原则和实际需要,将评价者的范围大大拓宽了,不仅管理者对被管理者进行评价,被管理者也参与对自己、对同事、对上级的评价;不仅教育系统内部对教育活动进行评价,而且其他社会力量如社区、企业、家庭也对教育系统中各部门的工作进行评价。这种趋向弥补了单一评价主体所可能带来的片面性,在评价中反映了各个有关方面的教育要求,从多视点对教育工作的成败进行全面的考察。
5.评价内容向全方位发展
传统的教育评价限于对学校课程设置的评价、对学生学习情况的评价,范围比较狭窄。现代教育评价充分注意到教育工作的各个方面,改进各种因素对教育质量的影响。
教育评价在教育管理领域所发挥的巨大作用不仅引起了教育界的普遍关注,许多国家政府也将它作为监督和指导教育工作的有力手段,大力支持和完善这项活动。
二、教育评价的原则
教育评价是一项真理性和价值性都很强的工作,它在运行中既要符合评价对象的发生发展规律,也要考虑被评价对象(人)的利益要求并进行恰当的方向引导。评价所得出的结论对实际工作有很大的导向作用,对处于第一线的领导、教职工和学生都有较大影响。因此评价中必须遵循一系列科学的原则,使评价真实可信,既能客观揭示问题,又能激励被评价者上进,促进各项工作开展。
1.客观性原则
进行教育评价时,要实事求是,不主观臆断,不以个人好恶论长短。评价必须根据科学的评价标准来进行,标准一经确定,就不要随意改动。评价中如果掺入个人感情,势必会挫伤被评判者的积极性。
2.全面性原则
在评价中要全面而恰如其分地评价教育工作中的各个项目或各种具体指标,不要过分地渲染某些项目或某些指标,而忽视另外一些项目,这样易使工作失去平衡,出现片面性。而片面性是与培养全面发展的人的方针格格不入的。当然,全面性与分清主次是不矛盾的,对性质和作用不同的项目给予不同程度的权重是必要的。完全忽略某些方面或对该较多关注的项目给予关注不够,都是不对的。
3.一致性与差别性相结合的原则
一致性原则是指教育评价时,对所有教职工和学生都采用一致的标准,而不能采取两套或两套以上的标准。只有遵循一致性标准,才能在群体中区分出好坏、优劣,使被评价者知道自己的实际状况和在群体中的位置,这样才有利于找出差距,发现不足,激励人向上。
但在评价过程中又需要注意问题的相对性一面。由于学校条件各异,领导水平不同,教师和学生个体的特长和不足各异,所以在评价中又要从被评价者实际情况出发,寻找个体内的差异,通过与过去相比,判断他们现在是进步了还是退步了,这样做能使被评价对象发现自己主观努力程度如何,相对自己过去而言还需在哪些方面加倍努力。注意有区别地评价对象,可以起到鞭策和激励人的作用。
4.定量分析和定性分析相结合的原则
定性分析是对被评价对象的状况和性质所进行的判断,这种分析方法通常首先要对评价对象的表现按照一定的标准进行描述,然后对其特点、问题、本质、发展趋向等方面进行解析。这种分析方法的特点是综合性、模糊性较强,注意抓住事情的重点和本质。定量分析是对被评价对象进行数量分析和比较,其特点是分析因素单一、精确。与定性分析方法比较,定量分析具有明快、简单、易于比较等特点,70年代以来,在教育评价的某些可量化领域得到应用。但是量化法本身有一些不足值得注意:第一,对评价要素进行量化时,首先要把它精确地区分,使之独立才能正确地加以测量,这样我们在评价某事物时,在观察阶段就必须主观地割裂它与其他事物的联系,这常常导致对问题进行简单化、表面化的分析,不能从根本上看问题;第二,对评价要素量化时,要将其静止化,把它看作某一时刻的某一点才能精确测量,在很多情况下,这一点表现带有一定偶然性,不能真实反映被评价对象的实际;第三,很多社会因素和人的心理因素不能或不易被量化。根据这些特点,评价中要将二者有机地结合起来,缺少任何一方面都不足以全面把握被评价对象的实际情况。
5.他人评价与自我评价相结合的原则
这一原则有两层涵义:其一,评价不仅要有领导、同行、同学或专家来参加,还要有被评价者自己参加。现代教育评价的任务不仅仅是给被评价者下一个定论,更重要的是通过评价改进他们的工作。离开被评价者的积极性,评价就失去了它的意义。同时,被评价者的自我认识和自我评价是保证全面地公正地进行评价的一个不可缺少的因素,没有他们对自己工作和表现所提供的信息与看法,评价就失去一个方面的根据,其客观性和公正性也难以保证。
这里特别应当加以说明,既然被评价者作为主体参加到评价活动中来,就应当是一个有充分权利的主体,不仅应当作出自我评价,还应享有对评价的最终结论提出申辩的权利。这样做不仅是对被评价者的尊重,还可以通过答复申辩进一步开展管理者与被管理者之间的沟通,进行指导,以便更好地改进工作。
其二,对教育工作的评价不仅由教育系统内部自己评价,还应由教育系统以外的人士或机构来进行。教育系统人员作为评价主体有了解教育规律之利,但也可能产生自我保护之弊。何况,教育系统以外人士进行评价可以收到“目标游离模式”效应,广开思路。
上述几个原则仅仅是对教育评价的一般原则所作出的阐述,照顾到了教育评价中的普遍情况。而当被评价对象及其活动具有特殊性的时候,教育评价的原则还应该根据具体情况加以适当补充或细化。比如说,一些研究者根据活动课程的实践性强、以学生为中心等特点,提出了“体验分享的原则”、“以学生自我评价为主的原则”、“非等级评价的原则”。[1]
三、教育评价的过程
1.制定评价指标体系
指标体系是系统的、操作化、可测量的评价标准,是目标的具体化。目标是对行动结果的笼统指向,为了使目标可操作性得到落实,就必须依据目标要求,遵循评价对象的运动规律,制定出具体的要求。它是开展评价工作的主要依据,也是评价成功的关键。在这个体系中,蕴涵着教育的价值观,也明确规定了对被评价者及其职责的详细要求,因而它发挥着导向和规范作用。
(1)制定指标应把握的几点特殊要求
制定教育评价的指标体系除了要遵循教育评价的一般原则之外,还要遵循几点特殊的要求:
①各项指标要有独立性,其内涵不应与其他指标相互重叠。比如,在对学生发展进行评价时,“主体性”与“独立性”不应同时列入指标,因为后者应是前者内涵的一部分。
②各项指标要协调,一方面应能从各个侧面反映目标要求,在主要规定性上完整地表现出评价对象的特征;另一方面,指标间不应相互矛盾和冲突。
③指标应是可测的。指标应尽量使用行为化、操作化的语言,以便采用适当方法获得较为直观、便于处理的信息。比如,评价教师的教学质量时,仅用“教学成果”作为指标项目就不够,还应将其分解为若干细化的项目,比如“学生考试成绩”、“学生自学能力发展”、“学生对该学科兴趣的增长”等,才能实施测量。当然,指标的操作化细分不是无限的,过细也会带来评价操作的困难。
④指标应有可行性。这里指标设定的水平应符合学校的实际,有群众基础,为他们所认同,不能过高或过低,也不能过于复杂,不便操作。
(2)指标体系的设计方法
指标体系设计大致分为两步,即分解目标和制定权重。分解目标是将总目标解析为层次分明、可测量的具体指标条目的过程,这一过程大概要经过以下几步:
①研究目标结构,将一级目标逐个列出。
②将每个一级目标逐层分解,可列为第二级、第三级目标。直至定出可测量、可操作的末级指标。一般来说,为了操作方便,指标分解到第三级就可以了。分解后,要从总体上审查指标是否合理,如有内涵重复的要合并;如有矛盾的要修正;对不可测量的,或舍去,或另立一个指标系统。
制定权重是对各项评价指标根据其在总体指标体系中作用大小而赋予一定的价值,它是以小数值来体现的,在0~1之间取值,同一评价指标体系中各项权重之和为1。科学、客观地制定权重很重要,由于权重表示各指标的地位,被评价者会对权重较大者给予较大关注,其导向的作用是十分明显的。
权重的分配方式可以有两种:直接分配和分级分配。
①直接分配是将权数直接分配到每一指标身上,这种分配方式在指标数目较少的情况下使用起来较为方便,数目一旦较多,每个权重值都非常小,造成各指标的评价分值都很小,难以区别差异大小。
②分级分配方式是将指标分为几个层级,每一层级都被看作总权数为1的相对独立的指标系统,在它的内部按各个指标不同地位分配相应权数,这一方式克服了直接分配方式的弱点,使得各指标在本层级中差异较为明显,便于比较和分析。
确定权重的主要方法也有两种:专家会议法和简化特尔裴法。
①专家会议法是邀请一批专家开会共同讨论指标权数的确定,大家面对面交换意见并最终达成一致看法。这一方法的优点是考虑问题全面,但有可能形成权威专家一言堂,或一些人由于顾虑大而不愿意发表独特见解的情况。
②特尔裴法是专家背对背、以匿名方式展开讨论确定权重的一种方式。运用特尔裴法要经过几次意见反馈,过程比较复杂。考虑到教育评价指标权重确定相对简单,因而可将其“背对背”这一特征借来运用,其余环节相对简化。这一方法的实施步骤大概是:
第一,确定被征询意见的指标体系,编制征询意见书。这个意见书除写明意图和要求外,要设计好下面形式的表格:
第二,选择专家。
第三,发放征询意见书,专家独立填写完成。
第四,统计处理专家意见,将模糊评价转换成等级分,计算平均数。这里要将各模糊评价等级赋值,如很重要为95分、重要为80分、一般为65分、不重要为50分。现假定对上述指标体系请15个专家评定,结果如下:
根据以上数据计算各指标实得总分
指标1实得总分=(95×7+80×5+65×2+50×1)÷15=83
指标2实得总分=(95×10+80×5)÷15=90
指标3实得总分=(95×4+80×4+65×5+50×2)÷15=75
然后对以上各分值作归一化处理,即将各指标的得分做总值为1的权数处理
指标1权数=83÷(83+90+75)=0.34。
指标2权数=90÷(83+90+75)=0.36
指标3权数=75÷(83+90+75)=0.30
2.选择恰当手段获得信息
在教育评价中,一般常用的获得评价信息的手段有考试(标准化考试、论文式考试)、问卷调查法、谈话法、行动观察法、问题情景法、个案研究法等。这些方法的运用要严格遵循科学程序进行。
3.质量信息的分析
在对各项工作的质量和学生的质量进行考核或调查而获得必要的信息之后,就要对所得资料进行科学的统计分析和评价,寻找出某些带规律性的结论,作为实施质量控制的依据。
学校质量分析大致可以分为前后相联系的两种类型:状态分析和因果分析。前者是对质量现有状态的初步分析和判断,带有描述的性质;后者是对影响质量的原因进行分析,带有推断的性质。
(1)状态分析
状态分析又可分为特征分析、比较分析和综合分析三种亚型。
特征分析是对学生质量或工作质量的某些项目特征指标所进行的分析。这种分析使人对质量在哪些方面或哪些具体指标上还存在什么不足可一目了然,因而它是指导教职工改进工作和指导学生改进学习的必要手段。比如分析体育教学中的学生身体练习质量,就可以从动作的准确性、协调性、缓冲性和经济性四种特征指标去进行分析。特征分析的量标多带有一定模糊性,一般采用优、良、较好、一般、差五级标准进行计量。在上述体育质量分析中,如果计量结果大致呈正态分布,达到“一般”以上四级水平的人数占80%以上,这说明身体锻炼的质量基本还是符合要求的。
比较分析是以现在的质量状况相对于某一质量水平所进行的比较。其目的是要判断被比较者质量状况的相对水平,或判断出被比较者的质量发展趋势。以学科成绩为例,可以进行这样几个方面的比较分析:①本学期考试成绩的纵向比较。这种比较可以是同一班级前后不同时期成绩的统计比较,目的在于发现学生学习成绩进步状况或研究不同类型、不同难度、不同分量的考试所造成的成绩差;也可以是将某一考试成绩与历届同一年级最高水平或最低水平相比,联系试题特征进行分析,从中发现学生对知识的理解、运用等方面有何特点。②对同一年级的不同班级进行比较。这种比较可以判断任课教师的教学水平,也可分析一个班的学习风气等方面的问题。③比较同一年级或同一班级各科考试的一般状况,以分析学生有无偏科状况。
综合分析或根据某些综合性指标,如学习成绩的合格率或体育的达标率,对质量进行的总体性分析;或凭经验或印象,对工作质量和学生质量进行整体性的评价和概括。这种分析有时较为粗糙,但对整体情况的了解却是不可缺少的。
(2)因果分析
在对质量的一般状况心中有数之后,就需要对质量提高或下降的原因进行分析,找出问题的关键所在。一般说来,分析学校教育工作质量的影响因素要从教师、学生、设备与教材、管理以及环境五个方面着手。这五个方面还可以分解为许多子因素。通常用鱼刺图来表示质量形成中的因果关系。下页图是某学校一学期以来学生思想教育质量不佳的因果图。在这种因果分析中,除列出各级因素之外,还要考虑各种因素之间的交互作用,同时,要将起主要作用的因素找出来,为了醒目起见,需要将关键因素用波浪线或彩线标示出来。
4.提出质量改进意见和建议
质量改进建议应该在坚持基本要求的前提下,因人因地制宜地提出实事求是的改进期望,所提要求应尽可能与被评价者或部门直接交换意见。
图16-2
四、教育评价中需要处理好的一些关系
1.常规评价与改革评价的关系
所谓常规评价是指按照一定的评价标准对学校日常工作所进行的评价。这种评价注重价值观念和衡量尺度的稳定性,在环境变化的情况下,它常常显现出一定的保守性,由此也就会给学校中的改革带来一定的障碍,因为变革通常要打破常规去探索新路,创造特色。所以对学校改革应当事先制定明确的评价指标,这些指标除了坚持常规评价指标中的有效内容外,要根据新的价值观念确定新的标准。在新标准尚不十分明确的情况下,可以给改革项目开设“特区”允许探索,而不要简单照搬常规评价指标约束改革进行。
2.内部评价与外部评价的关系
内部评价是指学校内部或教育系统内部对学校工作所进行的评价,外部评价是指学校或教育系统以外的人员或机构所进行的评价。内部评价比较容易组织,专业性强,熟悉情况,评价时专业理解比较到位,但也容易受习惯制约,产生保守倾向,并有可能有意或无意识地进行自我保护。外部评价多采用“目标游离模式”,从社会各种需要出发进行评价,评价者对学校工作存在的问题比较敏感,常能发现教育系统内部所忽视的不足,但外部评价也可能过于实用化,眼光狭隘。在实践中,应根据具体情况,把两种评价类型有机结合起来。