在高等教育评估中会遇到很多问题,但随着评估理念的发展,评估技术的进步以及评估经验的积累,许多问题已迎刃而解或不是国际上普遍的问题,但一些问题还困惑于高等教育评估活动中,向“左”向“右”都很为难。总结这类问题,能够为结合本国国情开展高等教育评估活动提供新的思考。
一、高等教育评估目的:规范还是特色?
开展高等教育评估活动必须首先回答其目的的问题,它是高等教育评估的基础性问题。在不同历史时期以及不同的国家,对它的回答有所不同的。就当代而言,高等教育评估是为了促进高等教育的规范发展还是特色发展?
高等教育的规范发展与特色发展是高等教育两种不同的发展模式。从思辨上理解,一方面,高等教育的特色发展离不开规范发展的。没有规范,高等教育发展失去“方圆”,更不可能谈其特色发展。因此,高等教育评估就是要捍卫高等教育的规范。任何一所富有特色的高校,在它的发展史中都能体现出它的规范。另一方面,高等教育的规范发展也离不开特色发展。一所高校的发展如果是因循守旧,跟随其他高校的发展或简单地复制他校的发展模式而没有特色,到头来可能高校的发展失去了生存空间。因此,高等教育评估必须注重高校发展特色。因此,从理论上看,高等教育的规范发展与特色发展是需要协调一致的。但高等教育实践的规范发展与特色发展毕竟有所不同,而且高等教育实践活动比较高等教育理论发展更为丰富和复杂,高等教育评估必然引起人们的思考:高等教育评估是为了促进高校的规范发展还是特色发展?
在高等教育评估实践活动中,对被评高校评估信息的采信,必然对高校的教学、科研、师生等方面的信息进行收集、整理、归类和验证与解释,最后很可能出现的结果是各高校水平或学科都不错,但这却与实际结果相差甚远。甚至一些高校为了得到合格或优秀水平,针对评估机构的既定指标去拼够学校的教育活动,使自己的学校办学失去了应该有的特色。
英国QAA对英格兰的高校共62个学科进行的评估显示,平均分达到了21.6分,评估结果显示学科质量为优秀。最好与最差之间也就是24分,最差的也有20分。62个学科之间几乎没有什么差距。当时,QAA得出的评估结论是:大学的教学质量都很好,[1]高校学科之间差距不大。实际上,高校学科发展有较大差距,一些高校的学科发展很有特色,但按照评估指标得出的结论却与英格兰高校的教学质量现状并不吻合。
除了从学科层面来看,高校的个案评估也能说明问题。英国利兹大学和桑德维尔学院都接受了“通迅与传媒学”学科的评估。利兹大学总得分为20分,属于优秀,但一子项中的得分仅为1分,属于不合格。最终,评估组该校的评估结论为“不合格”。而桑德维尔学院的总得分仅为13分,可是在6个子项中得分分别为5个2分和1个3分,但评估组最终对该学科的评估结论为“合格”。[2]客观地讲,当年利兹大学的“通迅与传媒学”较桑德维尔学院好,而且具有特色,而桑德维尔学院的该学科水平较平庸。但按照评估结果,或许利兹大学为了达到合格只能牺牲自己的特色。
目前,中国的高等教育评估也遇到此类问题。为了改变这一状况,中国采取的是专列出“特色项”,让学校总结自己的特色。但可能出现的问题是,一些高校在评估中为了特色找特色,特色与自己本校的工作核心分割,而不是把自己的特色根植于整个教育活动中。
新西兰将大学与技术院校的评估审定分开进行,避免了评估的“一刀切”。印度在评估过程中把全国所有高等院校分为“大学、自治学院、附属学院”三大类,并赋予它们不同的权重,最后根据姘居累积得分算出评估等级,在一定程度上实现了分类评估。在澳大利亚,AUQA采用以检查目标达成情况为主的审核方法,避免了使用统一的高标准衡量所有大学办学水平,其审核也不是要求所有大学都达到某一个优秀的标准,而是设立一个基本质量框架,鼓励大学在符合基本质量要求的条件下追求多元化特色发展。在美国,州政府只对各院校的最低办学条件有要求,中介机构的评估没有统一的标准。如南部区学校和学院联合会认证标准主要包括四个部分:诚信原则,核心要求,综合标准,政府规定;中北部大学与中学学校协会的标准则是:办学理念和整体性,面向未来,学生学习和有效教学,知识的学习、运用和创新,承诺和服务。而韩国在评估过程中不管学校类型、层次、特色均采用同意的评估基准,遭到了激烈的批评。
评估标准的多样化,是高等教育大众化与多元化的必然要求,因此,建立多样化的评估指标体系,防止出现由评估诱导的高校发展趋同化现象,将是各国高等教育评估中始终关注的问题。
二、评估指标:详尽还是简略?
评估指标的选择是高等教育评估的基础性工作,影响着高等教育评估的过程与质量,更反映出高等教育发展的理念。
评估一所高校,需要根据确定的指标准备相应当资料。仅以学生就业为例,需要准备多届毕业生就业情况的资料,包括了毕业生求职意向、毕业生就业比例、毕业生所学专业与工作岗位相关性、不同部门雇主的反映、毕业生薪酬、毕业生工作业绩等。如果将这些项目与多届毕业生,可能达到几万人的规模联系在一起,高校为了准备评估,其巨大的工作量可想而知。为了使高等教育评估工作客观、准确、有效,而又能减轻评估工作量,在高等教育评估指标的取舍上必须要回答:评估指标的选择是详尽还是简略?
从高等教育评估历史来看,对于评估指标的详尽或简略曾出现过多次反复。如以美国中北部认证协会的认证标准变化为例,早在20世纪初期,NCA只要求院校提交有关院校结构和培养计划的资料。那时的标准仅限于所获得的资料的数量,属于量化性质。例如,NCA在1912年颁布的12条认证标准中,有9条是具体的量化要求。到了2003年,其指标体系便以定性描述为主,各指标并没有定量要求。在收集评估资料中,也主要是以查看教师档案、学生成绩、试卷以及与院校各级人员进行访谈、座谈等方式进行。而当代英国高等教育评估遵循定量评估与定性评估相结合的原则,评估标准中既有定量的描述,也越来越重视定性的表达。譬如大学排行榜中的排名,就是采用精确度较高的量化评估;在院校审核中,主要从院校发布的教学质量报告、院校自述、前6年以来的院校报告等方面收集质量信息,并在其中对定量的信息没有同意的要求。在提交质量证据时,高校越来越重视提供定性资料。但值得注意的是,这主要发生在高等教育评估比较发达的欧美国家,而如印度等国家,在高等教育评估中,却越来越重视对定量指标的运用。印度的国家评估与鉴定委员在评估新方案(2007)中将字母等级转化为更为具体的数值等级,突出对数值的等级测量。此外,还将所评估高校总的测量权重值由100增至1000,提高评估测量的可量化程度,这在一定承担上也增加了评估指标的复杂性。
当代高等教育评估指标的简繁往往与定量和定性评估联系在一起。从当代高等教育评估来看,定量评估在高等教育评估中较定性评估更为重要。这样,高等教育评估指标的多寡取舍已越来越复杂了。如美国对博士研究生教育的评估,它包括“博士点规模、研究生情况、博士点声望、图书馆情况、研究工作情况、论文发表情况”六个方面的指标,而每一个指标体系都需要用定量来说明。其中的“博士点规模”就需要“导师人数、近年内毕业研究生人数、目前博士生在校注册数”三类数据。又如澳大利亚的评估仅核心指标就有二十五个方面:管理与领导、学校远景规划、明确规定的职责、组织氛围、名望、竞争性、运营成果、商业化、资产管理策略、空间管理、IT&T设施、教学计划、课程适应性、学生满意度、毕业生的受雇就业能力、学生管理服务、每个学术成员完成学术研究的成果数、每个学术成员发表的重大研究成果数、研究影响、L&IS:对教学的贡献、L&IS:对研究支持的规定、国际化的文化、均衡的海外国际学生计划、高等教育研究策略、职业培训。 这些指标的设计,需要评估校准备庞大的数据来说明,使得评估工作量剧增。
无论是评估主体,还是被评高校,都希望评估指标简单明了,对被评高校的评估工作不增加较大的负担,更希望通过对关键指标的掌握,从而对被评高校给出结论。愿望往往是美好,而高等教育评估的现实总是复杂大。为了能够全面地掌握被评高校的发展情况,特别是对总多高校进行比较时,往往需要较大量、客观的数据来进行说明,这就必须开启复杂指标体系之门。因此,高等教育评估指标如何在复杂与简单的取舍定问题,需要高等教育评估今后解决。
三、评估的效用:比较还是绩效拨款
高等教育评估具有多种效用,如提高教育质量、增强高校竞争力、办学更有特色、找出差距,或者使没有达标的高校清除高等教育市场等。随着当代高等教育评估的发展,各国对评估目的的认识也不断深化,不仅仅将评估看作是提高教育质量的手段,而更多地考虑到高等教育的综合评估效用。如日本在评估中,通过对大学的定期评价,保证大学正常的教育科研活动质量,促进高校的自我诊断与改进。同时,它还为有关机构或个人的决策提供意见或政策建议,为公众了解高等教育提供有效信息,促使教师增强自身的改革意识等。在美国,高等教育质量评估的目的包括了4方面的内容,即加强政府部门对高等教育的宏观指导和管理,提高高等教育培养质量和办学效益;系统、全面地掌握高等教育信息,发挥社会对高校的监督作用;通过评估,引入竞争机制,实行奖优罚劣,促进和加强高校之间的竞争;使高校了解到社会对高等教育培养人才的要求。而德国,则希望通过评估,完善内部大学自治能力,提高学校的教育质量。另外,促进学生和教师的内部交流,为教育管理部门提供投资依据,面向国家和公众反映高校的办学质量和办学水平,也是德国高等教育评估的重要目的。在英国,评估的目的包括了整顿低质量的教育,激励教育质量的改进和确定资金划拨、奖励优秀等。
当代高等教育评估争论的问题之一:高等教育评估是用来比较还是绩效拨款。前者是根据评估结果,高校对照评估指标,比较学校发展在哪些方面获得了如同,哪些方面还需要改进等。后者则是根据评估结果,政府对不同高校取得的不同成绩予以拨款。由于受到财政经费减少、高等教育规模扩大和绩效管理理念的影响,越来越多的国家参考评估结果对高校进行拨款改革。在美国,调查显示使用绩效拨款的州从1997年的10个州增加到2001年的19个州,而使用绩效预算的州也从16个增加到27个。虽然绩效拨款的数额并不是特别大,大致只占总拨款额度的0.5%到6%,平均约为是2% ,但它却对高等教育评估产生了很大影响。在英国,拨款机构对高校的教学和科研拨款分开拨付,教学拨款主要体现公平性原则,科研拨款则主要根据科研水平以竞争的方式有选择的对学校进行拨款。英国高等教育拨款委员会联合英国拨款机构开展的科研水平评估,为每年大约10亿英镑的科研公共资金的选择性分配提供参考。在德国,州政府可以根据学校的绩效进行拨款,但实施绩效分配资金所产生的经费影响只有2%。日本的做法比较特殊,为了集中力量建设30所国际一流大学,日本将评估结果与财政拨款挂钩,根据评估结果对排名前5%的大学重点投资,希望通过这一手段在较短时间内提高国内顶尖大学的教育质量。
受到高等教育经费不足和拨款减少的影响,以及公共绩效管理理论对高等教育事业发展的要求,高等教育评估结果已成为世界范围内高等教育经费拨款的改革方向之一。按照高等教育发展绩效拨款的思路,更多国家的高等教育和更多的高校发展领域将采用绩效拨款。因此,高等教育评估将会更多的受到关注。但毕竟高等教育评估结果作为高校的绩效拨款合比较是不同的。前者更多的与高校办学经费联系在一起,而后者更多的与高校的地位联系在一起。为此,我们不得不思考,高等教育评估到底是为了比较还是为了绩效拨款,因为它会导致不同的办学思路。
[1] 金顶兵. 英国高等教育评估与质量保障机制:经验与启示[J]. 教育研究,2005,(1):78.
[2] 钟秉林. 世界主要国家高等教育评估发展报告[R]. 2008:66.