四、教育实验研究设计的效度与变量控制(1 / 1)

1.教育实验研究效度

所谓效度,是指实验的有效性,即实验是否有效地测量到了目标,包括内在效度和外部效度。教育实验研究效度标示着教育实验研究结论的准确性和普遍性程度。自从坎贝尔和斯坦利1966年起用内在效度和外在效度概念以来,各国学者皆沿用此两种效度来讨论实验研究结果的正确性。在教育科学研究中,常有一些无关变量与实验变量相混淆,影响实验的结果,就会影响实验设计的效度。下面说说哪些因素会影响实验的内在效度和外部效度。

(1)教育实验研究的内在效度。内在效度是指自变量与因变量的因果联系的真实程度,即因变量的变化,确实由自变量引起,是操作自变量的直接成果,而非其他未加控制的因素所致。内在效度表明的是因变量Y的变化在多大程度上取决于自变量X——有效性。没有内在效度的实验研究是没有价值的,因为内在效度决定了实验结果的解释。内部效度指研究结果能被明确解释的程度,即实验者所操纵的实验处理(自变量)对因变量所造成的影响的真正程度。内在效度高低,取决于对无关变量控制的程度,控制越好,实验结果越能解释为由实验处理所造成。反之,如果对无关因素控制不充分,使得无关因素与实验处理(自变量)混淆在一起,就难以确定实验结果是由于实验处理引发的,还是由其他无关因素所导致的。一般来说,下面的这些因素常会与自变量相混淆,影响实验的内部效度。

特定事件的影响 在实验过程中,与自变量同时发生的一些特定事件会对实验结果产生影响,使得研究者无法判断实验结果是由自变量引起的,还是由特定事件引出的。例如,研究者想试验一种探究式教学法的效果,先对一个班的学生进行了学科测验,获取了他们的现有水平,然后经过一个学期的探究式教学后,再使用等值的测验题目测量了学生的学科成绩。结果发现,后一测验分数显著高于前一测验的分数,因此,研究者就下了这样的结论:探究式教学方法是较好的方法。这个结论正确吗?答案是可能不正确。因为在实验期间,一些影响因变量(即学科成绩)的事件可能和实验处理同时发生作用,从而混淆了实验结果。例如,学校在实验期间组织了一些课外的科学探究活动,引发学生对探究活动本身的兴趣,学生的兴趣就会和自变量混淆。一般来说,实验时间越长,实验处理以外的其他事件的影响的可能性就越大。

身心自然发展的影响 研究对象在实验期间,不论生理或心理都会产生变化,如变得更成熟、健壮,或者变得疲劳、饥饿、分心或没有兴趣等,对象的身心变化都会影响实验结果,因此很难确定实验结果是由实验处理引发的,还是身心自然发展引发的。前面提到的探究式教学法实验的例子中,学生可能是因为年龄增长而在认识能力上有了提高和发展,从而提高了学科成绩,这样学生的身心发展就会干扰实验处理的效果,学科成绩的提高难以单纯归因于新的探究式教学方法上。

研究对象的选择 在实验过程中,如果没有采用随机化的方法选择和分配研究对象,会在实验处理前就造成各组的研究对象的不相等。在实验处理之前,各组的对象就存在差别,那么实验结果的差异就不能说是单纯由实验处理造成的。所以,在采用两组或多组的实验研究中,研究者必须考虑不同组别的研究对象在各项因素上是否一致。

前测验的影响 在许多研究中,研究者为了取得实验前研究对象的初始水平,常对对象实施一个前测验,但是研究对象在经过前测验后,会获得有关测验的技巧和内容等经验,从而有助于后测分数的提高,尤其是前测和后测的题目基本相同时。所以,后测分数的提高也可能是前测验导致的。

统计回归 统计回归现象指研究对象在进行第二次测量时,其成绩有向团体平均数趋近的倾向,即选择高分组的对象在第二次测量时,其分数由于向平均数趋近而有降低的趋势,但是低分组的对象,其分数却有升高的趋势。在有前测和后测的实验中,若以极端分数(如高分组和低分组)的学生为对象,容易出现统计回归现象。

仪器的使用 在实验过程中,使用测量工具(如试卷、仪器等)不当、测验材料出现问题、研究者的身心发生变化(如评卷者在评价后测验成绩时,会变得比前测时更疲劳等)等因素都会影响实验结果。如上述探究式教学法的实验中,如果前测的学科测验试题比后测的试题容易,则成绩的提高有可能是测量工具不同引起的结果,而非实验处理的效果。另外,同一个研究者前测验和后测验的评价,可能会发生改变,从而导致实验效果受到影响。

选择和成熟的交互作用及其他 在实验设计中,如果研究者缺乏对变量的精确控制,上述诸因素常会产生交互作用的效果,这一效果与实验处理的效果相混淆,使研究者无法确定实验结果的来源,而误认为所产生的效果就是实验处理的作用。在诸因素的交互作用中,研究对象的选择因素与身心自然发展因素之间的交互作用是最常出现的。

(2)教育实验研究的外在效度。外在效度涉及教育实验研究结果的概括化、一般化和应用范围问题,表明实验结果的可推广程度,研究结果是否能被正确地应用到其他非实验情境、其他变量条件及其他时间、地点、总体中的程度。外在效度分总体效度和生态效度两类。总体效度,指实验结果从特定的研究样本推广到更大的被试群体中去的适用范围,从严格意义上讲,研究结果只能推广到抽样样本的那部分总体,即实验可接受的总体中去。生态效度,指实验结果从研究者创设的实验情境推广到其他教育情境中去的范围。贝尔和斯坦利认为,对外在效度的威胁主要有以下四个主要因素:测验的交互作用、抽样偏差和实验处理的交互作用、实验安排的副效应、多重处理干扰。内在效度是外在效度的必要条件,但内在效度的研究结果不一定具有很高的外在效度,而且内、外在效度有时会互相影响。影响外部效度的因素主要包括以下方面。

前测验的反作用效果 在采用有前测和后测的实验设计时,前测验的作用有可能增加或降低实验结果。在这种情况下,用这类有前测的实验设计所得到的结果,就不能直接推论到无前测的实验中去。

研究对象的选择偏差与实验处理的共同作用 实验中,如果研究者所选择的研究对象都具有某种特征,而这种特征与实验处理发生相互作用,就会对实验结果产生积极或消极的影响。这种具有样本选择偏差的实验在其结果的推广范围上可能会受到限制。例如,如果选择一些高智力的学生,进行探索式教学和传统教学法的比较实验,结果发现探索式教学法的效果优于传统教学法。但是,由于参与实验的学生具有高智力特征,因此实验结果不能推论到其他一般学生中去。

实验安排的反作用效果 在某些实验中,研究对象知道自己正在参加实验,他(她)可能为投实验者所好,而改变正常的行为方式,努力表现实验者所期望的行为,以获得实验者的欢悦。由此可见,这种实验结果可能和自然情境下的结果大不相同,因此,也就不能适用于一般性的日常生活情境中。

重复实验处理的干扰 当同样的受试者重复接受两种以上的实验处理时,几项实验处理之间会产生干扰作用。因此,这种实验的结果无法应用于只有一种实验处理的情况。例如,让同样的一组学生分别接受了探究式教学法、发现式教学法、传统教学法后,如果发现探究式教学法的效果最好,研究者也不能将这种结果推论到仅仅接受探究式教学法一种方法的实验情境中,因为实验中的探究式教学法之所以取得良好效果,很有可能是和其他两种方法共同作用的结果。

总之,研究者在选择实验设计时,要对实验情境进行必要的控制,以提高实验的内部效度和外部效度。实验的内在效度越高,其实验结果越能确认是由实验处理所造成的;而实验的外在效度越高,其结果的推论范围就越大。但是在实验情境中,要同时兼顾这两种效度很难做到,一般而言,基础研究比较重视内在效度,而应用研究则比较重视外在效度。

2.教育实验的变量控制

(1)教育实验变量控制的内涵。教育实验变量控制即无关变量的控制,是指控制那些在教育实验中应保持恒定的变量。教育实验中,为了探索因果关系,证实确实是自变量X导致了因变量Y的变化,就必须排除外来的无关变量的干扰,保证各方面变量平等,才能保证实验结果是可靠的。

(2)教育实验变量控制的主要方法。教育实验中无关变量很多,要对其进行有效的控制,实验者必须有针对性地选择合理的方法。教育实验中控制无关变量的主要方法有以下几种。

随机选择和分配被试。消除被试个体之间的差异,因而采用随机方法来选择和分配被试能有效地控制被试间的各种差异。

设置控制组。在实验中设置一个或多个控制组,对两个组同时进行因变量的观测(包括前侧和后侧),能较好地排除或恒定成熟对实验中因变量的作用。

采用“双盲法”。所谓双盲法,即研究者在实验中既不让实验的主试也不让被试了解实验的真实目的和意图,这可在一定程度上控制主试的态度、被试间自变量的扩散等方面的无关变量。

使无关变量保持恒定。对这些难以完全消除的无关变量,研究者可以设法将其恒定,即在实验的各个组别、各个阶段使其保持不变。

提高实验设计的科学性。在设计中根据对无关变量控制的需要来设计操作自变量的具体方法、设计实验程序、进行时间分配,这能较好地进行无关变量的控制。

控制资料统计过程。研究者按照实验目的选择合适的统计方法,并规范程序统计和结果处理,能减少统计误差,提高研究结论的准确性。

3.提高教育实验效度的主要措施

(1)使用设计组加以平衡。一个实验涉及两个组(实验组与控制组)或几个组,使得各个组的平均数及变异量尽可能接近相等。

(2)随机、匹配或实验组兼作控制组。随机指被试的纯粹的机遇选择,随机取样,随机分组,随机指派实验处理。随机形成小组的教育实验研究的一个重要特点是,可以提高实验研究结果的外在效度。

匹配也叫配对法,在比较两种处理效应时,为了严格控制两组被试间的个别差异对实验变量的影响,使被试在研究的重要变量上相互对应,保持基本相同,从而使每对被试间的差异保持平衡,然后随机地接受不同处理。

实验组兼作控制组指被试作为同一组去接受不同的实验处理,一次一个处理。

(3)设计控制和统计控制。设计控制是通过组内设计分配(自变量的顺序)、效果平衡(采用实验组与控制组随机取样、随机分组,使无关变量平衡)以及拉丁方法,使被试变量在实验中产生的影响通过设计抵消。

统计处理控制是用协方差分析,将实验组与控制组的数个变量测量出来,使用统计的方法,把它们的最初差异予以排除。教育实验的效度具有不同等级,不同层次,是一个由低到高的取值范围,不可能人为地确定一个合适任何目的的条件、类型的效度指标,应采取动态平衡而非静态选择的策略,根据教育实验的目的,综合考虑内外效度的平衡,以取得比较满意的解释力和推广力。

【实验研究设计案例】

我国学者卢仲衡等(1981)的研究项目:“初中一年级数学自学辅导教学协作实验研究。”研究者选择该项研究的目的是:对数学自学辅导教学与传统教学的学习效果进行比较,探索学生有效进行数学学习的教学方案。研究者随机选择了北京市的若干所中学,并将从小学升入中学的学生随机分为两班,随机选择其中一个班为实验组;另一个班为控制组。实验班采用数学自学辅导教学方式,实验材料为自学辅导教材,内容为初一代数;控制组采用传统课堂教学方式,学习材料为统编教材,实验班与控制班教学内容相同,实验时间为一个学期。表6-1表示两班学生在学习初一年级各个教学内容后进行测验的后测成绩,及进行平均数差数检验(t检验)的结果。

表6-1 某中学实验组和控制组平均成绩比较表

由表6-1可以看出,通过初一前半年的学习,实验班在两次单元测验(有理数测验和一元一次方程测验)和期末全区统一考试的学习成绩显著高于控制班;在第二章“整式的加减”测验上,尽管没有达到统计上的显著水平,但实验班的成绩高出控制班5.96分。综合此项实验的其他成果,可以得到结论:数学自学辅导的教学方式优于传统课堂教学方式。