一、实验误差分析的重要性
实验观测值和真值之间存在的差异称为误差。产生误差的原因有测试周围环境的影响,测量所用仪器或工具本身精度的限制,测试方法的不完善以及测试人员观察力和经验等的限制。为了提高实验的精度,缩小实验观测值和真值之间的差值,需要对实验数据误差进行分析和讨论。
随着科学水平的提高和人们经验、技巧和专门知识的丰富,实验中的误差可以逐渐缩小,但做不到使实验没有误差,误差始终存在于实验过程之中。
通过对实验误差进行分析,可以认清误差的来源及影响,使实验人员有可能预先确定导致实验总误差的最大组成因素,并设法排除数据中所包含的无效成分,进一步改进实验方案。实验误差分析也提醒实验人员注意主要误差来源,精心操作,使实验的准确度得以提高。
二、实验数据的有效数字及记数法
在实验过程中,测量结果或计算的量总是表现为数字,而这些数字就代表了欲测量的近似值。究竟对这些近似值应该取多少位数合适呢?对于这一问题,不是说一个数值中小数点后面位数越多就越准确。实验中从测量仪表上所读数值的位数是有限的,这取决于测量仪表的精度,其最后一位数字往往是仪表精度所决定的估计数字。例如某液面计标尺的最小分度为1mm,则读数可以到0.1mm。如在测定时液位高度在刻度524mm与525mm的中间,则应记液面高为524.5mm,其中前三位是直接读出的,是准确的,最后一位是估计的,是欠准的,该数据为4位有效数字。如液位恰在524mm刻度上,该数据应记为524.0mm,若记为524mm,则失去一位(末位)有效数字。由上例可见,当液位高度为524.5mm时,最大误差为±0.5mm。
1.有效数字
实验中得到的数据,除最后一位为可疑或不完全确定的数字外,其余均为确定数字,这样的一组数称为有效数字。这一组数有几位就称几位有效数字。如0.0037只有两位有效数字,而370.0则有四位有效数字。与精度无关的“0”不是有效数字,如0.0037中的0.00;与精度有关的“0”是有效数字,如370.0中最后一个0是有效数字。要注意有效数字不一定都是可靠数字。如测流体阻力所用的U形管压差计,最小刻度是1mm,但实验人员可以读到0.1mm,如342.4mm,此时有效数字为4位,而可靠数字只有三位,最后一位不可靠,称为可疑数字。记录测量数值时只可保留一位可疑数字。
请看下面各数的有效数字的位数。
为了清楚地读出有效数字位数,常用指数的形式表示,即写成一个小数与相应10的整数幂的乘积。这种以10的整数幂来记数的方法称为科学记数法。
如85100:有效数字为4位时,记为8.510×105;
有效数字为3位时,记为8.51×105;
有效数字为2位时,记为8.5×105。
0.00578:有效数字为4位时,记为5.780×10-3;
有效数字为3位时,记为5.78×10-3;
有效数字为2位时,记为5.7×10-3。
2.有效数字的运算法则
(1)记录测量数值时,只保留一位可疑数字。
(2)当有效数字的位数确定后,其余数字应一律舍弃。舍弃办法是四舍六入,即末位有效数字后边第一位小于5,则舍弃不计;大于5则在前一位数上增1;等于5时,前一位为奇数,则进1为偶数,前一位为偶数,则舍弃不计。这种舍入原则可简述为:“小则舍,大则入,正好等于奇变偶”。
如保留4位有效数字时,5.71729→5.717;6.14285→6.143;8.62356→8.624;4.37656→4.376。
(3)在加减计算中,小数点后的位数以最小的数为准计算(按误差最大的为准计算)。例如将24.65,0.0082,1.632三个数字相加时,应写为24.65+0.01+1.63=26.29。
(4)在乘除运算中,以相对误差最大的项为准(结果的相对误差与各项中最大相对误差相同)。如0.0121×25.64×1.05782中,0.0121的相对误差为1/121=0.8%,25.64的相对误差为1/2564=0.04%,1.05782的相对误差为1/105782=0.00009%。相对误差最大的项为0.0121,计算结果的精度应当与之一致,上式相当于0.0121×25.6×1.06=0.328。
(5)在对数计算中,所取对数尾数的位数与真数的有效数字的位数相同。如lg317.2=2.5013,ln(7-.1×1028)=66.4-3,lg44.9=1.652。
(6)在乘方、开方运算中,原近似值有几位有效数字,计算结果就保留几位有效数字。
三、平均值
真值是待测物理量客观存在的确定值,通常真值是无法测得的。虽然真值是一个理想的概念,但在实验中,若对某一物理量经过无限多次的测量,根据误差的分布定律,正负误差出现的概率相等。再经过细致地消除系统误差,对测量值求平均,可以获得非常接近于真值的数值。由于实际上实验测量的次数总是有限的,由此得出的平均值只能近似于真值。实验中常用的平均值有下列几种。
1.算术平均值
算术平均值是最常见的一种平均值。
设x1,x2,…,xn为各次测量值,n代表测量次数,则测量值的算术平均值为
2.几何平均值
几何平均值是将一组n个测量值连乘并开n次方求得的平均值。即
3.均方根平均值
4.对数平均值
在化学反应、热量和质量传递中,数据的分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值。
设两个量x1,x2,其对数平均值为
应指出,变量的对数平均值总小于算术平均值。当x1/x2≤2时,可以用算术平均值代替对数平均值。
当x1/x2=2时,, , ,即当x1/x2≤2时,引起的误差不超过4.2%。
以上介绍各类平均值的目的是实验时需要从一组测量值中找出最接近真值的那个值。由此可知,平均值的选择主要取决于一组测量值分布的类型。在化工实验和科学研究中,数据的分布多属于正态分布,故多采用算术平均值。
四、误差的表示方法
利用任何量具或仪器进行测量时,总存在误差,测量结果总不可能准确地等于被测量的真值,而只是它的近似值。测量的质量高低以测量精确度为指标,根据测量误差的大小来估计测量的精确度。测量结果的误差越小,则可认为测量就越精确。
1.绝对误差
测量值与真值之差的绝对值称为测量值的误差,即绝对误差,记为
式中d为绝对误差,X为测量值,A0为真值。由于真值A0一般无法求得,因而上式只有理论意义。在实际工作中常以最佳值(常用高一级标准仪器的示值)A代替真值A0。
化工原理实验中最常用的是U形管压差计、转子流量计、秒表、量筒等仪表,原则上均取这些仪器的最小刻度值为最大误差,取这些仪器的最小刻度值的一半作为绝对误差计算值。
2.相对误差
绝对误差与真值的之比称为相对误差,记为
式中真值A0一般为未知,常用测定值A代替。
绝对误差的因次与被测物理量的因次相同,相对误差则无因次,不同物理量的相对误差可以互相比较,因此评定测量结果的精密程度以相对误差更为合理。
3.算术平均误差
算术平均误差是各个测量点的误差的平均值,其定义式为
式中:di——第i次测量值的误差;
δ平——测量结果的算术平均误差;
n——测量次数。
算术平均误差可以说明测量结果的好坏。
4.标准误差
标准误差亦称为均方根误差,当测定次数为无穷时,其定义式为
在有限次测定中,标准误差用下式表示:
标准误差不是一个具体的误差,它的大小只说明在一定条件下等精度测量集合所属的每一个观测值与其算术平均值的分散程度,它不仅与一组测定值中的每个数据有关,而且对其中较大误差或较小误差的敏感性很强。实验越精确,σ越小。
例:压力的5次测量结果(单位为Pa)为98294,98306,98298,98301,98291,则算术平均值为
算术平均误差为
标准误差为
五、误差的分类
根据误差的性质和产生的原因,误差一般分为三类。
1.系统误差
系统误差又称可测误差,是由某种确定因素造成的,它对测定结果的影响比较固定,在同一条件下重复测定时,它会重复出现。
根据产生的原因系统误差分为方法误差、仪器或试剂误差和操作误差。
方法误差是由于不适当的实验设计或所选的实验方法不恰当造成的。如重量分析中,沉淀的溶解会使分析结果偏低,而沉淀吸附杂质,又会使结果偏高。
仪器或试剂误差是由于仪器零件制造不标准、安装不正确、仪器未经校准或试剂不合格的原因造成的。如称重时,天平砝码不够准确;配标准溶液时,容量瓶刻度不准确;对试剂而言,杂质与水的纯度也会造成误差。
操作误差是由于分析操作不规范造成的,如标准物未干燥完全就进行称量。
针对仪器的缺点、外界条件变化影响的大小、个人的偏向,分别进行校正后,系统误差是可以消除的。
2.随机误差
随机误差也称为偶然误差,由很多无法估计的、各种各样的随机原因造成。
随机误差与系统误差不同,其误差的数值和符号不确定,不能从实验中消除。但是在足够多次的等精度测量后,就会发现随机误差的大小或正负的出现完全由概率决定,服从统计规律。因此,随着测量次数的增加,随机误差的算术平均值趋近于零,多次测量后结果的算数平均值将更接近于真值。
3.过失误差
过失误差是一种观测结果与事实不符的误差,它是由于实验人员粗心大意如读数错误、记录错误或操作失误等原因引起的。此类误差无规则可循,如果确定是过失引起的,其测定结果必须舍去,并重新测定。其实只要实验人员加强责任心,严格按照规程操作,过失误差是完全可以避免的。
六、精密度和准确度
1.精密度
平行测量的各测量值之间互相接近的程度称为精密度,用偏差(测定值与平均值之差)来表示。各次测定结果与平均值的差别越小,测定结果的精密度越高。它反映随机误差对实验结果的影响程度,精密度高就表示随机误差小。
2.准确度
测量值与真值的复合程度称为准确度,一般用绝对误差或相对误差来表示。它反映系统误差对实验结果的影响程度,准确度高就表示系统误差小。
例如甲、乙、丙、丁四个人同时用碘量法测定某铜矿中CuO的含量(真实含量为37.40%),每人测定了4次,其结果如图2-1所示。分析此结果精密度与准确度的关系。
图2-1 精密度与准确度的关系
由图2-1可知,甲所得结果的准确度和精密度都好,结果可靠;乙的结果精密度高,但准确度较低;丙的精密度和准确度都很差;丁的分析结果相差较远,精密度太差,其平均值虽然也接近真值,但这是由于正负误差相互抵消所致,如果只取2次或3次测量值计算平均数,结果会与真实值相差很大,因此这个结果是凑巧的,不可靠。
综上所述,可得到如下结论。
(1)精密度是保证准确度的先决条件,精密度差,所得结果不可靠,就失去衡量准确度的前提。
(2)精密度高不一定能保证有高的准确度。
(3)准确度高一定伴随着高的精密度。
七、重复性和再现性
1.重复性
一个实验人员,在一个指定的实验室中,用同一套给定的实验仪器,对同样的某物理量进行反复测量,所得测量值接近的程度。
2.再现性
由不同实验室的不同实验人员和仪器,共同对同样的某物理量进行反复测量,所得测量值接近的程度。
八、误差的基本性质
在化工原理实验中通常通过直接测量或间接测量得到实验数据,为了考察这些实验数据的可靠程度并提高其可靠性,必须研究在给定条件下误差的基本性质和变化规律。
1.误差的正态分布
测量数列中消除了系统误差和过失误差后,多次重复测定仍然会有所不同,具有分散的特性。从大量的实验中发现随机误差的大小有如下特征。
(1)单峰性:绝对值小的误差比绝对值大的误差出现的机会多,即误差的概率与误差的大小有关。当误差等于零时,y值最大,呈现一个峰值,故称为单峰性。
(2)对称性:绝对值相等的正误差或负误差出现的次数相当,即误差的概率相同,故称为对称性。
(3)有界性:极大的正误差或负误差出现的概率都非常小,即大的误差一般不会出现,故称为有界性。
图2-2 误差的概率分布图
(4)低偿性:随着测量次数的增加,随机误差的算术平均值趋近于零,故称低偿性。
根据上述的误差特征,绘制随机误差出现的概率分布图(如图2-2所示)。图中横坐标x表示随机误差,纵坐标y表示误差出现的概率,图中曲线称为误差分布曲线,以y=f(x)表示。其数学表达式由高斯提出,具体形式为
或
式中:σ——标准误差;
h——精确度指数。
上式称为高斯误差分布定律,亦称为误差方程。
若误差按上述函数关系分布,则称为正态分布。σ越小,分布曲线的峰越高且越窄;σ越大,分布曲线越平坦且越宽,如图2-3所示。由此可知,σ越小,小误差占的比重越大,测量精密度越高。反之则大误差占的比重越大,测量精密度越低。
图2-3 不同σ的误差分布曲线
2.可疑观测值的舍弃
由概率积分知,随机误差正态分布曲线下的全部积分,相当于全部误差同时出现的概率,即
若将误差x以标准误差σ的倍数表示,即x=tσ,则数据在±tσ范围内出现的概率为2Φ(t),超出这个范围的概率为1-2Φ(t)。Φ(t)称为概率函数,表示为
图2-4 误差分布曲线的积分
2Φ(t)与t的对应值在数学手册或专著中均附有此类积分表,读者需要时可自行查取。在使用积分表时,需已知t。图2-4给出几个典型及其相应的超出或不超出|x|的概率。
由图2-4可知,在符合正态分布的情况下,总体平均值为原点(即消除系统误差),总体标准偏差为σ,由统计学可知,测得的结果落在|x|=σ范围内的概率为68.3%;落在|x|=2σ范围内的概率为95.5%;落在|x|=3σ范围内的概率为99.7%;测定结果超出|x|=3σ的概率只有0.3%。
换句话说,在1000次测定中,测定结果落在|x|=σ范围内683次;落在|x|=2σ范围内955次;落在|x|=3σ范围内997次;落在|x|=3σ范围之外的结果只有3次。所以,通常认为大于3σ的误差已不属于偶然误差了,这样的实验结果应该舍去。这种判断可疑实验数据的原则称为3σ准则。
九、函数误差
上述讨论的主要是直接测量的误差计算问题,但在许多场合下,常涉及间接测量的变量,所谓间接测量是通过直接测量的量建立一定的函数关系,并根据函数关系确定被测定的量,如传热问题中的传热速率。因此,间接测量值就是直接测量得到的各个测量值的函数,其测量误差是各个直接测量值误差的函数。
1.函数误差的一般形式
在间接测量中,一般为多元函数,而多元函数可用下式表示:
式中:y——间接测量值;
xi——直接测量值。
由泰勒级数展开得
或
它的最大绝对误差为
式中:——误差传递系数;
Δxi——直接测量值的误差;
Δy——间接测量值的最大绝对误差。
函数的相对误差δ为
2.函数误差的计算
(1)函数y=x±z的绝对误差和相对误差
由于误差传递系数-, ,则函数y=x±z的最大绝对误差
相对误差
(2)常用函数的最大绝对误差和相对误差
现将某些常用函数的最大绝对误差和相对误差列于表2-1中[1]。
表2-1 某些函数的误差传递公式