实验数据处理是整个实验过程的重要环节。实验数据处理的目的是把以数据形式表达的实验结果,去伪存真、去粗取精后,转换成各变量之间的定量关系,以便进一步分析实验现象,得出规律,指导研究、开发、设计与生产。
实验数据处理通常有三种方法,即列表法、图示法、数学模型法。
下面将简要介绍上述三种方法。
一、列表法
将实验数据按自变量与因变量的对应关系列出数据表格形式即为列表法。列表法具有制表容易、简单、紧凑、数据便于比较的优点,是绘制曲线和将数据整理成为数学模型的基础。
实验数据表可分为实验数据记录表(原始数据记录表)和实验数据整理表两类。实验数据记录表应在实验前根据实验内容设计好,实验时记录待测实验数据,流体阻力测定实验的实验数据记录表的形式见表2-2。
表2-2 流体阻力测定实验数据记录表
实验数据整理表是由实验数据经计算整理间接得出的表格形式,表达主要变量之间关系和实验的结论,见表2-3。
表2-3 流体阻力测定实验中间运算表
实验最终结果表简明扼要,只用于表达主要变量之间的关系和实验结论。例如,流体流动阻力实验中摩擦系数和局部阻力系数与雷诺数之间的关系见表2-4。
表2-4 流体阻力测定实验最终处理结果表
根据实验内容设计拟定表格时应注意以下问题:
(1)表格设计要力求简明扼要,一目了然,便于阅读和使用。记录、计算项目应满足实验要求。
(2)表头应列出变量名称、符号、因次。同时要层次清楚、顺序合理,因次不宜混杂在数字之中,造成分辨不清。
(3)表中的数据必须反映仪表的精度,应注意有效数字的位数。
(4)数字较大或较小时应采用科学记数法,例如Re=46000可采用科学记数法记做Re=4.6×104,在名称栏中记为Re×104,数据表中可记为4.6。
(5)数据整理时尽可能采用常数归纳法。例如计算固定管路中不同流速下的雷诺数时,利用公式Re=duρ/μ,其中d,μ,ρ为定值,该公式可归纳为Re=Au,将常数A=dρ/μ (转化因子)乘以各不同的流速u,即可得到一系列相应的Re,减少了重复计算。
(6)在数据整理表格下面,最好附有采用某一组数据进行计算的示例,表明各项之间的关系,以便阅读或进行校核。
(7)为便于排版和引用,每一个实验数据表应在表的上方写明表号和表题。表格应按出现的顺序编号,表格的出现应在文中说明,同一个表格一般不跨页。
(8)实验数据表格要正规,数据一定要书写清楚整齐。修改时宜用单线把错误的划掉,将正确的写在上面或下面。
(9)各种实验条件及实验记录者的姓名可作为表注写在表的下方或上方。
二、图示法
列表法一般不易观察实验数据的规律性,为了便于比较和简明直观地显示结果的规律性或变化趋势,常常需要将实验结果用图形表示出来。
图示法是将离散的实验数据在坐标纸上绘成直线或曲线,直观而清晰地表示出各变量之间的相互关系,分析极值点、转折点、变化率及其他特性,便于比较,还可以根据曲线得出相应的数学模型。某些精确的图形还可用于在未知数学表达式的情况下进行图解积分和微分,求函数的外推值等。
如何选择适当的坐标系和合理地确定坐标分度是应用图示法时常遇到的问题。
1.坐标系的选择
化工原理实验中常用的坐标系有直角坐标系、对数坐标系和半对数坐标系。实验人员应根据变量间的函数关系选择合适的坐标系,尽量使实验数据的函数关系接近直线,以便于拟合处理。
(1)直线关系
变量之间的关系为y=a+bx时,选用直角坐标系,如图2-5所示。
图2-5 直角坐标系
图2-6 对数坐标系
(2)幂函数关系
变量之间的关系为y=axb时,选用对数坐标系,如图2-6所示。幂函数在直角坐标系上标绘是一条曲线,采用对数坐标系绘制可使之线性化。将上述幂函数等式两边取对数,则
令lgy=Y,lgx=X,lga=B,则上式可变换为Y=bX+B,即为线性方程。
(3)指数函数关系
变量之间的关系为y=aebx时,选用半对数坐标系,如图2-7所示。将上式等号两边取自然对数,则lny=lna+bx,所以lny与x呈直线关系。
下列情况下也可考虑用半对数坐标。
①变量之一在所研究的范围内发生几个数量级的变化。
②自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引起因变量极大变化时,此时应采用半对数坐标系,曲线最大变化范围可伸长,使图形轮廓清楚。
图2-7 半对数坐标系
还有双曲线函数、S形曲线函数等线性化方法,见有关教科书和文献。
2.坐标的分度
坐标的分度指每条坐标轴所代表物理量的大小,即选择适当的比例尺。若选择不合理,则根据同组实验结果作出的图形就会失真而导致错误的结论。
坐标分度的确定方法叙述如下。
(1)在已知量x和y的误差Δx与Δy的情况下,比例尺的取法应使实验“点”的边长为2Δx,2Δy,并且使2Δx=2Δy=1~2mm,构成近似的正方形。
(2)如果测量的实验数据的误差不知道,则坐标轴的分度应与实验数据的有效数字相对应,换句话说,图示曲线坐标读数的有效数字位数与实验数据的位数相同。
3.其他注意事项
(1)按惯用法取横轴为自变量,纵轴为因变量,并标明各轴代表的变量名称、符号和因次。如离心泵特性曲线的横轴应标上“Q/(m3/h)”。
(2)坐标原点的选择。直角坐标的原点不一定从零开始,应视实验数据的范围而定;对数坐标的原点只能取对数坐标轴上规定的值做原点,而不能任意确定。
(3)绘制的图形应匀称居中,避免偏于一侧而不美观。
(4)若要在同一张图上同时绘制几组实验数据,则各实验点要用不同符号(如○、×、△等)加以区别,且应在图上注明。
(5)为了便于排版和引用,图应有图号和图名,必要时还应有图注。
三、数学模型法
在化工原理实验数据处理中,除用列表法和图示法描述过程变量之间的关系外,常使用数学模型法。数学模型法又称为公式法或函数法。数学模型可以是经验的,可以是半经验的,也可以是理论的。使用数学模型法时,应首先根据实验结果选择合适的数学模型,然后对数学模型中的参数进行估值并确定该估值的可靠程度。
1.数学模型
数学模型可分为经验模型和理论模型。
化工中常用的经验模型有:多项式、幂函数和指数函数。流体的物理性质如热容、密度和汽化热等与温度的关系,常用多项式回归分析;动量、热量和质量传递过程中的无因次数群之间的关系,多用幂函数回归分析;而化学反应、吸附、离子交换以及其他非稳态过程,常用指数函数回归分析。
理论模型又称为机理模型。理论模型的方法是建立在对过程本质的深刻理解基础上的。首先将复杂过程分解为多个较简单的子过程;然后根据研究的目的进行合理的简化,得出物理模型;接着应用物理基本规律和过程本身的特征方程对物理模型进行数学描述,得到数学方程;再对数学模型进行解析解或数值解,得到设计计算方程;最后通过实验确定上述方程中含有的模型参数。
2.参数估值
数学模型选定之后,需要对其中的参数进行估值。对于线性数学模型,待求参数可用最小二乘法求得。对于非线性数学模型,通常通过线性化处理而化为线性数学模型,然后用线性最小二乘法求出新的参数,从而再还原为原参数。在处理经验数学模型时,这种方法简便易行,具有一定的使用价值。
下面重点介绍线性最小二乘法。
最小二乘法的原理是在有限次测量中最佳结果应使标准误差最小,即残差的平方和最小。其数学表达式推导如下。
已知n个实验数据点(x1,y1),(x2,y2),…,(xn,yn)。
设最佳线性函数关系式为y′=a+bx,则根据此式n组x的值可计算出各组对应的y′的值。
由于测定值各有偏差,若定义第i组数据的残差
按照最小二乘法的原理,测量值与真值之间的偏差平方和为最小,即
应最小。使Δ为最小的必要条件为
联立解得a和b。
由此求得的截距为a,斜率为b的直线方程,就是关联各实验点最佳的直线。
例:实验测得(x,y)的8组数据如下。假设x,y之间为线性关系,即y=a+bx,试确定其常数a和b。
(1,3.0),(3,4.0),(8,6.0),(10,7.0),(13,8.0),(15,9.0),(17,10.0),(20,11.0)
解:
联立求解上述两个方程式,得
3.回归方程的检验
用最小二乘法求得回归直线方程后,还存在检验回归直线方程有无意义的问题。可用相关系数r来判断两个变量之间的线性相关的程度。
式中:
在概率论中可以证明,任意两个随机变量的相关系数的绝对值不大于1,即
|r|≤1或0≤|r|≤1
r的物理意义是表示两个随机变量x和y的线性相关的程度,现分几种情况加以说明。
当r=±1时,即n组实验值(xi,yi)全部落在直线y′=a+bx上,此时称为完全相关。
当|r|越接近1时,即n组实验值(xi,yi)越靠近直线y′=a+bx,变量y与x之间的关系越接近于线性关系。
当r=0,变量之间就完全没有线性关系了。但是应该指出,当r很小时,变量y与x之间的关系不是线性关系,但不等于就不存在其他关系。