2018年6月6日星期三

用线性模型研究非线性过程的试验方法

1.前言

如果回归方程为线性函数,则优化推断很容易形成。因此,线性模型的使用率很高,甚至成为首选。以为撒大网就能捉到大鱼,结果可能捉不到鱼。因为大多数实践课题不是线性的。如果处理不当,会掉入线性陷阱。

使用线性模型是有条件的。除非确有把握,否则,在试验设计时,线性只是一种假设,必须加以检验。如果检验结果,过程不是线性的,必须采取补救措施,修正模型,从而也修正实验设计,重估参数。 非线性过程使用线性模型,其回归系数估计值不是主效应估计,而是多重效应的叠加混杂,离真正的主效应相差太多。推断的优化方向与应该的优化方向有一个很大的夹角,这个夹角依赖于主效应估计与其实际值的差异。因而可能不代表优化方向,甚至背道而驰。

根据数学分析原理,在小范围内,曲面可以用平面来近似,它预报的优化方向与实际优化方向的偏差较小。 这种方法既可以避开研究交互效应,试验数目少,优化速度快,效果好。

2. 方法描述

一项产品的性能 y 受一些变量(因子)x1,x2,...,xp的影响。 我们可以假设它们之间存在一种关系

y=f(x1,x2,...,xp)+e ------(1),
这里 f(X) 是某个函数,e 是误差。 函数 f 是什么形式,实验之前不清楚。我们常常使用 线性的或非线性的这样的数学术语来粗略地表述这种关系。

所谓非线性关系,是指随着 xi 的变化,y 的变化不是直线关系。只有一个变量时是曲线,两个变量时是曲面, 在多变量情况下,画不出图来,称为超曲面。数学表达式多种多样,这里不详述。

所谓线性关系,是指随着 xi 的增加,y 呈直线上升或下降。直线是相对于一个变量而言,两个变量就是平面。 更多的变量,在多维空间中,画不出图来,称为超平面。用数学式表示,

y=f(X)=b0 +b1 x1 + b2x2+ ...+ bpxp+e ------(2),
线性预报函数很容易推断出优化方向。 假定 y 是越大越好,那么,如果第 i 个回归系数 bi>0, 则 xi越大越有利于 y,反则反之。 优化方案很容易形成。

正是非线性过程中响应变量与自变量之间的关系非常复杂,使用回归分析研究这种关系有些困难。 既然是非线性的,一定存在最大值点和最小值点。 一个曲面的最大值最小值在什么位置,事前不清楚,需要用试验来搜索。这就有搜索策略问题。 通常是大范围搜索。所谓撒大网捉大鱼的策略。 理论上,如果鱼存在,一定在大网里。鱼多大?网该织多密?太疏,鱼漏网。太密,则试验数太多,我们不能接受。 例如,5 个因子,每个因子 5 个水平(级别),总共有 55=3125个实验。 这个数目很难被接受。5 水平的密度还不够精密,10水平的试验数是 100,000。10 水平有时也不算精密。 许多工程师选择二水平正交表。用 8 个实验来实施这一捕鱼行动。 每个变量只有两个水平,两个因子相互配合只有四个试验点,拟合结果是一个平面。 就是说,我们已经假定了我们研究的过程是线性的(超平面)。 即,事实上是用一个平面去近似那个曲面。 平面的优化点一定在所研究区域的边界上。而峰点通常在所研究区域的内部。我们推断的优化点指向了相反的方向。 专业试验工作者会采取某些措施来弥补,经验不够时就会茫然失措,失去信心。这样的例子屡见不鲜。

为了形象地解释这一问题,我们举单变量的例子。

图1. 非线性过程示意图

假设 y 只依赖于一个变量,是非线性关系。最大点在什么位置,我们不清楚。 假如用 a,b 两点做试验,得到了直线AB, 这条直线的优化方向指向峰的一侧,那里是“山谷”,越往外推,距离峰越远。

图 2 模拟二变量的情况,曲面 S 代表一个二元过程的本来曲面,它的最大值(优化点)是那条红色竖线,位置在点 O。 四个点拟合得到平面 M。那么,我们推断最大值点在右上方。外延出去越远,离真正的优化点 O 越远。

图2. 平面拟合曲面示意图

假如换一种策略。在一个小的局域中试验,在这个小的局域中,曲线可以用直线来近似,曲面可以用平面来近似。 由它导出的优化方向指向偏差不大。例如,图 1 中选择 c,d 两点,回归直线CD。 外延指向峰顶,经过几步外推会到达峰附近。由图 1 可见,一旦到底峰顶,该因子的效应估计值接近于0, 对参数的扰动很敏感。 图 2 中的小区域 D1,它对应的小片曲面用平面来近似,外延指向峰顶,经过几步外推会到达峰附近。

小局部范围内试验,也只有这样,才能用线性模型研究非线性过程。

方法步骤如下:

  1. 选定一组观察变量, (x1, x2,...,xp), 从本专业知识出发,确定每个变量的变化区间,构成试验范围 D
  2. 在实验范围 D 内确定试验的起点 X0= (x01, x02,...,x0p) , 建议该点在 D 的中部。以 X0 为中心,给每个变量 xi 确定一个小的变化范围。 建议单边 δi 不超过该变量变化范围的10%。
  3. 选一个正交表,安排一组试验。建议采用不规则正交表,据情选用正交超立方或固定水平或混合水平。
  4. 完成试验后,用向后逐步回归分析,估计模型 (2) 的回归系数βi(i=1,2,...,p)(作为bi的估计值)。 得到回归方程
    y^=f(X)=β0 + β1 x1 + β2x2 + ...+ βpxp ------(3),
  5. 推断得到一个优化方案 X1= (x11, x12,...,x1p) 。原则如下:

    如果βi>0, 则 xi 往前进一个距离到 x1i=x0ii ;

    如果βi<0, 则 xi 向后退一个距离到 x1i=x0ii ;

    如果βi=0, 则遵循“价格贵的尝试少用,价格便宜的尝试多用。”的原则 前进一个距离或者后退一个距离。

  6. 用X1作试验点检验推断的优化效果,试验至少重复两次,作统计检验。比较试验结果。 如果效果好,继续推进。直到推断与验证严重不符,意味着已经到达峰点附近,可能跨越了峰顶,停止推进。进入下一步,修改方向,调整精度。
  7. 可以回到第 1 步,调整系统,重复操作;也可以不调整系统,只将试验区域移动到一个新点。 也可以把试验数据合并,回到第四步重估回归系数,重复其后步骤。 直到能够确认每个变量到达其稳定点 附近或者达到了理想的效果,即,回归系数估计值的绝对值都很小时,结束试验。

2. 说明与讨论

  1. δ不能太大,如果太大,可能超出平面近似曲面的允许范围;也不能太小,如果太小,信息差异可能比试验误差还小,被淹没不能被检出。 δi究应该取多大?目前给不出标准。如果因子 xi 很敏感,就应该取小一点;否则可以大一点。 在试验过程中, δi可以调整。
  2. 传统的正交表有局限性,特别是二水平表,试验点密度低,信息存在混杂叠加现象。而多水平表的列数少,试验数多,理论上信息也是混杂叠加的。
  3. 过程中试验点(区域)逐步移动,移向优化点。优化点实际上是一个区域,精度由δi确定。参见图 2.

    图2. 一步一步地移动试验区域

  4. 步骤 5 的所谓前进一个距离或者后退一个距离的“距离”不一定恰好是δ 甚至可以是几个δ.这需要试验者自己判断。
  5. 这种方法类似于梯度法。不同的是,梯度法不要求实验区域是小范围,梯度向量是对目标函数取偏导数的结果,如果目标函数是非线性的,不能只取主效应估计。有些作者采用二水平正交表,而不对交互项取偏导数,梯度向量就必然存在很大的误差。本方法采用线性模型,在小范围内试验,不存在取偏导数的问题。

没有评论:

发表评论