2018年6月5日星期二

交互作用及其存在性辨析

综 述

在工艺优化过程中,因子的特性与对应变量的贡献的宏观机制起着重要的作用。 工业过程工艺优化的根本是找到因子的恰当参数设计,即最好的变化区间。 这与因子的特性与机制有关。在工业试验中,完全搞清因子的作用机理是几乎不可能的,也没有必要。 而了解其宏观机制是必要的。掌握了宏观机制,找到了优化的关键,问题就基本上解决了,是什么机理,可以让科学理论家们去解决。
Menu
析因模型 交互效应辨析 大系统分解

1. 析因模型

p 个试验因子 x1,x2,...,xp ,可以作成以下一些因子组合:
单因子项:x1,x2,...,xp,共有 C1p项;
二元组合: xixj (i≠j; i,j=1,2,...,p),共有 C2p 项;
三元组合: xixjxk (i≠j≠k; i,j,k=1,2,...,p), 共有 C3p 项;
r 元组合: xn1xn2... xn(r-1)xnr, 其中ub>,...,n(r-1),nr) 为 (1,2,...,p) 中任 r (r=1,2,...,p) 个数字的组合,有 Crp 项。
Cip 都是二项式系数,与二项式系数相比,差一项 Cp0 。 系统包含一个常数项, 补充这个项后,组合总数为
T=∑pi=0 Cip=2p------()
用所有这些因子组合,可以组成一个函数
f(x1,x2,...,xp,b0,b1,...,bT) =b0+b1x1+b2x2+...+bpxp
+b1,2x1x2+b1,3x1x3+...+b1,px1xp
+b2,3x2x3+b2,4x2x4+...+b2,px2xp
+...+bp-1,pxp-1xp
+b1,2,3 x1x2x3+b1,2,4x1x2x4
+...+bp-2,p-1,pxp-2xp-1xp
+...+b1,2,3,...,px1x2...xp

它是一个包含 2p-1 个项有 2p 个待定参数的方程,称为全析因模型。 对应地,如果放弃某些项得到的就是部分析因模型。 一个因子对响应变量的贡献,通常称为因子的效应。 它的贡献可以分解为若干部分。一部分是它独立做出的贡献,称为一个因子的主效应。 它与其它因素共同发生作用,或互补,或互克,体现出各个因子之间的相互影响相互依存的关系,称为交互作用。 一个因子的作用,依条件不同而效应值不同。两个因子的交互作用是一个因子,所具有的效应称为该两个因子的交互效应。 在回归方程中,因子的作用由回归系数来描写。一个因子变化一个单位, 所引起响应变量值发生的变化,为该因子的总效应。在多项式中,如果一个项只包含一个试验变量, 则该项的系数所表达的就是该因子独立做出的贡献,即主效应。 如果一个项的组成包含多个不同变量的积,当这两个因子都发生一个单位量的改变时, 这个项对应变量的贡献也是它的系数。这个系数值描写了这些变量的交互作用。 这样,用多项式描写过程能够分解效应(析因)。所以,常常用多项式做回归模型。 在某些实验中,因子常常是不连续,甚至是非数字的定性因子,因子以水平方式变化,对效应的解释有些不同, “所谓主效应,是指同一因素各水平之间的差异;交互作用是指一个因素的效应因另一因素的水平的改变而起的变化。” (参见《中国大百科全书》数学卷,析因设计词条。)这一术语是习惯的,在不同研究中对效应的解释会有所不同。
在多项式中,如果希望应变量趋大,当变量的效应(系数值)为正时,变量的取值应趋大; 效应为负时,变量的取值则应趋小。正是多项式的这种优点,我们总是假想过程具有这样的结构。 当过程不具有这样的结构形式时,千方百计用这种形式的方程去近似它,以化繁为简,化难为易。 所谓优化,就是寻找一组因子的控制状态,使相应的响应变量达到最大。
析因模型用因子的主效应和交互效应来反映因子的作用,描写过程的非线性特性, 是对过程规律的一种表达方式,在一定的意义上反映了事物的客观规律。
当因子较多时,不可能实际测定这些效应。多水平试验所需试验太多,不可能被接受。 人们将其化简,删去某些效应。大多数情况下,删去高阶交互效应。 一些交互效应本来存在,把它删除,它们的方差必定转移到其它因子(效应)上去了。 相应地,一些效应本来并不显著,因为得到了多余效应值而变得显著了,这也是不合理的。 所有这些不合理,最终会在一定程度上误导工艺。该重视的重视不够,不该重视的重视有嘉。 在这一意义上,析因模型是有局限性的。
交互作用是表达因子作用机制的一种形式。要做好试验设计,必须处理好交互作用问题。 客观过程,真正的线性系统是不多见的。也就是说,交互作用普遍存在。 交互作用带来的困扰在于:
  1. 交互作用非常复杂,哪个存在,哪个不存在,很难判断。由前面的分析,这么多的交互效应,哪能搞得清楚。
  2. 处理交互作用要成倍地增加自由度,也就是说,要成倍地增加试验数。 在方差分析中,二水平试验的两个因子的交互作用需要一个列来估计其效应, 在 3 水平试验中研究一个两因子交互效应需要 2 列 (4 个自由度), 4 水平试验需要 3 列 (9 个自由度),依此类推。 更高阶的交互效应需要占用更多自由度,很少见标示高阶交互作用的多水平正交表。 而 n 个试验的总自由度是 n-1,可以想见,研究交互作用需要多大的代价。
  3. 交互作用的确定非常困难,大多数情况下是一种假设。 在回归模型设计时,常常是将拟合函数展开成泰勒级数, 然后删除高阶项。这种删除本身是盲目的。数学分析中,高阶项对应高阶无穷小。 这个假设应用到试验设计不合理。因为,在实验设计中,水平变动不是无穷小量。 一个因子在各个项中都是以水平为变动单位,哪来的无穷小。 在一个系统中,每一个因子的存在都有其合理性, 如果没有存在的合理性就应该删除它。我们没有理由认为高阶交互作用存在的可能性比低阶小, 也没有理由认为高阶交互作用比低阶交互作用小。笼统地删除高阶项的操作完全没有道理。
  4. 一般来说,交互作用不是常数,在不同的试验区域,效应值不同。仅当因子的作用机制为线性时效应值为常数。
有两种处理方法:一种是摆脱交互作用,参见《梯度法与小局域试验》; 一种是利用专业经验,在事前作出预判断。这种预判断有两层:一是大系统分解为子系统; 一是从因子间的关系判断交互作用的存在性。这是可能的。
Return to menu
下面我们来说明事前判断的原理。

2. 交互作用辨析原理

2.1 二元交互作用

假设系统的一个子系统只有两个变量x1,x2,根据析因原理
y=b0+b1x1+b2x2+b3x1x2+ e------(1)
其中,e 为误差,假设有以下试验,
二元析因设计
序号x1x2y
100 y1
210 y2
301 y3
411 y4
把实验数据代入式(1),则可以得到回归系数估计值 β :
y10------(2)
y201------(3)
y302------(4)
y40123.------(5)


依次解出 β ,
β0=y1------(6)
β1=y2-y1------(7)
β2=y3-y1------(8)
β3=y4+y1-(y2+y3).------(9)


如果 y4+y1=y2+y3 ,那么,x1 与 x2之间不存在交互作用,否则,交互作用存在。 若能判断y1=0,则第一号试验不必做,即
β3=y4-(y2+y3).------(10)
如果β3 很小,交互作用微弱,或可忽略。 对于有专业经验的人来说,并不需要具体去做这些实验就可以做出判断。以橡胶工业为例,假如x1,x2 分别是橡胶和硫化剂,响应变量 y 是扯断强度,橡胶专业人员可以立即作出判断,y1,(y2,y3都应该几乎是 0。 它们之间存在交互作用,仅当要测定交互作用值时需要做实验4#,这个实验值就是交互效应估计值。 但要注意,这是在 0 点的效应。这个效应不是常数,当把橡胶作为参照为常数值时,扯断强度值是硫化剂的非线性函数。 只需一点点,就会获得很大的扯断强度,硫化剂加得比较多之后,就不会有那么大的效应了。
Return to menu

2.2 三元交互作用

类似的方法可以研究三元交互作用。 假如有三个变量x1,x2,x3,可能的交互作用有4 种:x1x2,x1x3,x2x3,x1x2x3。 共有8个参数需要确定。根据析因原理,数学模型为
y=b0+b1x1+b2x2+b3x3 +b4x1x2+b5x1x3+b6x2x3 +b7x1x2x3+e------(11)
该三个变量的不同配合构成 8 种状态,即 8 个试验
三元析因设计
序号x1x2x3y
100 0 y1
210 0 y2
30.1 0 y3
411 0 y4
500 1 y5
610 1 y6
70.11 y3
811 1 y8
由(11) 式,有
y10------(12)
y201------(13)
y302------(14)
y40124------(15)
y503------(16)
y60135------(17)
y70236------(18)
y801234567------(19)






容易看出,1#至4#试验本质上就是前面那一组试验,不多加讨论。 只要y4+y1≠y2+y3,则 x1,x2 之间的交互作用就存在。 可以解出β,
β0=y1------(20)
β1=y2-y1-------(21)
β2=y3-y1------(22)
β4=y4+y1-(y2+y3)------(23)
β3=y5-y1------(24)
β5=y6 +y1-(y2+y5)------(25)
β6 = y7+y1-(y3+y5)------(26)
β7 = (y8 +y2+y3+y5)-(y1+y4+y6+y7)------(27)






这里可以清楚地看出各交互作用存在的条件。特别地,三元交互作用存在的条件是β7≠0。 即 (y8 +y2+y3+y5)=(y1+y4+y6+y7). 如果β7很小,三元交互作用微弱,或可忽略。 熟悉正交表的读者都看得出,上面分别使用了正交表L4(23)和 L8(27)。 就是说,要弄清楚并估计出交互效应,最简单的方法就是用二水平表做全实施的试验。 这是辨析交互效应的存在的可能性。前面已经指出,对于较低级的交互作用,并不需要具体做这些试验。 只要你具备相关的专业知识,不需要做这些实验就能作出判断。 例如橡胶配方研究,胶料与硫化剂之间一定有交互作用。 如果没有硫化剂,生胶的扯断强度几乎是 0。 没有生胶,单是硫化剂,更没有强度。即y1=0,y2=0, y3=0。 一旦加了硫化剂,哪怕是很少一点点,抗张强度迅速上升。 只要有橡胶工艺经验一定知道这些道理。 类似,设第三个变量是补强剂,不需要做实验就能肯定,生胶,硫化剂与补强剂三元之间存在交互效应。 同理,某些橡胶硫化工艺需要硫化促进剂,生胶、硫化剂与硫化促进剂之间也有三元交互作用,等等。 这个系统还存在更高阶的交互效应,这些高阶交互效应不是无穷小,不能被忽略。 在防老剂用量不大的条件下,防老剂对机械性能不会有多大影响。 大体上可以判断,防老系统与补强系统是相互独立的。
在研究树脂聚合工艺时,引发剂是一个特殊角色。不加引发剂,聚合速度很慢,甚至不发生聚合反应。 在研究聚合速率时,单体与引发剂之间有交互作用。在研究聚合产物质量时,交互作用也存在。 引发剂用量太少,活性中心很少,链增长受封端剂影响(假如聚会体系中包含封端剂),分子量不一定高。 引发剂浓度太高,活性中心太多,链增长受单体浓度制约,分子量反而不高。 由此可以推断,引发剂存在优化点。 单体浓度、引发剂浓度与封端剂浓度之间存在三元交互作用。需要找到优化区间。 对更多元交互作用的辨析可以类似考虑。
Return to menu

3. 大系统的分解

大系统通常由较小的系统组成。对系统的恰当分解是降低研究难度,大量地减少实验数的窍门。 甚至是能否顺利快速完成开发过程的关键。在我的博文中有一些例子,可供参考。 (博文之间有些互相引用,难以避免,请谅解。)
一个系统中的因子可能是独立的或不是独立的。不独立就意味着因子之间有相互依存的关系,就是交互作用。 独立的因子可以被独立地研究,估计它的效应。
大系统的子系统之间也可能互相独立。 大系统的独立的子系统也可以分离出来单独研究,这样可以大量地减少试验数,且效果更好。 非独立的子系统之间存在交互作用,一般来说不能分离开来研究。 分离出来研究就意味着放弃子系统其间的交互作用。一个交互作用被删除,它就不能进入预报方程,预报就会发生偏差。 如果相互关系比较弱,可以选择忽略,对预报影响不大。
橡胶工艺通常由几个子系统组成,包含橡胶体系统(可能包含多种不同橡胶),交联子系统(交联剂,促交联剂等), 补强子系统(多种碳黑及助剂),防老子系统以及硫化工艺子系统(温度,压力,硫化时间等)。 变量可能多达数十个,交互作用广泛存在,研究全部交互效应是不可能的。 当考察机械性能时,交联系统与橡胶系统之间肯定存在交互作用; 交联子系统与补强子系统之间存在交互作用;橡胶,交联系统与补强系统存在多元交互作用; 但防老系统与其他系统之间则不一定存在交互作用,或者交互作用比较微弱。 在考察橡胶制品寿命时,防老剂与橡胶之间的交互作用存在,但与补强剂之间的交互作用不一定很强。 橡胶专业工作者会有处理这些问题的经验。
对于大系统的研究,交互作用非常复杂,很难辨析其存在性。如果不是十分必要,不应该追求对交互效应的估计。 采用梯度法,试验数少,能够快速收敛到优化区。假设系统包含20个输入变量,采用不规则弱相关设计, 一组小局域试验23个试验,至少包含7个正交列,使用 13 个弱相关列,尚余三个误差自由度。 可以得到梯度的较好估计.然后逐步调优,可以得到优化的工业化参数设计。 如果采用固定水平或混合水平试验设计,固定水平或混合水平正交表比超立方阵列包含更多正交列。效果会好很多。 例如,16 运行,4 水平正交表包含10 个正交列;25运行,5水平正交表包含12个正交列,等等。 试验设计一般都应该采用固定水平或混合水平正交表, 详见我的博文中的正交表集:《Zero-correlated or Weakly-correlated Hypercube Arrays》 和 《Zero-correlated or Weakly-correlated Fixed-level Arrays》。
Return to menu

参考

  1. 田口玄一,《正交计划法》,丸善株式会社,东京, (1976).
  2. A.S.Hedayat, N.J.A.Sloane \& John Stufken, Orthogonal Arrays:Theory and Applications,Springer,(1999).
  3. 田口玄一, Intdoduction to Quality Engineering: Designing Quality into products and processes. Tokyo: Asian Productivity Organization, (1986).
  4. 茆诗松,丁元,周纪芗,吕乃刚编著,《回归分析及其试验设计》,华东师范大学出版社,上海,1981 5.R.I.Jennrich 编著,杨自强译,逐步回归,《数字计算机上用的数学方法》卷Ⅲ(4), 科学出版社,北京,1981
  5. 《正交试验法》编写组, 《正交试验法》, 国防工业出版社,1976
  6. 中国科学院数学研究所统计组,《常用数理统计方法》,科学出版社,1973
  7. 8. George.E.P.Box, J.Stuart Hunter, William G.Hunter, Statistics for Experimenters (Second Edition), Wiley-Interscience,2004
  8. 中国科学院数学研究所统计组,《常用数理统计表》,科学出版社,1974




























没有评论:

发表评论