2004年5月第11卷第3期
文章编号:1671-7848(2004)03-0212-04
控制工程
ControlEngineeringofChinaMay2004Vol.11,No.3
基于PCA-GABP神经网络的BOD软测量方法
冉维丽,乔俊飞
(北京工业大学电子信息与控制工程学院,北京 100022)
摘 要:针对污水处理过程中关键水质参数无法在线监测的问题,提出基于PCA-GABP神经网络的污水水质软测量方法。该方法由两部分组成:主元分析PCA和GABP神
经网络。其中,GABP算法采用局部改进遗传算法优化神经网络权值,并采用自适应学习速率动量梯度下降算法对神经网络进行训练,建立软测量模型。仿真结果表明该软测量模型稳定性好、精度高,可用于污水处理厂对BOD进行在线预测。
关 键 词:软测量;神经网络;主元分析(PCA);遗传算法(GA);污水处理中图分类号:TP273 文献标识码:A
1 引 言
BOD(生化需氧量)是污水处理重要的水质参数,也是污水处理过程中直接控制的参数,能否对BOD进行实时监测已成为提高治污质量的关键。但是,由于测量手段的欠缺[1],目前污水处理厂采用大滞后的离线分析法:BOD5离线分析测定周期为5天,不能及时反映污水处理实际情况,不能实现对BOD进行在线测量
[2]
2 软测量模型
1)模型结构 基于PCA-GABP神经网络的污水水质BOD在线预测软测量模型如图1所示。从图中可以看出整个模型由两部分组成:主元分析PCA和GABP神经网络。其中,PCA部分实现过程变量的降维和去相关,达到简化神经网络输入的目的;GABP神经网络实现污水水质BOD与经PCA处理后的主元值之间的映射关系,是整个模型的核心部分。
。而现存的生物传感
器不但造价高、仪器寿命短,而且测量范围窄、稳定性差。因而BOD的实时监测几乎成为污水水质监测的空白点,从而了污水处理闭环控制系统的投用。
为解决上述问题,本文研究了污水水质BOD在线预测软测量的新方法。由于污水处理过程的生产条件恶劣,随机干扰严重,具有强非线性、大时变、严重滞后的特点,难以建立精确的数学模型。因此,采用传统的机理模型建立软测量模型是行不通的。而且水污染控制系统是一个多变量、多目标、多层次的包含海量信息的复杂系统,各种水质参数之间存在着强耦合和关联的情况[3],因此本文选择基于PCA时间延迟神经网络的软测量方法来实现污水水质BOD的在线预测。本文从主元分析PCA及GABP神经网络2个方面来说明该软测量技术,并通过仿真结果,证明此测量方法稳定性好,精度高。
图1 基于PCA-GABP神经网络BOD软测量模型
2)主元分析(PCA) 主元分析(PCA)又名主成分分析,作为输入数据集降维和揭示变量间线性相关关系的工具,是一种统计相关分析技术[4]。主元分析的基本思想就是在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理,使低维特征向量中的主成分变量保留原始变量的特征信息而消除冗余信息。PCA算法的主要步骤如下。
¹样本集数据用零均值标准化方法进行归一化处理:
V*Vj)/sjj,i=1,2,,,n;j=1,2,ij=(Vij-,,p
收稿日期:2003-09-23;收修定稿日期:2003-11-07
基金项目:国家自然科学基金资助项目(50274003和60304012);北京市科技新星计划资助项目(H020821210120)作者简介:冉维丽(1976-),女,河北献县人,硕士研究生,主要研究方向为智能控制与智能预测及智能优化算法等。第3期 冉维丽等:基于PCA-GABP神经网络的BOD软测量方法式中,i为样本数;j为样本分量;Vij为第i个样本的第j个分量;Vj为第j个分量样本的均值;sjj为变量Vj的标准差。
º将归一化后的过程变量按列组成原始数据矩阵V=[V1,V2,,,Vp],并求得矩阵V的协方差矩阵S。矩阵S的特征根依次排列为K1\\K2\\,Kp\\0,与其对应的单位正交特征向量组成的矩阵(即负荷矩阵)为L=[L1,L2,,,Lp]。将矩阵V分解成主成分得分矩阵T,负荷矩阵L的外积加上残差项E,即:
TT
V=TLT+E=T1LT1+T2L2+,+TqLq+E
»求累计方差贡献率G=
i=1
#213#
的主元变量为4维,因此确定神经网络拓扑结构为4输入,隐含层的神经元定为8个,输出层只有一个神经元BOD,建立一个MISO系统模型以实
现主导变量BOD的软测量。其中隐含层和输出层的激励函数分别为双曲正切Sigmoid函数和线性函数。
由于标准BP算法收敛速度慢,容易陷入局部极小,数值稳定性差,而遗传算法又存在过早收敛的缺点[5,6],本文采用局部改进的GABP算法训练神经网络。采用局部改进的遗传算法来优化神经网络权值,其中采用自适应学习速率动量梯度下降算法对神经网络进行训练,计算适应度函数。最后用与最大适应度函数对应的权值计算神经网络输出。
GABP算法具体操作如下:
¹将神经网络权值和阈值统一起来,将阈值看作是输入为-1的连接权。对神经网络权值和阈值进行二进制编码,将40个权值和9个阈值对应的0/1串联在一起,得到一个很长的二进制字符串,即一个基因链(染色体),如图2所示,代表网络的一种权值组合,即一个个体。设定种群规模为N,随机产生一个初始种群。
E
q
Ki/
j=1
E
p
Kj>
85%所需的最小主元个数q的值,并在T中选出相应于主元的q个向量作为神经网络训练的样本数据。
由于污水处理过程中过程变量复杂且存在强烈耦合和互相关,本文利用PCA解决该问题,文献[3]也说明了PCA是污水处理过程分析、监测、诊断的有力工具,使得只用少数主元变量就可以表示多个过程变量的动态信息。
3)神经网络结构及其算法 经PCA降维后
图2 神经网络权值编码方案图
本文尝试了对标准遗传算法的二进制编码方案进行局部改进。二进制数编码实际上是用离散值尽量逼近权值,这就有可能导致某些实数权值
不能精确表达而使网络训练失败[6]。为提高遗传算法搜索精度和速度,设定神经网络权值范围[-3,3],存在负实数,为简化编码程序,将每个连接
#214#控 制 工 程 第11卷
权加上3,再乘以10,然后用二进制表示。这种局部改进的二进制编码方案既简单,精度又高。
º用相应的解码方法,将N个个体解码为N组网络权值,得到具有相同结构的N个网络。
»将给定的输入输出样本集分为训练样本和测试样本,用改进的BP算法即自适应学习速率动量梯度下降法对这N组网络权值分别进行训练,求得N组网络权值对应的N个网络输出,若经过训练后这N组权值至少已有一组满足精度要求,则算法结束;否则转入程序¼。
¼设定网络的目标函数为误差函数:12
(Ym,k-Ym,k)EE2mk
适应度函数:F=C-E(C为常数)E=
将N个网络的输出值转换为适应度,按照个体适应度大小,从种群中选择适应度较大的一些个体构成交配池。
½由交叉、变异这两个遗传算子对交配池中的个体进行操作,得到新一代种群。
¾返回步骤º,i=i+1,达到设定的遗传代数时中止。
表1 3种算法的训练结果比较
20次训练中的收敛次数
9
1220
收敛速度较慢较快由快到慢
标准BP算法自适应学习速率动量梯度下降算法
GABP算法
图3 3种算法的均方误差比较
从仿真结果可以看出自适应学习速率动量梯度下降算法比标准BP算法的收敛性好,但权值的随机初始化对这两种算法的最后结果和收敛速度有很大影响,当权值太大或太小时将导致不收敛或收敛极慢。这是由于BP算法对神经网络初始权值有强烈依赖性,当初始权值太大时,BP算法一开始就工作在Sigmoid函数的饱和部分,导致不收敛;当初始权值太小时,则所有的Sigmoid函数几乎都处于线性部分,导致收敛速度降低。而GABP算法建立的软测量模型既能体现出全局收敛的优越性又具有表现出BP算法的局部搜索能力,收敛性能要远远超过单纯的BP算法。
遗传算法中最佳个体的均方误差变化曲线如图4所示,可以看出遗传算法在遇到局部极值时,搜索并没有停止,而是不断得到新的最优个体即神经网络权值组。这是由于遗传算法不是从单个权值,而是从多个较大范围的权值组构成的初始种群开始全局搜索,克服了单纯BP算法容易陷入局部极小、收敛速度慢、精度低的缺陷。对神经网络而言,由于训练样本集的大小有限,网络训练后对样本集外输入的响应直接决定了网络的性能。本文以28组测试样本来检验神经网络的性能,对BOD软测量值与离线分析值BOD5作线性回归分析,如图5所示,其中T代表3 仿真实验及软测量模型的性能检验
本文实验数据来源于黑龙江某污水处理厂水质监测分析,其中可测辅助变量包括pH值及SS,Ca,COD,NH3-N,NO2-N,NO3-N,CN,ArDO,Cr
6+2+
--OH
,
,AS的数据。利用PCA技术,按累计方
差贡献率90%选取主元,将原来的12维输入变量降到了4维。用降维后的数据建立软测量模型时,神经网络隐含层神经元为8,而当不采用PCA直接利用可测辅助变量集建模时神经网络需20个隐层神经元,可见PCA技术简化了软测量模型的结构。同时,神经网络过拟合现象减少,泛化能力增强。这是由于神经网络预测能力依赖于训练样本的质量,若训练样本中存在噪音和不确定性,会出现过拟合现象,而PCA能实现从含噪音数据中提取出必要信息,减少了过拟合现象。
为了清楚地说明遗传算法在神经网络权值优化设计中的性能,本文将标准BP算法、自适应学习速率动量梯度下降算法和GABP算法进行比较,将每种算法分别训练20次,收敛次数和收敛速度比较结果参见表1,并对3种算法的收敛速度和精度进行比较,如图3所示。第3期 冉维丽等:基于PCA-GABP神经网络的BOD软测量方法BOD离线分析值,A代表BOD软测量值。可以看出两者的相关系数达到01932,说明了应用遗传算法优化神经网络权值达到了很好的效果,由
#215#
GABP算法构造的神经网络软测量模型具有较高的预测精度。
图4 最佳个体的均方误差变化曲线图5 BOD软测量值线性回归分析
4 结 论
¹PCA-GABP算法训练神经网络的方法性能远远优于BP算法,既克服了传统BP算法训练速度慢、易陷入局部极小值、出现过拟合现象的缺点,又避免了遗传算法过早收敛的缺点。经过遗传算法优化权值的神经网络在收敛速度、收敛精度、稳定性等方面均有很大程度的改善。
º本文基于遗传神经网络软测量模型的实现,不仅能进一步推动污水处理过程实时闭环控制的实现,而且对于开发其他工业过程的具有智能优化算法的软测量仪表具有一定的启发意义。
»进一步研究智能系统建模中的预处理问题,提高样本集的数量和质量对于研究智能计算技术,建立具有自组织能力的软测量模型将起关
键作用。
¼可与虚拟仪器结合起来,使软测量的实现有利于实用化和在线应用。参考文献:
[1] 商敏儿,杜树新,吴铁军.活性污泥法污水处理过程自动控制的研究现状[J].环境污染治理技术与设备,2002,3(1):83-87.
[2] 杨平,彭道刚,韩璞.神经网络预测控制算法及其
应用[J].控制工程,2003,10(4):349-351.
[3] 杨斌,田永青,朱仲英.智能建模方法中的数据预
处理[J].信息与控制,2002,31(4):380-384.
[4] YaoX,LiuY.Anewevolutionarysystemforevolving
artificialneuralnetworks[J].IEEETransNN,1997,8(2):694-713.
[5] 阎平凡,张长水.人工神经网络与模拟进化计算
[M].北京:清华大学出版社,2000.
[6] 罗文辉.遗传算法在神经网络优化中的应用[J].
控制工程,2003,10(5):401-403
Sof-tmeasuringTechniquetoPredictBODBasedon
PCA-GABPNeuralNetworks
RANWei-li,QIAOJun-fei
(SchoolofElectronicandControlEngineering,BeijingUniversityofTechnology,Beijing100022,China)
Abstract:Totheproblemthaton-lineinformationofsomeessentialwastewaterparametersisinaccessibleinmonitoringandcontrolling
wastewatertreatmentprocesses.Asof-tmeasuringtechniqueappliedtowastewaterqualitymeasurementisputforwardbasedonPCAge-neticneuralnetwork.Itiscomposedoftwoelements:principlecomponentsanalysis(PCA),andgeneticneuralnetwork.Thismodel
canbeappliedtoon-linepredictwastewaterBOD.NeuralnetworkistrainedbyimprovedBPalgorithm,moreover,applyinggenetica-lgorithmtooptimizetheweights.Thesimulationresultsshowthatthesof-tmeasuringmodelhasgoodstabilityandhighprecisionandcan
beappliedtoon-linepredictwastewaterBOD.Keywords:sof-tmeasuring;neuralnetwork;PCA;GeneticAlgorithm(GA);wastewatertreatment