引用本文
汤健, 乔俊飞, 郭子豪. 基于潜在特征选择性集成建模的二噁英排放浓度软测量. 自动化学报, 2022, 48(1): 223−238 doi: 10.16383/j.aas.c190254
Tang Jian, Qiao Jun-Fei, Guo Zi-Hao. Dioxin emission concentration soft measurement based on multi-source latent feature selective ensemble modeling for municipal solid waste incineration process. Acta Automatica Sinica, 2022, 48(1): 223−238 doi: 10.16383/j.aas.c190254
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190254?viewType=HTML
文章简介
关键词
城市固废焚烧, 二噁英, 多源潜在特征, 最小二乘−支持向量机, 选择性集成建模
摘 要
二噁英(Dioxin,DXN)是导致城市固废焚烧(Municipal solid waste incineration, MSWI)建厂存在“邻避现象”的主要原因之一. 工业现场多采用离线化验手段检测DXN浓度, 难以满足污染物减排控制的需求. 针对上述问题, 本文提出了基于潜在特征选择性集成(Selective ensemble, SEN)建模的DXN排放浓度软测量方法. 首先, 采用主元分析(Principal component analysis, PCA)分别提取依据工艺阶段子系统及全流程系统过程变量的潜在特征, 并依据预设贡献率阈值进行特征初选; 接着, 采用互信息(Mutual information, MI)度量初选特征与DXN间的相关性, 并自适应确定再选的上下限及阈值; 最后, 采用具有超参数自适应选择机制的最小二乘−支持向量机(Least squares — support vector machine, LS-SVM)算法建立多源特征的候选子模型, 基于分支定界(Branch and bound, BB)优化和预测误差信息熵加权算法进行集成子模型的优化选择和加权组合, 进而得到软测量模型. 基于某MSWI焚烧厂DXN检测数据仿真验证了所提方法的有效性.
引 言
如何基于运行优化控制策略降低复杂工业过程的能源消耗和污染排放, 是国内外流程工业企业所面临的急需解决难题. 焚烧是进行城市固废(Municipal solid waste, MSW)处理的主要技术手段. 对于发展中国家的MSW焚烧(MSW incineration, MSWI)企业, 最为紧迫的问题是如何降低焚烧造成的污染排放, 其中急需在线监视和优化控制的是造成焚烧建厂“邻避现象(Not in my backyard, NIMBY)” (指居民或单位因担心垃圾场、核电厂、殡仪馆类的建设项目对身体健康、环境质量和资产价值等带来负面影响而激发的嫌恶情结, 滋生“不要建在我家后院”的心理, 并采取强烈、坚决, 甚至高度情绪化的集体反对和抗争行为)主要原因之一的剧毒物质二噁英(Dioxin, DXN)的排放浓度. MSWI企业当前主要关注如何基于优化的运行参数实现DXN排放的最小化. 目前, 除配套先进的尾气处理装置外, 普遍采用“3T1E”准则间接控制DXN排放, 即: 焚烧炉内高于850 ℃的温度(Temperature, T)、超过2 秒(Time, T)的烟气停留时间、较大的湍流程度(Turbulence, T)和合适的过量空气系数(Excess oxygen, E). 当前MSWI企业难以进行以降低DXN排放为直接目标的运行优化和反馈控制, 其主要原因是: 1) DXN排放浓度的机理模型难以构建; 2) 以月或季为周期的离线直接检测焚烧尾气方式不能提供实时反馈的DXN排放浓度值. 近年来的研究热点是基于指示物/关联物对DXN排放进行在线间接检测, 但这些方法固有的设备复杂、造价昂贵、检测滞后等原因导致其难以用于MSWI过程的运行优化和反馈控制.
数据驱动软测量技术可用于需要离线化验的难以检测参数(如本文中的二噁英)的在线估计. MSWI过程包括固废焚烧、蒸汽发电、烟气处理及尾气排放等多个阶段, 其所包含的数百维过程变量间具有较大的冗余性与互补性; 显然, 这些不同阶段与DXN的产生、燃烧、吸收、再合成等过程相关, 有必要结合工艺过程划分为不同阶段子系统以便于能够量化表征对DXN排放浓度软测量的贡献度, 同时能够保留全部过程变量, 进而避免有用过程变量的缺失. 因此, 依据MSWI过程的特点, 可将DXN排放浓度软测量归结为一类面向小样本高维数据的建模问题. 文献[18]指出, 模型输入维数和低价值训练样本的增加使得获取完备训练样本的难度增大. 文献[19]定义了维数约简后的建模样本与约简特征之比, 指出该值应满足构建鲁棒学习模型的需求. 因此, 针对MSWI过程具有小样本高维特性的DXN排放建模数据进行维数约简是必要的.
目前较为常用的方法是基于机理或经验通过特征选择实现维数约简. 以依据经验选择的部分过程变量为输入, 文献[20-21]通过采用多年前欧美研究机构所收集的少量样本, 基于线性回归、人工神经网络(Artificial neural network, ANN)等算法构建DXN排放浓度软测量模型. 近年来, 我国台湾地区针对实际焚烧过程, 首先初选部分过程变量, 再结合相关性分析和主元分析(Principal component analysis, PCA)进行特征选择, 最后基于BP神经网络(Back propagation neural network, BPNN)进行DXN排放浓度建模; 但BPNN具有易陷入局部最小、易过拟合和面向小样本数据建模泛化性能差等缺点. 理论上, 基于结构风险最小化准则的支持向量机(Support vector machine, SVM)算法能够有效建模小样本数据, 但其需求解二次规划(Quadratic programming, QP)问题且超参数难以自适应选择. 最小二乘−支持向量机(Least squares SVM, LS-SVM)通过求解线性等式克服QP问题, 其超参数可通过优化算法得到, 但耗时且只能得到次优解. 上述方法均以部分过程变量为输入构建传统单模型, 其泛化性有待于提高, 并且难以表征MSWI不同工艺阶段对DXN模型的贡献率. 此外, 上述研究也缺少对LS-SVM超参数的自适应选择机制.
针对工业过程机理复杂性难以有效地进行特征选择以及变量间具有的强共线性, 能够提取高维数据蕴含变化的主元分析(PCA)是工业过程难以检测参数软测量中较为常用的潜在特征提取方法, 但贡献率低的主元建模会降低预测稳定性. 此外, 基于上述非监督方法所提取的蕴含原始过程变量主要变化的潜在特征与难测参数间的相关性却可能较弱. 因此, 有必要对贡献率满足要求的潜在变量进行再次选择.
此外, 针对MSWI过程的不同阶段子系统和全流程系统所提取的潜在特征可视为表征不同局部和全局特性的多源信息. 理论和经验分析表明, 面向多源信息采用选择性集成(Selective ensemble, SEN)机制构建的软测量模型具有更佳的稳定性和鲁棒性. 文献[31]综述了集成子模型多样性的构造策略, 指出训练样本重采样包括划分训练样本(样本空间)、划分或变换特征变量(特征空间)等, 基于特征空间的集成构造策略在模型预测性能上较优. 针对小样本多源高维谱数据, Tang等提出基于选择性融合多源特征和多工况样本的SEN潜结构映射模型. 文献[32-33]提出了基于随机采样样本空间的SEN神经网络模型和潜结构映射模型. 文献[34]提出基于子空间的集成学习通用框架. 文献[35]提出了在特征子空间内随机采样样本空间的面向多尺度机械信号的双层SEN潜结构映射模型. 文献[36]提出的SEN神经网络模型分别构建候选子模型和选择集成子模型及计算其权重. 但上述方法均未进行模型参数自适应机制的研究. 采用与文献[20]相同的建模数据, 文献[37]提出了基于候选超参数的SEN建模方法, 但该方法难以描述当前实际MSWI过程的真实特性, 并且难以有效表征DXN生成、燃烧、吸附和排放过程的多阶段特性.
综上可知, 依据MSWI过程的多阶段特性对不同阶段子系统进行非监督潜在特征的提取与度量, 构建具有自适应超参数选择和SEN机制的DXN排放浓度软测量模型的研究还未见报道. 因此, 本文所提的基于潜在特征SEN的DXN排放浓度软测量方法的创新点表现在:
1)采用PCA提取依工艺流程划分阶段子系统和MSWI全流程系统的潜在特征, 并依据预设的主元贡献率阈值进行多源潜在特征初选, 保证预测稳定性和避免特征选择不当造成的信息损失;
2)采用互信息(Mutual information, MI)度量初选潜在特征并进行选择以保证再选潜在特征与DXN间的相关性, 自适应确定多源潜在特征再选的上下限及阈值;
3)采用具有超参数自适应选择机制的LS-SVM算法和自适应确定集成子模型尺寸、集成子模型及其加权系数的SEN机制构建DXN排放浓度软测量模型, 确保具有互补特性的最佳子系统能够选择性融合.
图 1 基于DXN视角的MSWI过程描述
图 2 基于潜在特征SEN建模的DXN排放浓度软测量策略
请点击左下角“阅读原文”了解更多!
作者简介
相关文章
[1] 柴天佑. 复杂工业过程运行优化与反馈控制. 自动化学报, 2013, 39(11): 1744-1757. doi: 10.3724/SP.J.1004.2013.01744
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01744?viewType=HTML
[2] 汤健, 乔俊飞, 柴天佑, 刘卓, 吴志伟. 基于虚拟样本生成技术的多组分机械信号建模. 自动化学报, 2018, 44(9): 1569-1589. doi: 10.16383/j.aas.2017.c170204
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c170204?viewType=HTML
[3] 郭海涛, 汤健, 丁海旭, 乔俊飞. 基于混合数据增强的MSWI过程燃烧状态识别. 自动化学报. doi: 10.16383/j.aas.c210843
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210843?viewType=HTML
[4] 刘卓, 汤健, 柴天佑, 余文. 基于多模态特征子集选择性集成建模的磨机负荷参数预测方法. 自动化学报, 2021, 47(8): 1921-1931. doi: 10.16383/j.aas.c190735
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190735?viewType=HTML
[5] 孙子健, 汤健, 乔俊飞. 联合样本输出与特征空间的半监督概念漂移检测法及其应用. 自动化学报. doi: 10.16383/j.aas.c200984
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200984?viewType=HTML
[6] 乔俊飞, 郭子豪, 汤健. 面向城市固废焚烧过程的二噁英排放浓度检测方法综述. 自动化学报, 2020, 46(6): 1063-1089. doi: 10.16383/j.aas.c190005
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190005?viewType=HTML
[7] 马跃峰, 梁循, 周小平. 一种基于全局代表点的快速最小二乘支持向量机稀疏化算法. 自动化学报, 2017, 43(1): 132-141. doi: 10.16383/j.aas.2017.c150720
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c150720?viewType=HTML
[8] 王琴, 沈远彤. 基于压缩感知的多尺度最小二乘支持向量机. 自动化学报, 2016, 42(4): 631-640. doi: 10.16383/j.aas.2016.c150296
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150296?viewType=HTML
[9] 汤健, 柴天佑, 丛秋梅, 苑明哲, 赵立杰, 刘卓, 余文. 基于EMD和选择性集成学习算法的磨机负荷参数软测量. 自动化学报, 2014, 40(9): 1853-1866. doi: 10.3724/SP.J.1004.2014.01853
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.01853?viewType=HTML
[10] 孙明轩, 毕宏博. 学习辨识:最小二乘算法及其重复一致性. 自动化学报, 2012, 38(5): 698-706. doi: 10.3724/SP.J.1004.2012.00698
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.00698?viewType=HTML
[11] 刘峤, 秦志光, 陈伟, 张凤荔. 基于零范数特征选择的支持向量机模型. 自动化学报, 2011, 37(2): 252-256. doi: 10.3724/SP.J.1004.2011.00252
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2011.00252?viewType=HTML
[12] 李妍, 毛志忠, 王琰. 基于偏差补偿递推最小二乘的Hammerstein-Wiener模型辨识. 自动化学报, 2010, 36(1): 163-168. doi: 10.3724/SP.J.1004.2010.00163
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00163?viewType=HTML
[13] 王雪松, 田西兰, 程玉虎, 易建强. 基于协同最小二乘支持向量机的Q学习. 自动化学报, 2009, 35(2): 214-219. doi: 10.3724/SP.J.1004.2009.00214
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2009.00214?viewType=HTML
[14] 张勇, 杨慧中. 有色噪声干扰输出误差系统的偏差补偿递推最小二乘辨识方法. 自动化学报, 2007, 33(10): 1053-1060. doi: 10.1360/aas-007-1053
http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-1053?viewType=HTML
[15] 颜学峰. 基于径基函数-加权偏最小二乘回归的干点软测量. 自动化学报, 2007, 33(2): 193-196. doi: 10.1360/aas-007-0193
http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0193?viewType=HTML
[16] 李丽娟, 苏宏业, 褚健. 基于在线最小二乘支持向量机的广义预测控制. 自动化学报, 2007, 33(11): 1182-1188. doi: 10.1360/aas-007-1182
http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-1182?viewType=HTML
[17] 赵龙, 陈哲. 新型联邦最小二乘滤波算法及应用. 自动化学报, 2004, 30(6): 897-904.
http://www.aas.net.cn/cn/article/id/16261?viewType=HTML
[18] 李松涛, 张长水, 荣钢, 边肇祺, Dongming Zhao. 一种基于最小二乘估计的深度图像曲面拟合方法. 自动化学报, 2002, 28(2): 310-313.
http://www.aas.net.cn/cn/article/id/15521?viewType=HTML
[19] 丁锋, 丁韬, 萧德云, 杨家本. 时变系统有限数据窗最小二乘辨识的有界收敛性. 自动化学报, 2002, 28(5): 754-761.
http://www.aas.net.cn/cn/article/id/15568?viewType=HTML
[20] 王晓, 韩崇昭, 万百五. 两种新的有效的非线性系统最小二乘辨识算法. 自动化学报, 1998, 24(1): 95-101.
http://www.aas.net.cn/cn/article/id/16914?viewType=HTML
[21] 罗贵明. 基于最小二乘算法的最优适应控制器. 自动化学报, 1996, 22(1): 79-84.
http://www.aas.net.cn/cn/article/id/17187?viewType=HTML
[22] 孟晓风, 王行仁, 黄俊钦. 最小二乘估计的HOUSEHOLDER变换快速递推算法. 自动化学报, 1994, 20(1): 20-28.
http://www.aas.net.cn/cn/article/id/14159?viewType=HTML
原文始发于微信公众号(AAS自动化学报):基于潜在特征选择性集成建模的二噁英排放浓度软测量