[0005] 本发明所要解决的主要技术问题是:如何基于多变量互信息,从整体层面最优选择与质量相关的过程测量变量,并基于此建立相应的质量指标预测与监测模型。
[0006] 本发明方法解决上述问题所采用的技术方案为:一种基于多变量互信息优选的质量预测与监测方法,包括以下步骤:
[0007] (1):从生产过程对象的历史数据库中找出能反映产品质量的指标所对应的数据n×k n×m组成输出矩阵Y∈R ,与输出Y相对应的采样数据组成输入矩阵X∈R ,其中,n为训练样n×m
本数,m为过程测量变量数,k为质量指标数,R为实数集,R 表示n×m维的实数矩阵。
[0008] (2):计算输出矩阵Y中各列向量的均值μ1,μ2,…,μk与标准差δ1,δ2,…,δk后,按照公式 对Y中各行向量实施标准化处理得到标准化后的输出矩阵 其中行向量y与 分别表示矩阵Y与 中的任意一个行向量,输出均值向量μ=[μ1,μ2,…,μk]、输出标准差对角矩阵 中对角线上的元素为δ1,δ2,…,δk。
[0009] (3):对矩阵X实施标准化处理,得到标准化后的输入矩阵 初始化c=1并根据如下所示公式初始化一条长度为m的二进制数b:
[0010]
[0011] (4):根据二进制数b中元素1的位置,对应地从矩阵 中选取相应的列向量组成矩阵Z。
[0012] (5):利用如下所示的多变量互信息计算过程,计算矩阵Z与矩阵 之间的相关性φc。
[0013] ①将矩阵Z与矩阵 合并成一个矩阵 设置距离近邻个数r=3并初始化p=1。
[0014] ②计算矩阵A中第p行向量与A中第q=1,2,…,n行向量之间的距离,然后按数值大小做升序排列,并记录第r+1个数值θp。
[0015] ③计算矩阵Z中第p行向量与 中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件 的个数βp。
[0016] ④计算矩阵 中第p行向量与 中第q=1,2,…,n行向量之间的距离然后记录距离大小满足条件 的个数δp。
[0017] ⑤利用记录的βp与δp计算其相应的Digamma函数ψ(βp)与ψ(δp),其中Digamma函数满足条件ψ(x+1)=ψ(x)+1/x,x为函数自变量,当x=1时,ψ(1)=‑0.57721。
[0018] ⑥判断是否满足条件:p<n?若是,则置p=p+1后返回至②;若否,则分别计算得到ψ(β1),ψ(β2),…,ψ(βn)与ψ(δ1),ψ(δ2),…,ψ(δn)的平均值,记为 与ξ。
[0019] ⑦按照下式计算窗口矩阵Z与 之间的互信息大小:
[0020]
[0021] 那么,矩阵Z与矩阵 之间的相关性φc为
[0022] (6):判断是否满足条件:c<2m‑1+2m‑2+…+20?若是,则置c=c+1与b=b+1后返回至m‑1 m‑2 0步骤(4);若否,则得到C=2 +2 +…+2个相关性数值φ1,φ2,…,φC。
[0023] (7):将φ1,φ2,…,φC中的最大值所对应的下标号c转换成m位的二进制数后,记录该二进制数中元素1所在位置为集合Ф,则Ф中优选出的变量即为与输出质量指标 密切相关的输出变量。
[0024] (8):根据集合Ф中存储的变量位置从矩阵 中选出对应的列向量组成输出相关矩阵 而 中其余的列向量则组成输出不相关矩阵
[0025] (9):建立输出相关矩阵 与输出矩阵 之间的软测量模型: 其中表示软测量模型拟合出的函数关系,E为预测误差,根据应用对象的不同,可用算法有偏最小二乘回归、神经网络、支持向量回归。
[0026] (10):根据公式 计算出软测量模型的输出估计值 并计算 的协方差矩阵 上标号T表示矩阵或向量的转置。
[0027] (11):计算矩阵 的协方差矩阵 并根据公式 与计算出控制上限Dlim与Qlim。
[0028] 离线建模阶段至此已经完成,当过程对象测量到新的样本数据时,即开始实施如下所示的在线质量指标预测与监测。
[0029] (12):采集过程对象最新采样时刻的样本数据x∈R1×m,并对其实施步骤(3)中与矩阵X相同的标准化处理得到向量
[0030] (13):根据集合Ф从行向量 中选出相应的列组成行向量 而 中其余元素则组成行向量
[0031] (14):根据公式 计算出当前采样时刻的软测量模型的输出 并根据公式计算当前采样时刻的质量指标数据y。
[0032] (15):根据如下所示公式计算与质量指标相关的监测统计量D,和与质量不相关的监测统计量Q:
[0033]
[0034] (16):若D≤Dlim且Q≤Qlim,则当前工况运行正常,返回步骤(12)继续实施对下一个采样时刻的质量指标预测与监测;若D>Dlim,则过程对象运行出现了与质量相关的故障;若Q>Qlim,则过程对象运行出现了与质量不相关的故障。
[0035] 与现有软测量与监测方法相比,本发明方法的优点在于:
[0036] 本发明方法通过穷举输入变量所有的可能组合形式,绝对能保证选择出最优的与输出相关的输入变量,避免了使用遗传算法陷入局部最优的问题。此外,本发明方法利用优选后的输入变量建立软测量模型,能剔除与质量指标不相关测量数据的干扰影响。由于本发明方法不仅实施了对质量指标的软测量,而且还能依据软测量值实施对质量指标的实时监测,并将故障区分为与质量相关以及与质量不相关。因此,本发明方法能较好地解决与质量相关的软测量与监测问题。