[0020] 下面结合附图对本发明方法进行详细的说明。
[0021] 如图1所示,本发明提供了一种基于多近邻保持嵌入回归模型的工业软测量方法,该方法的具体实施步骤如下所示:
[0022] 步骤1:从生产过程的历史数据库中找出容易测量变量所对应的采样数据组成输入数据矩阵X∈Rn×m,能直接或间接反映产品质量的指标所对应的数据组成输出向量y∈Rn×1 n×m
。其中,n为训练样本数,m为过程测量变量数,R为实数集,R 表示n×m维的实数矩阵。
[0023] 步骤2:将向量y与矩阵X中的每一列进行标准化处理,得到均值为0,标准差为1的新输出向量 与新输入数据矩阵 记录向量y的均值μ与标准差δ,上标号T表示矩阵或向量的转置。
[0024] 步骤3:设置距离近邻个数k、时间近邻个数t、和角度近邻阀值γ,分别为数据矩阵中的每个样本点搜寻与之相近的距离近邻、时间近邻、和角度近邻,其中各参数的取值范围分别为k∈[6,12]、t∈[1,4]、和δ∈[0.6,0.7]。搜寻近邻样本点的具体操作过程如下所示:
[0025] ①初始化i=1;
[0026] ②按照如下所示公式计算第i个样本xi与矩阵 中除xi以外的其他样本之间的距离Di,j:
[0027] Di,j=||xi-xj|| (1)
[0028] 其中,j=1,2,…,n且j≠i,||||表示计算向量的长度;
[0029] ③对这些计算出来的距离Di,1,Di,2,…,Di,n按大小进行升序排列,并记录前k个最小距离所对应的样本,从而得到样本xi的距离近邻集N1(xi);
[0030] ④根据采样时间的先后次序,从数据矩阵 中找出位于第i个数据样本xi采样时间的前后各t个数据样本,从而得到样本xi的时间近邻集N2(xi);
[0031] 值得注意的是,对于第一个采样时刻的样本x1,只能搜寻得到采样时间位于x1之后的t个数据样本;而对于最后一个采样时刻的样本xn,只能搜寻得到采样时间位于xn之前的t个数据样本;
[0032] ⑤按照如下所示公式计算第i个样本xi与矩阵 中除xi以外的其他样本之间的角度余弦值cosθi,j:
[0033]
[0034] ⑥根据角度近邻阀值γ,选择满足甄别条件|cosθi,j|>γ所对应的样本,从而得到样本xi的角度近邻集N3(xi);
[0035] ⑦判断是否满足i<n?若是,置i=i+1后,返回②;若否,执行步骤4。
[0036] 步骤4:根据距离近邻、时间近邻、和角度近邻构造对应的系数矩阵W1∈Rn×n、W2∈Rn×n、以及W3∈Rn×n,具体的实施过程如下所示:
[0037] ①初始化i=1;
[0038] ②根据第i个样本xi的距离近邻集N1(xi),构造系数矩阵W1中的第i行ui∈R1×n,相应的实施流程如图2所示,具体的操作过程如下所示:
[0039] (A).初始化系数向量ui=0∈R1×n(1×n维的零向量);
[0040] (B).将距离近邻集N1(xi)中的k个样本组成一个矩阵 后,再将矩阵 中的每一列减去向量xi,以得到新矩阵
[0041] (C).判断是否满足k>m?若是,则置中间参数 若否,置
[0042] (D).计算矩阵 后,求出矩阵C中对角线元素之和ξ,并按照下式更新矩阵C:
[0043]
[0044] 上式中,Ik表示k×k的单位矩阵;
[0045] (E).计算向量w=(CTC)-1CTf∈Rk×1,并进行单位化处理w=w/||w||,其中,向量f∈k×1R 中各元素都为1;
[0046] (F).根据距离近邻集N1(xi)中各样本的下标号,将向量w中各元素对应赋予系数向量ui中相对应的元素,那么更新后的向量ui即为系数矩阵W1中第i行;
[0047] ③根据第i个样本xi的时间近邻集N2(xi),构造系数矩阵W2中的第i行,相应的实施流程与构造矩阵W1中第i行类似,这里不再赘述;
[0048] ④根据第i个样本xi的角度近邻集N3(xi),构造系数矩阵W3中的第i行,相应的实施流程与构造矩阵W1中第i行类似,这里不再赘述;
[0049] ⑤判断是否满足i<n?若是,置i=i+1后返回步骤②;若否,则系数矩阵W1、W2、和W3都构造完成。
[0050] 步骤5:求解广义特征值问题: 得到前d个最小特征值所对应的特征向量α1,α2,…,αd,以组成投影变换矩阵Ag=[α1,α2,…,αd]∈Rm×d。其中,λ表示特征值,α为特征向量,Mg=(I-Wg)T(I-Wg),I为n×n维的单位矩阵,下标号g=1,2,3。
[0051] 步骤6:根据 计算对应的得分矩阵S1,S2,S3,并计算Sg与输出 之间的回归系数向量
[0052] 步骤7:计算输出估计值yg=Sgbg,并组建新输入数据矩阵Y=[y1,y2,y3]。
[0053] 步骤8:利用偏最小二乘算法建立Y与输出 之间的回归模型 其中c∈R3×1为回归系数向量,e∈Rn×1表示模型误差。实施偏最小二乘算法的基本流程如图3所示,具体的实施步骤如下所示:
[0054] ①初始化h=1,并设置向量 与向量
[0055] ②依据公式ψh=YTv/(vTv)计算输入权值向量ψh,并用公式ψh=ψh/||ψh||单位化向量ψh;
[0056] ③依据公式sh=Yψh/(ψhTψh)计算得分向量sh;
[0057] ④依据公式qh=y0Tsh/(shTsh)计算输出权值qh;
[0058] ⑤依据公式v=y0qh更新向量v;
[0059] ⑥重复②~⑤直至v收敛(即向量v中各元素不再变化);
[0060] ⑦保留输入权值向量ψh与输出权值qh,并依据公式ph=YTsh/(shTsh)计算投影向量ph;
[0061] ⑧依据公式Y=Y-shphT更新输入矩阵Y;
[0062] ⑨令h=h+1后,若h≤3,重复②~⑧求解下一个ψh、qh、和ph;若h>3,则执行⑩;
[0063] ⑩将得到的所有输入权值向量组成矩阵Φ=[ψ1,ψ2,ψ3]、所有输出权值组成行向量Q=[q1,q2,q3]、以及所有投影向量组成矩阵P=[p1,p2,p3],那么PLSR模型的回归系数向量c=Φ(PTΦ)-1QT。
[0064] 步骤9:利用各回归系数向量b1,b2,b3与c实施在线软测量,具体的实施过程如下所示:
[0065] ①采集新时刻易测量变量的样本数据z∈R1×m,并对其实施与矩阵X相同的标准化处理得到
[0066] ②调用回归系数向量b1,b2,b3,并根据公式 计算各个NPE回归模型对输出的估计值 和
[0067] ③根据公式 计算最终输出估计值 其中行向量
[0068] ④计算对应于样本z采样时刻的产品质量指标数据
[0069] 上述实施例仅是对本发明的优选实施方式,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,不应排除在本发明的保护范围之外。