[0018] 本发明是针对现有异常检测单分类算法中存在的问题,提供一种基于最大相关熵的深度神经网络单分类检测算法,具有更好的鲁棒性。
[0019] 本发明主要包括如下步骤:
[0020] 步骤1、输入只包含正常类的训练样本集,进行特征归一化;
[0021] 步骤2、提取归一化后的训练样本的特征,即将训练样本经过多层ELM‑AE自编码器编码和解码处理,得到重构的特征值;
[0022] 步骤3、计算分类学习的输出权重β,将重构的特征值输入最后一层ELM,基于最大相关熵准则的目标函数求得输出权值β,结合定点迭代更新的梯度推导优化网络输出权重,并得到实际输出;
[0023] 步骤4、计算单分类器阈值θ,计算实际输出与样本标签的误差距离,并将得到的误差距离进行从大到小排序,根据设置的阈值参数,确定分隔正常类和异常类的阈值;
[0024] 步骤5、输入测试数据进行测试,将测试数据输入到基于最大相关熵的深层神经网络单分类器模型中,测试该模型的识别效果;
[0025] 其中,测试数据包含正常类和异常类。
[0026] 步骤1具体实现如下:
[0027] 1‑1、给训练样本 进行特征归一化,归一化后的训练样本 其中 表示第i个样本, 表示其为目标样本,训练集只包
含目标样本,N为训练样本数量。
[0028] 步骤2具体实现如下:
[0029] 2‑1、归一化后的训练样本 即ELM‑AE的输入和输出矩阵,其中:由于ELM‑AE自编码器能够通过简单地习将输入复制到输出,所以输入和输出均为XA;
[0030] 2‑2、随机生成隐层输入权值矩阵 和正交化偏置向量矩阵将输入的训练样本XA映射到相同或者不同的数据维度空间:
[0031] hk=g(wkxα+bk),(wk)Twk=I,(bk)Tbk=1,
[0032] 其中:g()表示激活函数,k=1,2,...,K,为ELM‑AE个数;I是单位向量;
[0033] 2‑3、求解ELM‑AE的输出权值矩阵
[0034] 设ELM‑AE个数为K,输入输出层神经元数量为d,隐含层神经元数量为 以及每个隐含层的正则化参数 若 或 即对于稀疏及压缩的特征表达,若 即对于等维度的特征映射,
[0035] 其中: 表示ELM‑AE的第k个隐含层输出矩阵。
[0036] 步骤3具体实现如下:
[0037] 3‑1、得到初始化输出权重
[0038] 经过K‑1层ELM‑AE得到输出矩阵Ⅰ,表示为X'=[x1',x'2,...,x'N],采用最大相关熵准则取代均方误差来优化目标函数;给定高斯核宽度σ,最大容忍误差ε和最大迭代次数0
J,并初始化输出权重β=0,初始误差 并将初始误差转化为对角
矩阵
[0039] 3‑2、优化输出权重
[0040] 结合定点迭代更新的梯度推导优化网络输出权重;计算输出权重为其中C是常数,计算误差为
转化为对角矩阵为
[0041] 3‑3、计算成本函数
[0042] 计算成本函数J(βj)和J(βj‑1),j=1,...,J,当|J(βj)‑J(βj‑1)|≥ε或者j<J时,则重复步骤3‑2进行迭代更新,直到满足条件得到最终的输出权值β;
[0043] 所述的成本函数为:
[0044] 隐藏层输出节点矩阵为 且
[0045]
[0046] 3‑4、得到实际输出
[0047] 步骤4具体实现如下:
[0048] 4‑1、计算实际输出Yα与样本标签T的误差距离:
[0049]
[0050] 其中,hK(x'i)为HK第i个样本即第i列数据;
[0051] 4‑2、将得到的误差距离进行从大到小排序, 得到其中 和 分别表示最大和最小的误差距离;
[0052] 4‑3、设置阈值参数μ,得到阈值为θ=εα[floor(μ·N)];
[0053] 其中:floor为取不大于μ·N的整数。
[0054] 步骤5具体实现如下:
[0055] 5‑1、给定测试样本 其中 表示第i个样本,表示其为目标样本, 表示其为非目标样本,P为总共的测试样本数量;
[0056] 5‑2、输入到多层ELM‑AE得到每层输出 令最后一层ELM‑AE输出为Y'=[y'i,y'2,...,y'N];
[0057] 5‑3、输入到ELM分类层得到Yβ=β·Y',计算实际输出与样本标签T的误差距离[0058] 5‑4 、将得到的误差距离 与单 分类器阈值θ比 较
[0059] 本发明有益效果如下:
[0060] 本发明采用的是超限学习机自编码器(ELM‑AE)算法进行异常检测数据的特征提取,该算法比普通自编码(AE)算法更为高效,它将原始自编码器进行特征提取优化的BP梯度下降法更换为ELM,可以快速处理较高维度的输入数据,提取其主干部分信息,并且可以实现原始数据高维度、等维度、低维度的特征表达。通过多个ELM‑AE神经网络叠加增强了特征提取能力,特别是针对异常检测中的高维不均衡大数据集。
[0061] 本发明将提取得到的特征输入到基于最大相关熵的ELM单分类器进行检测识别,极大增强了单分类器处理非高斯噪声和噪点的能力,具有较强的鲁棒性。而且结合超限学习机保留了其快速的学习性能和良好的泛化性能,满足处理更一般性数据的要求。
[0062] 本发明相对于基于传统神经网络、支持向量机和最近邻的异常检测算法,除了可以更为快速高效地特征提取并降维,在ELM识别分类中结合最大相关熵,大大增加了算法应对非高斯噪声的能力,鲁棒性更好。不仅适用于小数据集也同样适用于高维大数据集,具有普适性。对于今后的实际应用具有重要的意义。
[0063] 本发明同样测试了现场实测信号的异常检测效果,具有复杂情况下较强的抗干扰能力和实时性,那么针对理想状态下的异常数据集处理将具有更好的适应性和准确率,基于最大相关熵的深层神经网络单分类算法将对今后各个领域的异常数据处理提供有效的帮助和启发。