[0035] 下面结合附图详细描述本发明基于图平衡正则化的半监督超限学习机分类方法,图1为实施流程图。
[0036] 如图1,本发明方法的实施主要包括四个步骤:(1)用有标记样本训练出基础ELM分类器,并对无标签训练样本进行预测;(2)利用有标签训练样本结合预测样本的标签构造基于标签一致性的邻接图; (3)利用标签一致性的邻接图和原有的信息相似性图组建新的正则项加入损失函数中进行训练;(4)对具有图平衡优势的半监督超限学习机进行分类测试,并对比其它方法得出结论。
[0037] 下面逐一对各步骤进行详细说明。
[0038] 步骤(1)、利用BCI的24维脑电信号训练超限学习机基分类器F,预测训练集中的占比50%的无标签样本;
[0039] 本发明测试的样本集中,有9位受试者的4分类运动想象脑电数据,在进行算法测试时,针对每一个受试者分别进行实验。每位受试者的数据中有288个训练样本和288个测试样本,并且训练样本中有标签和无标签样本的比例分别为1:1。利用144个24维度的有标签样本集{Xl,Yl}训练出超限学习机(ELM)基分类器F,l为有标签样本的个数,并且利用基分类器F对无标签训练样本集Xu={xl+1,...,xl+u}进行正确的预测,u为无标签样本个数。进一步得到样本的预测标签 样本的预测标签包括四种分类情况,分别是左手、右手、足和舌头的运行想象任务。在得到无标签样本的伪标签以后构造新的样本集合并记此时的训练样本总数为 N=l+u。
[0040] 步骤(2)、利用新的脑电信号训练样本集合 构造基于标签一致性的邻接图W′;
[0041] 具体是:有标签样本数为N,则记Nt为第t类样本的个数,即为四种脑电信号分类情况,并且有N1+N2+...+Nc=N,其中c=4为总的分类数。基于流行假设的半监督图的构造方式,通过训练样本标签一致性信息,可以定义如下规则的有监督图的邻接矩阵W′:
[0042]
[0043] 其中 分别表示样本xi和xj在通过隐含层表示后的向量值,i和j表示邻接矩阵的行和列数,且αm表示第m个隐层节点和所有输入节点的连接权值,bm表示第m个隐层节点的阈值,m为算法网络的隐层节点数,g(·)为激活函数,这里选用sigmod函数。有了邻接矩阵W′,基于一般流行假设图的拉普拉斯构造方式,同样可以获得基于标签一致性的图拉普拉斯算子:
[0044] L′=D′‑W′ (2)
[0045] 其中D′为对角阵,第i个对角元素的值为对应列的所有值之和
[0046] 步骤(3)、将新的图拉普拉斯项结合原始的算子构造新的流行正则项,并加入半监督超限学习机的损失函数中进行训练;
[0047] 具体是:结合半监督超限学习机的图的拉普拉斯算子L以及有监督图的拉普拉斯算子L′,综合考虑两个图算子同时对分类器性能的影响,则通过一种线性组合的方式来分配两个图的权重,定义新的图拉普拉斯算子为:
[0048] Lnew=μL+(1‑μ)L′ (3)
[0049] 其中μ为平衡图比例的非负权值参数,获得新的图算子构造流行正则项加入到半监督超限学习机(SSELM)算法的损失函数中,获得了具有图平衡正则项的SSELM方法(BGR‑SSELM)。将新的损失函数为:
[0050]
[0051] 其中β为网络输出权值向量,参数C称为类间惩罚参数,λ为流行正则项参数,H称为状态矩阵或隐层输出矩阵,Y为样本标签矩阵,关于输出向量的损失函数梯度变化表示如下:
[0052]
[0053] 当训练样本数l+u>m隐含层节点数时,利用矩阵求伪逆的方式,可以得到模型的解为:
[0054] β=(Im+CHTH+λHTLnewH)‑1CHTY (6)
[0055] 式中,Im为单位矩阵。同样的,当输入样本X的个数l+u
[0056] β=HT(Il+u+CHHT+λLnewHHT)‑1CY (7)
[0057] 其中,Il+u是一个l+u维的单位矩阵;
[0058] 步骤(4)、依据步骤(3)中的隐含层权值计算公式就对对脑电信号进行测试,将288个24维训练样本送入基于图平衡正则化的分类器中进行训练,计算出相应的隐含层权值向量,并将该向量值与288测试样本向量分别进行相乘,获得输出向量值,依据向量中对应类别值最大的类别序号确定测试的类别。统计测试出的类别与真实标签的一致性程度,用预测正确的类别数除以总的测试样本数,即为本发明方法的最终测试精度,并与对比方法比较性能,其中在分类精度体现上,本发明方法利用了针对多分类更具可靠性的kappa值来分析性能,最终结果体现出本发明方法通过图的构造方式改变来提高脑电信号分类精度的有效性。
[0059] 为了验证本发明在脑电信号分类研究中的真实分类性能,充分展现本发明在对标签一致性图和信息相似性图之间达到了一种平衡,获得最佳的样本描述图,使得分类准确率得到了提升。实验部分将本发明与ELM、GELM、SS‑ELM、LapSVM以及TSVM等方法在BCI竞赛IV Dataset 2a以及Dataset 4a的数据进行性能比较,通过测试分类精度的kappa系数来衡量本发明在脑电信号分类领域的可行性。
[0060] 表1给出了所提方法在BCI Competition IV Dataset 2a数据集上的测试结果。从表1可以看出,本发明在所有9位受试者的数据集上都取得最高的kappa值,并且在6种方法对比实验中取得最高的平均 kappa值(0.660),高于ELM(0.031),高于GELM(0.008)高于SS‑ELM (0.013),高于LapSVM(0.050),高于TSVM(0.047),可以看出本发明具有最佳的分类性能,而且有5位(A1,A3,A7,A8,A9)受试者数据的分类精度与真实标签达到高度的一致性,展现出本发明在脑电信号分类中具有一定的价值。从平均测试kappa值上可以看到本文方法比SSELM和GELM方法都要高,这充分说明本发明能够有效在两种图之间寻找一种平衡,使得组合图的性能优于这两种传统图单独的表征能力,从而达到提升性能的效果。
[0061] 表1各算法在BCI Competition IV Dataset 2a上测试kappa值
[0062]
[0063] 同样的,为进一步验证本发明方法的分类性能,将本发明应用于 BCI Competition IV Dataset 4a上进行测试,同样利用kappa值来衡量分类器的分类精度,对比结果如表2所示。
[0064] 表2各算法在BCI Competition IV Dataset 4a上测试kappa值
[0065]
[0066] 观察表2可以发现,本发明在所有受试者实验时都取得了最好的 kappa值,并且平均的kappa值(0.781)也是6种对比方法中最佳的。该实验进一步说明了本发明算法在脑电信号分类研究中的存在一定的优势,可以为脑电信号分类研究提供可能。
[0067] 综上,本发明提出了基于图平衡正则化的半监督超限学习机算法,其同时结合样本标签和数据一致性构图的优势,通过非负权值平衡两个图的比重,当样本结构信息图难以描述整个样本集时,需要增加标签图权重,当样本信息被真实描述时,就适当降低标签图的权值,通过非负权值参数的自适应调整,可以为对应的训练样本提供最佳的图算子。最后将两种图的线性组合图构造为新的图的拉普拉斯正则项加入到半监督超限学习机的损失函数中,求得最优的隐含层权值,获得了图平衡正则化的半监督超限学习机算法。