首页 > 专利 > 杭州电子科技大学 > 基于特征函数滤波的神经网络参数更新的图像分类方法专利详情

基于特征函数滤波的神经网络参数更新的图像分类方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2019-05-10
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-09-03
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-06-29
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2039-05-10
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201910389454.5 申请日 2019-05-10
公开/公告号 CN110110794B 公开/公告日 2021-06-29
授权日 2021-06-29 预估到期日 2039-05-10
申请年 2019年 公开/公告年 2021年
缴费截止日
分类号 G06K9/62G06N3/04 主分类号 G06K9/62
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 3
权利要求数量 4 非专利引证数量 1
引用专利数量 1 被引证专利数量 0
非专利引证 1、2018.07.05张海涛.基于卡尔曼滤波器算法的径向基神经网络训练算法研究《.中国优秀硕士论文全文数据库信息科技辑》.2007,Jongsoo Choi,Martin Bouchard,Tet HinYeap.A Derivative-Free Kalman Filter forParameter Estimation of Recurrent NeuralNetworks《.ResearchGate》.2005,;
引用专利 WO2018120013A 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 文成林、翟凯凯 第一发明人 文成林
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 2
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
浙江千克知识产权代理有限公司 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
周希良
摘要
本发明公开了一种基于特征函数滤波的神经网络参数更新的图像分类方法。本发明中所使用的特征函数滤波只需假设测量误差存在均值,模型噪声存在分布函数。本发明有效地解决了一般用于图像分类的神经网络参数更新方法中存在的局部收敛、计算复杂度过高等问题,且实现了神经网络参数的在线自适应更新,在有新的图像样本集输入时,不需要结合旧的图像样本就可以更新网络参数,使得网络模型得以适应图像工况的改变。
  • 摘要附图
    基于特征函数滤波的神经网络参数更新的图像分类方法
  • 说明书附图:图1
    基于特征函数滤波的神经网络参数更新的图像分类方法
  • 说明书附图:图2
    基于特征函数滤波的神经网络参数更新的图像分类方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-06-29 授权
2 2019-09-03 实质审查的生效 IPC(主分类): G06K 9/62 专利申请号: 201910389454.5 申请日: 2019.05.10
3 2019-08-09 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.基于特征函数滤波的神经网络参数更新的图像分类方法,其特征在于该方法包括以下步骤:
T
步骤(1)建立由样本输入集x(k)=[x1(k),x2(k),…,xn(k)]到输出集y(k)=[y1(k),y2T
(k),…,ym(k)] 之间的关系映射的神经网络模型,其中样本输入集为每个图像样本经过预处理后的特征值,样本输出集为相应每个图像的分类类别,k为第k个样本集的选择,xn(k)为第k个样本的第n个输入,ym(k)为第k个样本的第m个输出;
步骤(2)初始化网络中隐层的权重参数、偏置参数以及输出层权重参数
每一次迭代在隐层权重参数和偏置参数随机给定的情况下,将网络的全部参数求解问题转化成通过最小二乘来求解输出层权重参数β的问题;
步骤(3)通过当前新的图像样本输入更新神经网络的输出层权重参数β;
考虑到待估输出层权重参数β是受一定随机干扰缓变的,将卡尔曼滤波的状态方程进行如下建模:
β(k+1)=A(k+1,k)β(k)+w(k)                      (4)
为模拟待估参数受到的干扰,方程中加入了白噪声序列w(k);
得到测量方程如下:
y(k)=Hβ(k)+v(k)                            (5)
其中,v(k)为白噪声序列;
上述Kalman滤波模型中,过程噪声w(k)和观测噪声v(k)均为白噪声序列,在采样间隔内为常值;且有E{w(k)w′(k)}=Q和E{v(k)v′(k)}=R,A(k+1,k)=E,当w(k)和v(k)相互独立时,E{w(k)v′(k)}=0,β(k)为第k个输出层权重参数;
则该模型求解的第k+1个输出层权重参数β的最优估计值:
其中, 表示第k+1个输出层权重参数β预测值;K(k+1)为第k+1个最优增益阵;
为第k+1个的输出层权重参数β估计值;
步骤(4)通过特征函数滤波更新隐层权重参数和隐层偏置参数;
在特征函数滤波中,当观测方程关于状态变量为非线性时,若满足以下两个要求:
要求1:{w(k)}与{v(k)}为有界的平稳随机过程,x(0)为初始状态,{w(k)},{v(k)}及x(0)相互独立,且已知{w(k)}的分布函数,且其特征函数为 {v(k)}均值已知,|E(w(k))|<+∞;
要求2:H(·)是一个已知的波尔可测且光滑的非线性函数;
则可设计如下形式的滤波器:
其中,A(k)为状态转移矩阵, 为第k个状态量的估计值, 为第k+1个观测n×l
值的预测值,U(k)∈R 为一个待设计的增益矩阵,U(k)的获取是整个滤波器设计的核心与关键;
令 则可得估计误差方程为
其性能指标为
其中,
加权函数K(t)的选取是为保证J0是实值且有界的,它是给定的正定的权重矩阵,为了约束增益矩阵,最小化此性能指标则可求得滤波增益阵;
下面给出增益阵K(k+1)求解过程:
若令p1(k)和p2(k)分别为
则性能指标可改写为
为了求取增益矩阵K(k+1),令 求性能指标的极值点,可得
由于
因此式(13)求得的解即为最小化性能指标的极值点;
对于已经确定了隐层权重参数与偏置参数以及输出层权重参数的单隐层神经网络,每有新的图片样本输入,依次执行如下三个步骤:
步骤(4‑1)隐层权重参数更新
假定隐层偏置参数与输出层权重参数为不变,则对于第k+1个样本,隐层权重参数的最优估计值为
该步骤中,对于隐层权重参数的更新,由于ω=[ω1,ω2,…,ωn],ωi=[ωi1,ωi2,…,T
ωil]是隐层权重参数的分向量,隐层权重参数为n维向量,则需要对于ωi,i=1,…,n分别进行建模求解更新;对于每次ωi的估计,假设ωj,j=1,…,i‑1,i+1,…,n均为不变;则以ωi为特征函数滤波中的状态变量建立如下状态方程和观测方程:
ωi(k+1)=A·ωi(k)+w(k)                      (16)
其中模型噪声w(k)只需存在分布函数,测量误差v(k)只需存在均值;
步骤(4‑2)隐层偏置参数a更新
然后使用特征函数滤波更新隐层偏置参数a,假定隐层权重参数ω与输出层权重参数β不变,则对于第k+1个图片样本,隐层偏置参数a的最优估计值为
该步骤中以隐层偏置参数a为状态变量建立与步骤(3‑1)中类似的状态方程和观测方程并求解得到第k个隐层偏置参数a(k)的最优估计值;
步骤(4‑3)输出层权重参数β更新
使用线性卡尔曼滤波方法更新输出层权重参数,假定隐层权重参数与隐层偏置参数均为不变,则对于第k+1个样本,输出层权重参数的最优估计值为

2.根据权利要求1所述的方法,其特征在于:步骤(1)中的神经网络模型表示为:
T
其中,g(·)为激活函数,ωi=[ωi1,ωi2,…,ωil] 与a分别为隐层的权重参数与偏置参数,l为单隐层节点个数,β为输出层权重参数;
损失函数为
其中, 为模型确立后的图片分类结果,具体形式为

3.根据权利要求1所述的方法,其特征在于:步骤(2)具体是:
当隐层的激活函数无限可微时,神经网络不再需要对所有参数进行求解,隐层权重参数和隐层偏置参数可以通过随机选择的方式实现且整个过程中维持不变,此时若将公式(1)中对于模型的描述改为如下形式:
y(k)=H(k)β                          (3)
其中
T
H(k)=[H1(k) H2(k) … Hl(k)]
则由于隐层权重参数和隐层偏置参数已确定而使得H(k)已知,所以此时的问题转化为通过公式(3)求解输出层权重参数β,目标函数也由公式(2)转换为如下形式:
在此使用最小二乘方法,则其解为
‑1
上式中,H 为隐层输出矩阵H的Moore‑Penrose逆。

4.根据权利要求1所述的方法,其特征在于:步骤(4)中由公式(16)和公式(17)所组成的模型中第k个ωi(k)的最优估计值的求解过程如下:
(a)计算p1(k)
如公式(10)所示求解增益阵U(k)的组成矩阵p1(k);其中,K(t)为加权函数, 为给定的目标特征函数, 为s(k)=A(k)e(k)的特征函数, 为q(k+1)=G(k+1)w(k+
1)的特征函数;
(b)计算p3(k)
y(k)为样本输出集中第k个的图片分类类别, 为y(k)的估计值,且有
(c)计算增益阵U(k)
U(k)是正定矩为假设阵R(k)固定的权重矩阵
(d)计算待估计的隐层权重参数的分向量ωi(k)在k时刻的估计值
说明书

技术领域

[0001] 本发明属于人工智能中的图像分类技术领域,涉及一种基于特征函数滤波的神经网络参数更新的图像分类方法。

背景技术

[0002] 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
[0003] 神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的能力。作为人工智能的重要组成部分,它由输入层、输出层及包含在它们之间的单个隐层或者多个隐层三部分构成。神经网络的结构设计主要包括以下几个部分:隐层数量的确定,每个隐层中节点个数的数量及每个节点的激励函数的选取等。当结构性问题确定后,余下的问题中最重要的就是构建目标函数,以及在一定准则下如何辨识网络中包含的众多参数的问题。
[0004] 对于神经网络中的参数辨识方法,如梯度下降法、最小二乘法等方法均存在一些不足。如梯度下降法迭代算法中步长的选取难以存在一般性标准;算法的复杂度会随着隐层的数量和每个隐层中节点的数量增加而成指数形式增加;由于它本质上是一个局部线性化问题,因此,会因目标函数非线性程度提高而产生较大的训练误差,并且容易收敛到局部极值。
[0005] 图像分类是计算机视觉、模式识别与机器学习领域非常活跃的研究方向。图像分类与检测在很多领域得到广泛应用,包括安防领域的人脸识别、行人检测、智能视频分析、行人跟踪等,交通领域的交通场景物体识别、车辆计数、逆行检测、车牌检测与识别,以及互联网领域的基于内容的图像检索、相册自动归类等。图像分类通常使用神经网络来实现,然而如上所述,神经网络的参数更新方法中存在的问题成为了图像分类精确度与时间复杂度的瓶颈。因此一种新的神经网络参数更新方法对于图像分类而言就有了重要的意义。

发明内容

[0006] 本发明针对现有技术的不足,设计了一种基于特征函数滤波的神经网络参数更新的图像分类方法。该方法中所使用的特征函数滤波只需假设测量误差存在均值,模型噪声存在分布函数,不存在局部线性化以及局部收敛的问题,且可以实现网络参数的实时在线自适应更新。将本发明用于图像识别分类,可以提高图像分类的准确率,并降低参数更新的时间复杂度。
[0007] 本发明包括以下各步骤:
[0008] 步骤(1)建立由样本输入集x(k)=[x1(k),x2(k),…,xn(k)]T到输出集y(k)=[y1T(k),y2(k),…,ym(k)]之间的关系映射的神经网络模型,其中样本输入集为每个图像样本经过预处理后的特征值,样本输出集为相应每个图像的分类类别,k为第k个样本集的选择,xn(k)为第k个样本的第n个输入,ym(k)为第k个样本的第m个输出。
[0009]
[0010] 其中,g(·)为激活函数,通常选取如sigmoid函数,ReLU函数,高斯函数,多项式T等,ωi=[ωi1,ωi2,…,ωil] ,i=1,…,n与a分别为隐层的权重参数与偏置参数,ωi中的各项为其分向量,l为单隐层节点个数,β为输出层权重参数。
[0011] 其损失函数的一般形式为
[0012]
[0013] 其中, 为模型确立后的图片分类结果。
[0014] 在此所使用的损失函数的具体形式为
[0015]
[0016] 步骤(2)初始化网络中隐层的权重参数与偏置参数以及输出层权重参数[0017] 每一次迭代在隐层权重参数和偏置参数随机给定的情况下,将网络的全部参数求解问题转化成通过最小二乘来求解输出层权重参数β的问题。该算法具体描述如下:
[0018] 当隐层的激活函数无限可微时,神经网络不再需要对所有参数进行求解,隐层权重参数和隐层偏置参数可以通过随机选择的方式实现且整个过程中维持不变,此时若将公式(1)中对于模型的描述改为如下形式:
[0019] y(k)=H(k)β   (3)
[0020] 其中
[0021] H(k)=[H1(k) H2(k) … Hl(k)]T
[0022]
[0023] 则由于隐层权重参数和隐层偏置参数已确定而使得H(k)已知,所以此时的问题可以转化为如何通过公式(3)求解输出层权重参数β,目标函数也由公式(2)转换为如下形式:
[0024]
[0025] 在此使用最小二乘方法,则其解为
[0026]
[0027] 上式中,H‑1为隐层输出矩阵H的Moore‑Penrose逆。
[0028] 步骤(3)通过当前新的图像样本输入更新神经网络的输出层权重参数β。
[0029] 该步骤中使用Kalman滤波来进行输出层权重参数β的实时更新。要想用Kalman滤波来进行该参数的实时更新,那就必须建立符合Kalman滤波的状态方程和测量方程。考虑到待估输出层权重参数β是受一定随机干扰缓变的,故将Kalman滤波的状态方程进行如下建模:
[0030] β(k+1)=A(k+1,k)β(k)+w(k)   (4)
[0031] 为模拟待估参数受到的干扰,方程中加入了白噪声序列w(k)。
[0032] 由公式(3)可以得到测量方程如下:
[0033] y(k)=Hβ(k)+v(k)   (5)
[0034] 其中,v(k)与状态方程类似,也为白噪声序列。
[0035] 上述Kalman滤波模型中,过程噪声w(k)和观测噪声v(k)均为白噪声序列,在采样间隔内为常值。且有E{w(k)w′(k)}=Q和E{v(k)v′(k)}=R,A(k+1,k)=E,当w(k)和v(k)相互独立时,E{w(k)v′(k)}=0,β(k)为第k个输出层权重参数。
[0036] 则该模型求解的第k+1个输出层权重参数β的最优估计值:
[0037]
[0038] 其中, 表示第k+1个输出层权重参数β预测值;K(k+1)为第k+1个最优增益阵; 为第k+1个的输出层权重参数β估计值。
[0039] 步骤(4)通过特征函数滤波更新隐层权重参数和隐层偏置参数。
[0040] 特征函数滤波是一种新型的非高斯滤波方法,在特征函数滤波中,当观测方程关于状态变量为非线性时,若满足以下两个要求:
[0041] 要求1:{w(k)}与{v(k)}为有界的平稳随机过程,x(0)为初始状态,{w(k)},{v(k)}及x(0)相互独立,且已知{w(k)}的分布函数,且其特征函数为 {v(k)}均值已知,|E(w(k))|<+∞。
[0042] 要求2:H(·)是一个已知的波尔可测且光滑的非线性函数。
[0043] 则可设计如下形式的滤波器:
[0044]
[0045]
[0046] 其中,A(k)为状态转移矩阵, 为第k个状态量的估计值, 为第k+1个n×l观测值的预测值,U(k)∈R 为一个待设计的增益矩阵,U(k)的获取是整个滤波器设计的核心与关键。
[0047] 令 则可得估计误差方程为
[0048]
[0049] 其性能指标为
[0050]
[0051] 其中,
[0052] 加权函数K(t)的选取是为保证J0是实值且有界的,它是给定的正定的权重矩阵,为了约束增益矩阵,最小化此性能指标则可求得滤波增益阵。
[0053] 下面给出增益阵K(k+1)求解方法和过程。
[0054] 若令p1(k)和p2(k)分别为
[0055]
[0056]
[0057] 则性能指标可改写为
[0058]
[0059] 为了求取增益矩阵K(k+1),令 求性能指标的极值点,可得
[0060]
[0061] 由于
[0062]
[0063] 因此式(13)求得的解即为最小化性能指标的极值点。
[0064] 设计基于特征函数的参数更新方法可以分两步实现:首先进行隐层权重参数ω与偏置参数a更新,其次是输出层权重参数β更新。但是由于其高复杂性,在此把它分为三个步骤。其描述如下:
[0065] 对于已经通过步骤(1),步骤(2)和步骤(3)中方法确定了隐层权重参数ω与偏置参数a以及输出层权重参数β的单隐层神经网络,每有新的图片样本输入,依次执行如下三个步骤:
[0066] 步骤(4‑1)隐层权重参数ω更新
[0067] 首先使用特征函数滤波更新隐层权重参数ω,假定隐层偏置参数a与输出层权重参数β为不变,则对于第k+1个样本,隐层权重参数ω的最优估计值为
[0068]
[0069] 该步骤中,对于隐层权重参数ω的更新,由于ω=[ω1,ω2,…,ωn],ωi=[ωi1,Tωi2,…,ωil] 是隐层权重参数ω的分向量,ω为n维向量,则需要对于ωi,i=1,…,n分别进行建模求解更新。对于每次ωi的估计,假设ωj,j=1,…,i‑1,i+1,…,n均为不变。则以ωi为特征函数滤波中的状态变量可以建立如下状态方程和观测方程:
[0070] ωi(k+1)=A·ωi(k)+w(k)   (16)
[0071]
[0072] 其中模型噪声w(k)只需存在分布函数,测量误差v(k)只需存在均值。则该模型第k个ωi(k)的最优估计值的求解过程如下:
[0073] (a)计算p1(k)
[0074] 如公式(10)所示求解增益阵U(k)的组成矩阵p1(k)。其中,K(t)为加权函数,为给定的目标特征函数, 为s(k)=A(k)e(k)的特征函数, 为q(k+1)=G(k+1)w(k+1)的特征函数。
[0075] (b)计算p3(k)
[0076]
[0077] y(k)为样本输出集中第k个的图片分类类别, 为y(k)的估计值,且有[0078]
[0079] (c)计算增益阵U(k)
[0080]
[0081] U(k)是正定矩为假设阵R(k)固定的权重矩阵
[0082] (d)计算待估计的隐层权重参数的分向量ωi(k)在k时刻的估计值[0083]
[0084] 步骤(4‑2)隐层偏置参数a更新
[0085] 然后使用特征函数滤波更新隐层偏置参数a,假定隐层权重参数ω与输出层权重参数β不变,则对于第k+1个图片样本,隐层偏置参数a的最优估计值为
[0086]
[0087] 该步骤中以隐层偏置参数a为状态变量建立与步骤(3‑1)中类似的状态方程和观测方程并求解得到第k个隐层偏置参数a(k)的最优估计值。
[0088] 步骤(4‑3)输出层权重参数β更新
[0089] 使用线性卡尔曼滤波方法更新输出层权重参数β,假定隐层权重参数ω与隐层偏置参数a均为不变,则对于第k+1个样本,输出层权重参数β的最优估计值为[0090]
[0091] 该步骤中的建模和参数求解与步骤(3)中相同。
[0092] 本发明的有益效果:使用特征函数滤波和卡尔曼滤波相结合的方法,用于更新神经网络中的所有参数。在图片分类中应用该方法,每有新的图片样本到来,不需要结合旧的图片样本就可以更新神经网络中的所有参数以适应图片工况的变化,且提高了图片分类的准确率,减小了计算的复杂度。

实施方案

[0095] 以下结合附图2对本发明作用于图像分类的应用作进一步说明。
[0096] 本发明具体步骤如下
[0097] 步骤(1)建立由样本输入集x(k)=[x1(k),x2(k),…,xn(k)]T到输出集y(k)=[y1T(k),y2(k),…,ym(k)]之间的关系映射的神经网络模型,其中样本输入集为每个图像样本经过预处理后的特征值,样本输出集为相应每个图像的分类类别,k为第k个样本集的选择,xn(k)为第k个样本的第n个输入,ym(k)为第k个样本的第m个输出。以单隐层神经网络为例,见图1:
[0098]
[0099] 其中,g(·)为激活函数,通常选取如sigmoid函数,ReLU函数,高斯函数,多项式T等,ωi=[ωi1,ωi2,…,ωil] ,i=1,…,n与a分别为隐层的权重参数与偏置参数,ωi中的各项为其分向量,l为单隐层节点个数,β为输出层权重参数。
[0100] 其损失函数的一般形式为
[0101]
[0102] 其中, 为模型确立后的图片分类结果。
[0103] 在此所使用的损失函数的具体形式为
[0104]
[0105] 步骤(2)初始化网络中隐层的权重参数ω与偏置参数a以及输出层权重参数β[0106] 每一次迭代在隐层权重参数ω和偏置参数a随机给定的情况下,将网络的全部参数求解问题转化成通过最小二乘来求解输出层权重参数β的问题。该算法具体描述如下:
[0107] 当隐层的激活函数无限可微时,神经网络不再需要对所有参数进行求解,隐层权重参数ω和隐层偏置参数a可以通过随机选择的方式实现且整个过程中维持不变,此时若将公式(1)中对于模型的描述改为如下形式:
[0108] y(k)=H(k)β   (3)
[0109] 其中
[0110] H(k)=[H1(k) H2(k) … Hl(k)]T
[0111]
[0112] 则由于隐层权重参数ω和隐层偏置参数a已确定而使得H(k)已知,所以此时的问题可以转化为如何通过公式(3)求解输出层权重参数β,目标函数也由公式(2)转换为如下形式:
[0113] 在此使用最小二乘方法,则其解为
[0114]
[0115] 上式中,H‑1为隐层输出矩阵H的Moore‑Penrose逆。
[0116] 步骤(3)通过当前新的图像样本输入更新神经网络的输出层权重参数β。
[0117] 该步骤中使用Kalman滤波来进行输出层权重参数β的实时更新。要想用Kalman滤波来进行该参数的实时更新,那就必须建立符合Kalman滤波的状态方程和测量方程。考虑到待估输出层权重参数β是受一定随机干扰缓变的,故将Kalman滤波的状态方程进行如下建模:
[0118] β(k+1)=A(k+1,k)β(k)+w(k)   (4)
[0119] 为模拟待估参数受到的干扰,方程中加入了白噪声序列w(k)。
[0120] 由公式(3)可以得到测量方程如下:
[0121] y(k)=Hβ(k)+v(k)   (5)
[0122] 其中,v(k)与状态方程类似,也为白噪声序列。
[0123] 上述Kalman滤波模型中,过程噪声w(k)和观测噪声v(k)均为白噪声序列,在采样间隔内为常值。且有E{w(k)w′(k)}=Q和E{v(k)v′(k)}=R,A(k+1,k)=E,当w(k)和v(k)相互独立时,E{w(k)v′(k)}=0,β(k)为第k个输出层权重参数。
[0124] 则该模型求解的第k+1个输出层权重参数β的最优估计值:
[0125]
[0126] 其中, 表示第k+1个输出层权重参数β预测值;K(k+1)为第k+1个最优增益阵; 为第k+1个的输出层权重参数β估计值。
[0127] 步骤(4)通过特征函数滤波更新隐层权重参数ω和隐层偏置参数a。
[0128] 设计基于特征函数的参数更新方法可以分两步实现:首先进行隐层权重参数ω与偏置参数a更新,其次是输出层权重参数β更新。但是由于其高复杂性,在此把它分为三个步骤。其描述如下:
[0129] 对于已经通过步骤(1),步骤(2)和步骤(3)中方法确定了隐层权重参数ω与偏置参数a以及输出层权重参数β的单隐层神经网络,每有新的图片样本输入,依次作如下三个步骤:
[0130] 步骤(4‑1)隐层权重参数ω更新
[0131] 首先使用特征函数滤波更新隐层权重参数ω,假定隐层偏置参数a与输出层权重参数β为不变,则对于第k+1个样本,隐层权重参数ω的最优估计值为
[0132]
[0133] 该步骤中,对于隐层权重参数ω的更新,由于ω=[ω1,ω2,…,ωn],ωi=[ωi1,Tωi2,…,ωil] 是隐层权重参数ω的分向量,ω为n维向量,则需要对于ωi,i=1,…,n分别进行建模求解更新。对于每次ωi的估计,假设ωj,j=1,…,i‑1,i+1,…,n均为不变。则以ωi为特征函数滤波中的状态变量可以建立如下状态方程和观测方程:
[0134] ωi(k+1)=A·ωi(k)+w(k)   (16)
[0135]
[0136] 其中模型噪声w(k)只需存在分布函数,测量误差v(k)只需存在均值。则该模型第k个ωi(k)的最优估计值的求解过程如下:
[0137] (a)计算p1(k)
[0138] 如公式(10)所示求解增益阵U(k)的组成矩阵p1(k)。其中,K(t)为加权函数,为给定的目标特征函数, 为s(k)=A(k)e(k)的特征函数, 为q(k+1)=G(k+1)w(k+1)的特征函数。
[0139] (b)计算p3(k)
[0140]
[0141] y(k)为样本输出集中第k个的图片分类类别, 为y(k)的估计值,且有[0142]
[0143] (c)计算增益阵U(k)
[0144]
[0145] U(k)是正定矩为假设阵R(k)固定的权重矩阵
[0146] (d)计算待估计的隐层权重参数的分向量ωi(k)在k时刻的估计值[0147]
[0148] 步骤(4‑2)隐层偏置参数a更新
[0149] 然后使用特征函数滤波更新隐层偏置参数a,假定隐层权重参数ω与输出层权重参数β不变,则对于第k+1个图片样本,隐层偏置参数a的最优估计值为
[0150]
[0151] 该步骤中以隐层偏置参数a为状态变量建立与步骤(3‑1)中类似的状态方程和观测方程并求解得到第k个隐层偏置参数a(k)的最优估计值。
[0152] 步骤(4‑3)输出层权重参数β更新
[0153] 使用线性卡尔曼滤波方法更新输出层权重参数β,假定隐层权重参数ω与隐层偏置参数a均为不变,则对于第k+1个样本,输出层权重参数β的最优估计值为[0154]
[0155] 该步骤中的建模和参数求解与步骤(3)中相同。
[0156] 在图片分类中应用本方法,每有新的图片样本到来,不需要结合旧的图片样本就可以更新神经网络中的所有参数以适应图片工况的变化,且提高了图片分类的准确率,减小了计算的复杂度。

附图说明

[0093] 图1是单隐层神经网络模型图。
[0094] 图2是本发明的计算步骤流程图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号