首页 > 专利 > 南京信息工程大学 > 基于CNN和域自适应学习的车型识别方法专利详情

基于CNN和域自适应学习的车型识别方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2017-08-07
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2018-01-26
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2020-12-25
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2037-08-07
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201710670157.9 申请日 2017-08-07
公开/公告号 CN107527068B 公开/公告日 2020-12-25
授权日 2020-12-25 预估到期日 2037-08-07
申请年 2017年 公开/公告年 2020年
缴费截止日
分类号 G06K9/62G06K9/00G06N3/08 主分类号 G06K9/62
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 9
权利要求数量 10 非专利引证数量 1
引用专利数量 2 被引证专利数量 0
非专利引证 1、2016.05.19CN 106250812 A,2016.12.21CN 103425996 A,2013.12.04茅正冲等.计算机视觉技术的车型识别应用研究《.单片机与嵌入式系统应用》.2017,(第06期),全文. 戴礼荣等.基于深度学习的语音识别技术现状与展望《.数据采集与处理》.2017,第32卷(第02期),全文.;
引用专利 US2003/0063796A、US2016/0140425A 被引证专利
专利权维持 5 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 南京信息工程大学 当前专利权人 南京信息工程大学
发明人 孙伟、赵玉舟、张小瑞、郭强强、杜宏吉、施顺顺、杨翠芳 第一发明人 孙伟
地址 江苏省南京市江北新区宁六路219号 邮编 210044
申请人数量 1 发明人数量 7
申请人所在省 江苏省 申请人所在市 江苏省南京市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
南京汇盛专利商标事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
张立荣、吴扬帆
摘要
本发明涉及基于CNN和域自适应学习的车型识别方法,通过在Alexnet网络中添加旋转不变层、区分判别层和设计新的目标函数,建立基于CNN网络初始模型;利用建立的初始模型分别提取不同领域样本卷积层的特征图,计算样本特征图之间的余弦相似度,确定CNN网络的共享卷积核或非共享卷积核,保留共享卷积核的权重和偏置,更新非共享卷积核的权重和偏置;基于目标领域训练样本,计算每层特征图之间的余弦相似度和整个目标领域平均相似度,根据平均相似度聚类每类相似特征图;将与目标领域中样本有相似分布特性的源领域样本拓展为目标领域的新样本,用目标领域的新样本来微调整个CNN网络模型,再通过softmax分类器对目标领域中的测试样本进行车型分类。
  • 摘要附图
    基于CNN和域自适应学习的车型识别方法
  • 说明书附图:图1
    基于CNN和域自适应学习的车型识别方法
  • 说明书附图:图2
    基于CNN和域自适应学习的车型识别方法
  • 说明书附图:图3
    基于CNN和域自适应学习的车型识别方法
  • 说明书附图:图4
    基于CNN和域自适应学习的车型识别方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2020-12-25 授权
2 2018-07-03 著录事项变更 申请人由南京信息工程大学变更为南京信息工程大学 地址由210012 江苏省南京市建邺区奥体大街69号变更为210044 江苏省南京市江北新区宁六路219号
3 2018-01-26 实质审查的生效 IPC(主分类): G06K 9/62 专利申请号: 201710670157.9 申请日: 2017.08.07
4 2017-12-29 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于CNN和域自适应学习的车型识别方法,其特征在于包括如下步骤:
步骤1)分别采集自然场景下的包含多种车型的车辆图像,形成车型图像数据库,所述图像中一部分为源领域样本,源领域样本包括源领域训练样本和源领域测试样本,剩余部分为目标领域样本,目标领域样本包括目标领域训练样本和目标领域测试样本,采集车辆图像后对所述车型图像数据库中的车辆图片进行预处理操作;
步骤2)构建CNN网络模型,将所述车型图像数据库导入Alexnet网络进行预训练,更新Alexnet网络结构的权重参数Wi和偏置参数Bi,Wi表示第i层网络的权重,Bi表示第i层网络的偏置,i=1,2…m;
步骤3)在CNN网络中添加旋转不变层FCa,旋转源领域训练样本,获得源领域增强训练样本,根据所述源领域增强训练样本和第一目标函数,训练添加旋转不变层后的网络权重参数WRI={W1,W2,…,Wm,Wa,Wb}和偏置BRI={B1,B2,…,Bm,Ba,Bb};
步骤4)在旋转不变层后添加Fisher区分判别层FCc形成改进CNN网络模型,通过输入标签和第二目标函数,训练更新添加了Fisher区分判别层后的CNN网络权重参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd};
步骤5)通过所述改进CNN网络模型分别提取目标领域训练样本与源领域增强训练样本的特征图,将源领域增强训练样本和目标领域训练样本的车辆图像分别输入到经过训练的改进CNN网络模型中,分别提取源领域与目标领域的车辆图像的特征,获得相应的特征图;
步骤6)计算目标领域训练样本特征图与源领域增强训练样本特征图之间的余弦相似度,确定改进的CNN网络卷积层的共享卷积核或非共享卷积核,保留每个卷积层共享卷积核的权重和偏置,基于目标领域训练样本,使用随机梯度下降法更新卷积层非共享卷积核的权重和偏置;
步骤7)卷积目标领域训练样本图像,获得特征图,计算特征图之间的余弦相似度,获得目标领域训练样本的平均相似度矩阵,使用层次分析法聚类,每类保留一个相似特征图;
步骤8)通过所述目标领域训练样本微调整个CNN网络,最终形成车型识别网络;
步骤9)将所述目标领域测试样本中的每一个测试样本代入所述车型识别网络,车型网络根据车型识别网络的输出结果判定车辆的车型。

2.根据权利要求1所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤1)中,所述图像中一部分为源领域样本,包括CNN网络训练样本集合X={x1,x2,…,xh}和CNN网络模型测试样本集合R={γ1,γ2,…,γσ},xh、γσ分别表示源领域集合中的样本,h、σ分别表示源领域集合中样本的个数;剩余部分为目标领域样本,包括域自适应学习训练样本集合 和域自适应学习测试样本集合M={δ1,δ2,…,δτ},tj、δτ分别表示目标领域样本,T、τ分别表示目标领域集合中样本的个数。

3.根据权利要求1所述的基于CNN和域自适应学习的车型识别方法,其特征在于步骤1)中,所述预处理操作用于统一图片大小,并对图像添加标签,标注该图像所属车型类别。

4.根据权利要求3所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤2)中,Alexnet网络结构由按先后次序依次设置的五个卷积层与三个全连接层组成,Alexnet网络输出融合标签的softmax损失函数,根据softmax损失函数对权重参数Wi和偏置参数Bi进行随机梯度下降微调,所述融合标签为Alexnet网络的输出结果与所述融合标签的实际值之间的误差。

5.根据权利要求4所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤3)包括如下步骤:
3-1)设定车辆图像的源领域训练样本为X,以角度φ对每个车辆图像进行旋转变换,并添加到源领域训练样本X中,得到源领域增强训练样本χRI,χRI={X,TφX}是一组图像旋转变换的数据集,其中 K为旋转变换的次数, 表示对训练样本进行角度为
φk的旋转操作,k=1,2,3,…,K;
3-2)在CNN网络模型中位于Alexnet网络结构第七层的全连接层后添加全连接旋转不变层FCa,将Om(xu)表示为前一层FCm的输出,Oa(xu)为FCa层输出,Ob(xu)表示为softmax分类层FCb的输出,(Wa,Ba)和(Wb,Bb)分别表示FCa层和FCb层的新参数;
Oa(xu)和Ob(xu)的计算公式分别如式(1)、式(2):
Oa(xu)=κ(WaOm(xu)+Ba)  (1)
其中,κ(WaOm(xu)+Ba)=max(0,WaOm(xu)+Ba),
分别是ReLU和softmax非线性
激活函数;
设定整个CNN网络模型的增强训练样本为χRI={X,TφX},相应的标签为
表示样本xu对应的标签;新的网络参数WRI和BRI由新的目标函数学习得到,新的目标函数如式(3):
其中,λ1和λ2是权值参数,λ1和λ2均属于[0,1],M(χRI,γRI)是softmax层的损失函数,表达式如式(4);R(X,TφX)是一个旋转不变性正规化约束项,表达式如式(5),旋转前和旋转后的训练样本分别为X和TφX, 是权值衰减项,用于防止过拟合;
式(4)中, 是 和logOb(xu)之间的内积,N是X中初始训练样本的总数,K
是对于xu∈X旋转变换的总次数,
其中,Oa(xu)是FCa层的激活函数的输出, 是基于旋转后样本的FCa层激活函数的平均输出,如式(6);
所述第一目标函数如式(7):

6.根据权利要求5所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤4)包括如下步骤:
4-1)在旋转不变层FCa后添加Fisher区分判别层FCc,将旋转不变层和Fisher区分判别层组合在一起,CNN网络训练样本为每个对象类的所有真实边界框,定义为
是第e个对象类真实边界框;训练样本为χFD={xv},对应的输出结果为
通过输入结果对(χFD,γFD)训练, 表示样本xv对应的标签;
4-2)随机初始化(Wc,Bc)和(Wd,Bd),计算损失函数、辨别正则化项和第二目标函数JFD(WFD,BFD),及时更新参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd},使用随机梯度下降法优化结构;对训练样本xv∈χFD,Oa(xv)表示为前一层FCa的输出,Oc(xv)为FCc层输出,Od(xv)表示为softmax分类层FCd的输出,(Wc,Bc)和(Wd,Bd)分别表示FCc层和FCd层的新参数;
Oc(xv)和Od(xv)的计算公式分别如式(8)、式(9):
Oc(xv)=κ(WcOa(xv)+Bc)  (8)
所述第二目标目标函数如式(10)
其中,λ3和λ4是权值参数,λ3和λ4均属于[0,1],M(χFD,γFD)是softmax层的损失函数,M(χFD,γFD)表达式如式(11);F(χFD)是对CNN特征施加的辨别正则化约束,通过最小化类内间隔SW(χFD)和最大化类间间隔SB(χFD)获得,SW(χFD)、SB(χFD)的表达式分别如式(12)、式(13);
式(11)中,|χFD|是训练样本χFD的数量,
式(12)、式(13)中,ne表示第e个对象类中样本的数量,其中me和m分别表示 和χFD的平均的特征如式(14)、式(15),t表示转置运算,
辨别正则化项F(χFD)如式(16),
F(χFD)=tr(SW(χFD))-tr(SB(χFD))  (16)
式(16)中,tr(SW(χFD))和tr(SB(χFD))表示矩阵的迹运算,即矩阵主对角线元素的总和;
所述第二目标函数整合为:

7.根据权利要求4所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤5)中,假设输入特征图的集合为 输出特征图集合为
其中Rk-1和Rk分别是集合xk和zk元素的个数,k表示卷积的层数;Alexnet网络卷积层包括卷积单元和子采样单元,卷积单元与子采样单元之间的中间特征图集表示为
每个特征图 在卷积单元中计算为 表示特征图 和卷积核
之间的卷积, 表示偏置,F(x)=max(0,x)是激活函数,在卷积单元后子采样层使用固定大小的均值内核扫描每张特征图 形成对应的池化特征图
subsampling()表示下采样函数,卷积核集 相应的特征图是

8.根据权利要求7所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤6)中,将车辆图像增强训练样本χRI表示为 sω为源领域增强训练样本,
为目标领域训练样本;
将A中具有相同属性的车辆图像通过K均值聚类算法分为η类,即 每个类集
合Aμ中的车辆图像经过卷积层得到相似的特征图,每一类的平均特征图计算为|Aμ|为数据的个数,在分好的η类图像中找到与目标图像tj相符的
特征图μ(j),μ(j)与目标图像tj具有最大余弦平均相似度,计算方法为
cos(·,·)表示两个图像之间的余弦相似度;
设定估计卷积核flk是否是每个tj的共享卷积核的判定条件式如式(17);
式(17)中,ε是决策阈值,结合式(17)的判定规则为:如果 则目标领
域训练样本中的大多数样本都认为该层的flk是共享卷积核,保留flk的权重和偏置;如果则需要更新flk的权重和偏置;softmax损失函数表示为
使得特征图 逼近其对应的特征映射 从而更新非共
享卷积核集flk。

9.根据权利要求1所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤8)中,使用源领域概率与目标领域概率的比值λω作为对源领域样本sω可用性判别标准,λω使用条件概率定义如式(18)
p(sω|E)和p(sω|A)分别代表sω在源领域和目标领域中的概率,条件概率建模如式(19)、式(20),
ot(sω)和os(sω)分别表示在先前迁移的目标领域检测器和源领域检测器的sω的输出值,如果sω被跨领域正确分类,则p(sω|E)∈(0.8,1)且p(sω|A)∈(0.8,1),λω被重新定义如式(21),
如果λω≥1,sω与目标领域中的车辆具有相似的视图;在源领域中,将条件概率λω≥1时的样本和目标领域样本组成了新的样本数据集,在每次迭代过程中,计算源领域中每辆车辆的可用性并选择新的样本更新训练集,用更新的训练集再训练直到融合标签的softmax损失函数收敛,获得优化特征检测模型每一层权值参数W'和偏置参数B'。

10.根据权利要求4所述的基于CNN和域自适应学习的车型识别方法,其特征在于所述步骤9)中,所述车型识别网络的最后一个全连接层为FC8层,FC8层的输出被送至softmax分类层,所述softmax分类层的输出是一个涵盖四类车型的概率分布,输出结果中对应于某一车型的概率最大,则判定待识别车辆的输出结果为该车型,所述四类车型包括大客车、大货车、箱式小货车以及轿车。
说明书

技术领域

[0001] 本发明涉及识别技术领域,尤其涉及一种基于CNN和域自适应学习的车型识别方法。

背景技术

[0002] 交通视频图像中车辆类型的识别,作为交通监测管理的一项关键技术,长期以来受到研究人员的广泛关注。由于车辆外观复杂多样,受到背景、光强、角度等诸多因素影响,在实际应用中稳定性受到很大干扰。近年来深度学习理论快速发展,不同于传统依赖先验知识的特征提取算法,深度神经网络可在训练数据驱动下自适应地构建特征描述,具有更高的灵活性和适用性。作为实现深度学习的一项重要技术,卷积神经网络成功训练了首个深层神经网络结构,并在图像识别、语音识别等领域取得很好的效果。卷积神经网络可将原始数据如图像像素值直接作为输入,避免了传统识别算法中额外的数据预处理过程。它类似于生物神经网络的权值共享网络结构可产生生物视觉中的局部感受野效应,降低网络模型复杂度、减少权值数量,同时对平移、比例缩放、倾斜等视觉形变均具有高度的抵抗能力。
[0003] 现有的图像分类技术主要通过有监督学习的方法训练出目标类别的分类模型,即需要为各个分类模型收集足量的、高质量的有标注数据进行模型训练。这种方式适用于简单的分类任务和类别比较少的场景。但是随着分类任务的复杂化,比如类别数量多、类别专业化、特殊化等,为目标类别收集足量的有标注数据的成本大大上升。

发明内容

[0004] 本发明目的在于克服车型图像进行特征提取和对目标领域车辆图像数据样本太少、数据的标注成本较高的问题,提供了一种基于CNN和域自适应学习的车型识别方法,具体由以下技术方案实现:
[0005] 所述基于CNN和域自适应学习的车型识别方法,包括如下步骤:
[0006] 步骤1)分别采集自然场景下的包含多种车型的车辆图像,形成车型图像数据库,所述图像中一部分为源领域样本,源领域样本包括源领域训练样本和源领域测试样本,剩余部分为目标领域样本,目标领域样本包括目标领域训练样本和目标领域测试样本,采集车辆图像后对所述车型图像数据库中的车辆图片进行预处理操作;
[0007] 步骤2)构建CNN网络模型,将所述车型图像数据库导入Alexnet网络进行预训练,更新Alexnet网络结构的权重参数Wi和偏置参数Bi,Wi表示第i层网络的权重,Bi表示第i层网络的偏置,i=1,2…m;
[0008] 步骤3)在CNN网络中添加旋转不变层FCa,旋转源领域训练样本,获得源领域增强训练样本,根据所述源领域增强训练样本和第一目标函数,训练添加旋转不变层后的网络权重参数WRI={W1,W2,…,Wm,Wa,Wb}和偏置BRI={B1,B2,…,Bm,Ba,Bb};
[0009] 步骤4)在旋转不变层后添加Fisher区分判别层FCc形成改进CNN网络模型,通过输入标签和第二目标函数,训练更新添加了Fisher区分判别层后的CNN网络权重参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd};
[0010] 步骤5)通过所述改进CNN网络模型分别提取目标领域训练样本与源领域增强训练样本的特征图,将源领域增强训练样本和目标领域训练样本的车辆图像分别输入到经过训练的改进CNN网络模型中,分别提取源领域与目标领域的车辆图像的特征,获得相应的特征图;
[0011] 步骤6)计算目标领域训练样本特征图与源领域增强训练样本特征图之间的余弦相似度,确定改进的CNN网络卷积层的共享卷积核或非共享卷积核,保留每个卷积层共享卷积核的权重和偏置,基于目标领域训练样本,使用随机梯度下降法更新卷积层非共享卷积核的权重和偏置;
[0012] 步骤7)卷积目标领域训练样本图像,获得特征图,计算特征图之间的余弦相似度,获得目标领域训练样本的平均相似度矩阵,使用层次分析法聚类,每类保留一个相似特征图;
[0013] 步骤8)通过所述目标领域训练样本微调整个CNN网络,最终形成车型识别网络;
[0014] 步骤9)将所述目标领域测试样本中的每一个测试样本代入所述车型识别网络,车型网络根据车型识别网络的输出结果判定车辆的车型。
[0015] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤1)中,所述图像中一部分为源领域样本,包括CNN网络训练样本集合X={x1,x2,…,xh}和CNN网络模型测试样本集合R={γ1,γ2,…,γσ},xh、γσ分别表示源领域集合中的样本,h、σ分别表示源领域集合中样本的个数;剩余部分为目标领域样本,包括域自适应学习训练样本集合和域自适应学习测试样本集合M={δ1,δ2,…,δτ},tj、δτ分别表示目标领域样本,T、τ分别表示目标领域集合中样本的个数。
[0016] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述预处理操作用于统一图片大小,并对图像添加标签,标注该图像所属车型类别。
[0017] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤2)中,Alexnet网络结构由按先后次序依次设置的五个卷积层与三个全连接层组成,Alexnet网络输出融合标签的softmax损失函数,根据softmax损失函数对权重参数Wi和偏置参数Bi进行随机梯度下降微调,所述融合标签为Alexnet网络的输出结果与所述融合标签的实际值之间的误差。
[0018] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤3)包括如下步骤:
[0019] 3-1)设定车辆图像的源领域训练样本为X,以角度φ对每个车辆图像进行旋转变换,并添加到源领域训练样本X中,得到源领域增强训练样本χRI,χRI={X,TφX}是一组图像旋转变换的数据集,其中 K为旋转变换的次数, 表示对训练样本进行角度为φk的旋转操作,k=1,2,3,…,K;
[0020] 3-2)在CNN网络模型中位于Alexnet网络结构第七层的全连接层后添加全连接旋转不变层FCa,将Om(xu)表示为前一层FCm的输出,Oa(xu)为FCa层输出,Ob(xu)表示为softmax分类层FCb的输出,(Wa,Ba)和(Wb,Bb)分别表示FCa层和FCb层的新参数;
[0021] Oa(xu)和Ob(xu)的计算公式分别如式(1)、式(2):
[0022] Oa(xu)=κ(WaOm(xu)+Ba)  (1)
[0023]
[0024] 其中,κ(WaOm(xu)+Ba)=max(0,WaOm(xu)+Ba),
[0025] 分别是ReLU和softmax非线性激活函数;
[0026] 设定整个CNN网络模型的增强训练样本为χRI={X,TφX},相应的标签为表示样本xu对应的标签;新的网络参数WRI和BRI由新的目标函数学习得到,新的目标函数如式(3):
[0027]
[0028] 其中,λ1和λ2是权值参数,λ1和λ2均属于[0,1],M(χRI,γRI)是softmax层的损失函数,表达式如式(4);R(X,TφX)是一个旋转不变性正规化约束项,表达式如式(5),旋转前和旋转后的训练样本分别为X和TφX, 是权值衰减项,用于防止过拟合;
[0029]
[0030] 式(4)中, 是 和logOb(xu)之间的内积,N是X中初始训练样本的总数,K是对于xu∈X旋转变换的总次数,
[0031]
[0032] 其中,Oa(xu)是FCa层的激活函数的输出, 是基于旋转后样本的FCa层激活函数的平均输出,如式(6);
[0033]
[0034] 所述第一目标函数如式(7):
[0035]
[0036] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤4)包括如下步骤:
[0037] 4-1)在旋转不变层FCa后添加Fisher区分判别层FCc,将旋转不变层和Fisher区分判别层组合在一起,CNN网络训练样本为每个对象类的所有真实边界框,定义为是第e个对象类真实边界框;训练样本为χFD={xv},对应的输出结果为 通过输入结果对(χFD,γFD)训练, 表示样本xv对应的
标签;
[0038] 4-2)随机初始化(Wc,Bc)和(Wd,Bd),计算损失函数、辨别正则化项和第二目标函数JFD(WFD,BFD),及时更新参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd},使用随机梯度下降法优化结构;对训练样本xv∈χFD,Oa(xv)表示为前一层FCa的输出,Oc(xv)为FCc层输出,Od(xv)表示为softmax分类层FCd的输出,(Wc,Bc)和(Wd,Bd)分别表示FCc层和FCd层的新参数;
[0039] Oc(xv)和Od(xv)的计算公式分别如式(8)、式(9):
[0040] Oc(xv)=κ(WcOa(xv)+Bc)  (8)
[0041]
[0042] 所述第二目标目标函数如式(10)
[0043]
[0044] 其中,λ3和λ4是权值参数,λ3和λ4均属于[0,1],M(χFD,γFD)是softmax层的损失函数,M(χFD,γFD)表达式如式(11);F(χFD)是对CNN特征施加的辨别正则化约束,通过最小化类内间隔SW(χFD)和最大化类间间隔SB(χFD)获得,SW(χFD)、SB(χFD)的表达式分别如式(12)、式(13);
[0045]
[0046] 式(11)中,|χFD|是训练样本χFD的数量,
[0047]
[0048]
[0049] 式(12)、式(13)中,ne表示第e个对象类中样本的数量,其中me和m分别表示 和χFD的平均的特征如式(14)、式(15),t表示转置运算,
[0050]
[0051]
[0052] 辨别正则化项F(χFD)如式(16),
[0053] F(χFD)=tr(SW(χFD))-tr(SB(χFD))  (16)
[0054] 式(16)中,tr(SW(χFD))和tr(SB(χFD))表示矩阵的迹运算,即矩阵主对角线元素的总和;
[0055] 所述第二目标函数整合为:
[0056]
[0057] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤5)中,假设输入特征图的集合为 输出特征图集合为 其中Rk-1和Rk分别是集合xk和zk元素的个数,k表示卷积的层数;Alexnet网络卷积层包括卷积单元和子采样单元,卷积单元与子采样单元之间的中间特征图集表示为
每个特征图 在卷积单元中计算为 表示特征图 和卷积核
之间的卷积, 表示偏置,F(x)=max(0,x)是激活函数,在卷积单元后子采样层使用固定大小的均值内核扫描每张特征图 形成对应的池化特征图
subsampling()表示下采样函数,卷积核集 相应的特征图是
[0058] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤6)中,将车辆图像增强训练样本χRI表示为 sω为源领域增强训练样本, 为目标领域训练样本;
[0059] 将A中具有相同属性的车辆图像通过K均值聚类算法分为η类,即 每个类集合Aμ中的车辆图像经过卷积层得到相似的特征图,每一类的平均特征图计算为|Aμ|为数据的个数,在分好的η类图像中找到与目标图像tj相符的特征图
μ(j),μ(j)与目标图像tj具有最大余弦平均相似度,计算方法为
cos(·,·)表示两个图像之间的余弦相似度;
[0060] 设定估计卷积核 是否是每个tj的共享卷积核的判定条件式如式(17);
[0061]
[0062] 式(17)中,ε是决策阈值,结合式(17)的判定规则为:如果 则目标领域训练样本中的大多数样本都认为该层的 是共享卷积核,保留 的权重和偏置;
如果 则需要更新 的权重和偏置;softmax损失函数表示为
使得特征图 逼近其对应的特征映射 从而更新非共
享卷积核集
[0063] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤8)中,使用源领域概率与目标领域概率的比值λω作为对源领域样本sω可用性判别标准,λω使用条件概率定义如式(18)
[0064]
[0065] p(sω|E)和p(sω|A)分别代表sω在源领域和目标领域中的概率,条件概率建模如式(19)、式(20),
[0066]
[0067]
[0068] ot(sω)和os(sω)分别表示在先前迁移的目标领域检测器和源领域检测器的sω的输出值,如果sω被跨领域正确分类,则p(sω|E)∈(0.8,1)且p(sω|A)∈(0.8,1),λω被重新定义如式(21),
[0069]
[0070] 如果λω≥1,sω与目标领域中的车辆具有相似的视图;在源领域中,将条件概率λω≥1时的样本和目标领域样本组成了新的样本数据集,在每次迭代过程中,计算源领域中每辆车辆的可用性并选择新的样本更新训练集,用更新的训练集再训练直到融合标签的softmax损失函数收敛,获得优化特征检测模型每一层权值参数W'和偏置参数B'。
[0071] 所述基于CNN和域自适应学习的车型识别方法的进一步设计在于,所述步骤9)中,所述车型识别网络的最后一个全连接层为FC8层,FC8层的输出被送至softmax分类层,所述softmax分类层的输出是一个涵盖四类车型的概率分布,输出结果中对应于某一车型的概率最大,则判定待识别车辆的输出结果为该车型,所述四类车型包括大客车、大货车、箱式小货车以及轿车。
[0072] 本发明的优点如下:
[0073] (1)本发明采用基于计算机视觉技术的方法,安装维护方便,不影响路面寿命,不影响交通,而且所用设备少,具有成本低,鲁棒性好,安全性高等优点。
[0074] (2)本发明通过优化调整Alexnet网络结构和设置新的目标函数提高模型特征表示能力。
[0075] (3)本发明根据不同领域样本特征图的关联性,建立基于特征图相似性度量的域自适应迁移学习方法并对车辆特征提取初始模型进行优化更新。

实施方案

[0080] 下面结合附图对本申请进一步说明。
[0081] 如图2,本实施例提供的基于CNN(卷积神经网络)和域自适应学习的车型识别方法,在车辆车型识别上取得良好的效果,整个算法实现步骤如下:
[0082] 步骤1:车辆图像采集与预处理
[0083] 分别选取自然场景下的大客车、大货车、箱式小货车和轿车四种车型图像,总共采集4000张车辆图像,每种车型各1000张,其中2500张为源领域样本,包括CNN网络训练样本集合X={x1,x2,…,xh}和CNN网络模型测试样本集合R={γ1,γ2,…,γσ},xh、γσ分别表示源领域集合中的样本,h、σ分别表示源领域集合中样本的个数;1500张为目标领域样本,包括域自适应学习训练样本集合 和域自适应学习测试样本集合M={δ1,δ2,…,δτ},tj、δτ分别表示目标领域样本,T、τ分别表示目标领域集合中样本的个数;首先对源领域测试样本中车辆图片进行预处理,图片大小统一调整为224×224像素,并对图像添加标签,标注该图像所属车型类别,有大客车、大货车、箱式小货车和轿车四种类别;
[0084] 步骤2:将车型图像数据库导入Alexnet网络进行预训练,更新Alexnet网络结构的参数Wi和Bi,i=1,2…m;
[0085] 进一步的,Alexnet网络结构共有8层,由5个卷积层、3个全连接层组成,在每一个卷积层中包含了激励函数ReLu以及局部响应归一化(LRN)处理,然后经过降采样(pooling处理);全连接层FC6和FC7,分别使用4096个神经元,对大小为6*6特征图,进行一个全连接,也就是将6*6大小的特征图,进行卷积变为一个特征点,再进行一个dropout随机从4096个节点中丢掉一些节点信息(也就是值清0),然后就得到新的4096个神经元,全连接层FC8的输出被送到一个4-way的softmax层,其产生一个覆盖4类标签的分布。Alexnet网络模型的输入是一幅图像,规格是224*224*3(RGB图像),经过预处理变为227*227*3,使用的96个大小规格为11*11的过滤器filter,或者称为卷积核,进行特征提取,输出则是融合标签的softmax损失函数。融合标签用于表示此时网络的输出结果与标签实际值之间的误差。首先使用从图像数据集获得训练样本,根据输出的softmax损失函数对整个CNN参数进行随机梯度下降微调。在这一步中,为每次随机梯度迭代分别采样32个正样本和96个负样本(共128个样本),学习率设为0.0005,动量设定为0.9,所有层次的权重都初始设置为0.0005,从而更改Alexnet网络的权重参数Wi(i=1,2…m)和偏置参数Bi(i=1,2…m),m=8;
[0086] 步骤3:在CNN网络的第7层后添加全连接旋转不变层FCa,设计新的目标函数;旋转源领域训练样本X并将其添加到源领域训练样本X中,获得增强训练样本χRI,根据增强训练样本χRI和目标函数更新添加旋转不变层后的网络权重参数WRI={W1,W2,…,Wm,Wa,Wb}和偏置BRI={B1,B2,…,Bm,Ba,Bb};
[0087] (1)假设源领域车辆图像训练样本为X,以角度φ对每个车辆图像进行旋转变换,本专利中φ=10°,并添加到源领域训练样本X中,得到增强训练样本χRI。χRI={X,TφX}是一组图像旋转变换的数据集,其中 K为旋转变换的次数, 表示对训练样本进行角度为φk的旋转操作,k=1,2,3,…,K;
[0088] (2)在CNN网络的第7层后添加全连接旋转不变层FCa,Om(xu)表示为前一层FCm的输出,Oa(xu)为FCa层输出,Ob(xu)表示为softmax分类层FCb的输出,(Wa,Ba)和(Wb,Bb)分别表示FCa层和FCb层的新参数。
[0089] Oa(xu)和Ob(xu)的计算公式分别为:Oa(xu)=κ(WaOm(xu)+Ba)和 其中,κ(WaOm(xu)+Ba)=max(0,WaOm(xu)+Ba),
分别是ReLU和softmax非线性激活函数。
[0090] 整个CNN网络的增强训练样本为χRI={xu|xu∈X∪TφX},相应的标签为表示样本xu对应的标签。新的网络参数WRI和BRI可由一种新的目标函数学习得到,新的目标函数如下:
[0091]
[0092] 其中,λ1和λ2是权值参数,λ1和λ2均属于[0,1],第一项M(χRI,γRI)是softmax层的损失函数。定义为
[0093]
[0094] 是 和logOb(xu)之间的內积,N是X中初始训练样本的总数,K是对于xu∈X旋转变换的总次数,本专利中K=35;
[0095] 第二项R(X,TφX)是一个旋转不变性正规化约束项,旋转前和旋转后的训练样本分别为X和TφX,让它们具有相似的特征。定义正则化约束项为
[0096]
[0097] 其中Oa(xu)是FCa层的激活函数的输出, 是基于旋转后样本的FCa层激活函数的平均输出。定义为
[0098]
[0099] 第三项 是权值衰减项,用来防止过拟合。目标函数为:
[0100]
[0101] 步骤4:在上面旋转不变层后添加全连接Fisher区分判别层FCc,通过输入—结果和目标函数更新添加Fisher区分判别层后的CNN网络权重参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd};
[0102] (1)在上面的旋转不变层FCa后添加Fisher区分判别层FCc,将旋转不变层和Fisher区分判别层组合在一起,CNN网络训练样本为每个对象类的所有真实边界框,定义为是第e个对象类真实边界框。训练样本为χFD={xv},真实标签为 表示样本xv对应的标签,用成对的输入标签(χFD,γFD)训练添
加了Fisher区分判别层的CNN网络模型;
[0103] (2)随机初始化(Wc,Bc)和(Wd,Bd),计算损失函数、辨别正则化项和目标函数JFD(WFD,BFD),及时更新参数WFD={W1,W2,…,Wm,Wa,Wc,Wd}和BFD={B1,B2,…,Bm,Ba,Bc,Bd},使用随机梯度下降法优化结构;对训练样本xv∈χFD,Oa(xv)表示为前一层FCa的输出,Oc(xv)为FCc层输出,Od(xv)表示为softmax分类层FCd的输出,(Wc,Bc)和(Wd,Bd)分别表示FCc层和FCd层的新参数。
[0104] Oc(xv)和Od(xv)的计算公式分别为:
[0105] Oc(xv)=κ(WcOa(xv)+Bc)
[0106]
[0107] κ(WcOa(xv)+Bc)=max(0,WcOa(xv)+Bc),
[0108] 其中,
[0109] 分别是ReLU和softmax非线性激活函数。
[0110] 添加Fisher区分判别层的CNN网络模型目标函数
[0111]
[0112] 其中,λ3和λ4是权值参数,λ3和λ4均属于[0,1],第一项M(χFD,γFD)是softmax层的损失函数。定义为
[0113]
[0114] 是 和logOd(xv)之间的内积,|χFD|是训练样本χFD的数量,第二项F(χFD)是对CNN特征施加的辨别正则化约束,通过最小化类内间隔SW(χFD)和最大化类间间隔SB(χFD)获得。
[0115]
[0116]
[0117] C表示对象类的数目,t表示转置运算符,ne表示第e个对象类中样本的数量其中me和m分别表示 和χFD的平均的特征表示;
[0118]
[0119] 辨别正则化项F(χFD)为
[0120] F(χFD)=tr(SW(χFD))-tr(SB(χFD))
[0121] tr(·)表示矩阵的迹运算,即矩阵主对角线元素的总和;
[0122] 该步骤的目标函数整合为
[0123]
[0124] 步骤5:利用上述改进CNN网络分别提取源领域车辆和目标领域车辆的特征图;将源领域增强样本和目标领域训练样本的车辆图像分别输入到经过改进训练的CNN网络模型中,提取两个领域车辆图像的特征,获得相应的特征图。
[0125] 假设输入特征图的集合为 输出特征图集合为k-1 k k k
其中R 和R 分别是集合x和z元素的个数,k表示卷积的层数。由于
Alexnet网络卷积层包括卷积单元和子采样单元,这两单元之间的中间特征图集表示为每个特征图 在卷积单元中计算为 表
示特征图 和卷积核 之间的卷积, 表示偏置。F(x)=max(0,x)是激活函数。在卷积单元后,子采样单元使用固定大小的均值内核扫描每张特征图 形成对应的池化特征图卷积核集 相应的特征图是
[0126] 步骤6:计算目标领域训练样本与源领域增强训练样本特征图之间的余弦相似度,确定CNN网络的每个卷积层的共享卷积核或非共享卷积核,保留每个卷积层共享卷积核的权重和偏置,基于目标领域样本,使用随机梯度下降法更新卷积层非共享卷积核的权重和偏置。
[0127] 将车辆图像增强训练样本χRI表示为 即源领域增强训练样本,为目标领域训练样本。
[0128] 将A中具有相同属性的车辆图像通过K均值聚类算法分为η类,即 每个类集合Aμ中的车辆图像经过卷积层得到相似的特征图,每一类的平均特征图计算为表示Aμ类集合的平均池化特征图,|Aμ|表示数据的个数,
表示Aμ类集合中每张特征图Sμ的池化特征图,然后在分好的η类图像中找到与目标图像tj相符的特征图,μ类与目标图像tj具有最大余弦平均相似度,计算方法为
cos(·,·)表示两个图像之间的余弦相似度。之
后,通过以下规则估计卷积核 是否是每个tj的共享卷积核。
[0129]
[0130] 其中ε是决策阈值。如果 则基于目标领域B中的大多数样本都认为该层的 是共享卷积核,保留 的权重和偏置;如果 则需
要更新 的权重和偏置。损失函数表示为 T表示目标领域训练
样本的个数,让特征图 逼近其对应的特征映射 从而更新非共享卷积核集
使分类器的参数可在目标域中使用。采用随机梯度下降算法更新非共享卷积核
[0131] 步骤7:将目标领域训练样本中图像进行卷积,计算特征图之间的余弦相似度,从而获得目标领域的平均相似度矩阵,使用层次分析法(AHP)聚类,从而每一类相似特征图只保留一个,简化结构,加快检测速度。优化结构的顺序将从后向前。
[0132] 将目标领域的车辆图像,代入训练好CNN网络,获得卷积特征图,计算特征图之间的余弦相似度,并将它们组合成相似度矩阵 p和q是相应特征图的索引。然后目标领域图像的平均相似度矩阵计算为 T表示目标领域
样本的数量,根据 采用层次分析法(AHP)对特征图进行聚类。合并同层中类似的特征映射,将基于目标领域样本的CNN网络每个卷积层中相似的卷积核只保留一个,去掉每个卷积层冗余的卷积核,加快检测速度;
[0133] 假设特征图 和特征图 属于相同的类, 被 代替。根据公式,卷积核集 仅用于形成 当 被 代替时, 可以删掉。另一方面,在下一阶段与 连接的过滤器不能直接删除。
[0134]
[0135] 让 可得
[0136]
[0137] 设 可得
[0138]
[0139] 在下一阶段与 连接的卷积核可以在将其添加到新的卷积核之后被删除。
[0140] 注意,如果结合最后一个阶段的特征图,则卷积 应该被矩阵内积代替, 和是分类器权重的一部分。
[0141] 步骤8:用目标领域更新的训练样本来微调整个CNN网络。
[0142] 一些在源领域增强训练样本A中的车辆和在目标领域训练样本E中的车辆有着相似的分布特性,可以拓展为目标领域新的训练样本。使用源领域概率与目标领域概率的比值λω作为对源领域样本sω可用性判别标准。λω使用条件概率定义为
[0143]
[0144] p(sω|E)和p(sω|A)分别代表sω在源领域和目标领域中的概率,p(A)表示样本属于源领域的概率,p(E)表示样本属于目标领域的概率,条件概率建模如下
[0145]
[0146] ot(sω)和os(sω)分别表示在先前迁移的目标领域检测器和源领域检测器的sω的输出值。如果sω可以被跨领域正确分类,则p(sω|E)∈(0.8,1)和p(sω|A)∈(0.8,1),λω被重新定义为
[0147]
[0148] 如果λω≥1,sω与目标领域中的车辆具有相似的视图,并且可以帮助微调特征提取模型。在源领域A中,将条件概率λω≥1时的样本和目标领域E样本组成了新的样本数据集D,在每次迭代过程中,计算A中每辆车辆的可用性并选择新的样本更新训练集D。再用更新的训练集D再训练直到收敛之后,获得优化特征检测模型每一层权值参数W'和偏置参数B'。
[0149] 步骤9:车型识别,将目标领域测试样本集合M中的每一个测试样本代入该车型识别网络,FC8层是最后一个全连接层,全连接层的输出被送到softmax分类层,产生一个涵盖4类标签的分布;当输入车辆图像时,会得到四个概率数值,分别表示该车型为大客车、大货车、箱式小货车、轿车的概率,哪个概率最大,就判为哪类车型;输入一张车辆图像,输出四个数值,若大客车的数值最大,判定该车型为大客车;若大货车的数值最大,判定该车型为大货车;若箱式小货车的数值最大,判定该车型为箱式小货车;若轿车的数值最大,判定该车型为轿车。
[0150] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

附图说明

[0076] 图1是基于CNN和域自适应学习的车型识别方法的流程示意图。
[0077] 图2是增加旋转不变层的示意图。
[0078] 图3是添加旋转不变层和Fisher区分判别层的示意图。
[0079] 图4是域自适应学习流程图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号