首页 > 专利 > 杭州电子科技大学 > 一种基于多级特征信道优化编码的图像轮廓检测方法专利详情

一种基于多级特征信道优化编码的图像轮廓检测方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2019-01-28
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-07-12
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-04-13
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2039-01-28
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201910080334.7 申请日 2019-01-28
公开/公告号 CN109903301B 公开/公告日 2021-04-13
授权日 2021-04-13 预估到期日 2039-01-28
申请年 2019年 公开/公告年 2021年
缴费截止日
分类号 G06T7/13 主分类号 G06T7/13
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 1
权利要求数量 2 非专利引证数量 1
引用专利数量 1 被引证专利数量 0
非专利引证 1、2018.02.14耿杰“.基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别”《.自动化学报》.2016,Yong Yang.“Multifocus Image FusionBased on NSCT and Focused AreaDetection”《.IEEE Sensors Journal》.2015,;
引用专利 KR101829287B 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 范影乐、方琳灵、周涛、武薇、佘青山 第一发明人 范影乐
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 5
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
朱月芬
摘要
本发明涉及一种基于多级特征信道优化编码的图像轮廓检测方法。本发明针对输入图像I(x,y),首先基于相似度指标获取Gabor滤波器的最优尺度mopt和方向θopt,并将mopt和θopt作为NSCT的频率分离参数;然后将经过NSCT得到的轮廓子图与I(x,y)进行特征增强融合,实现对I(x,y)的初级轮廓检测;最后针对性地设计全卷积神经网络,包括由不同尺度FCN‑32s、FCN‑16s、FCN‑8s网络单元构成的特征编解码器,利用特征编码器的卷积与池化模块实现网络参数的主动学习,利用特征解码器的反卷积与上采样模块得到与I(x,y)对应的图像轮廓掩模图,实现多级特征信道的优化编码,完成图像轮廓的高效准确检测。
  • 摘要附图
    一种基于多级特征信道优化编码的图像轮廓检测方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-04-13 授权
2 2019-07-12 实质审查的生效 IPC(主分类): G06T 7/13 专利申请号: 201910080334.7 申请日: 2019.01.28
3 2019-06-18 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于多级特征信道优化编码的图像轮廓检测方法,其特征在于,该方法具体包括以下步骤:
步骤1:获取输入图像I(x,y)的初级轮廓响应;
首先计算输入图像I(x,y)的Gabor滤波器响应,结果记为 如式(1)~(4)所
示;
式中: 表示图像I(x,y)经过Gabor滤波器在尺度m,方向θ=nπ/K上得到的
Gabor特征信息;σx,σy分别表示Gabor小波基函数沿x轴和y轴的标准偏差;ω为高斯函数的复调制频率;以ψ(x,y)为母小波,通过对其进行尺度和旋转变换,得到Gabor滤波器ψm,n(x,y);其中,u,v是ψm,n(x,y)的模板尺寸;m=0,...,S‑1,n=0,...,K‑1,S和K分别表示尺度数和方向数;α为ψ(x,y)的尺度因子,式中:α>1;
基于相似度指标SSIM,计算Gabor滤波器对应的最优尺度mopt和方向θopt,如式(5)~(8)所示;
mark
其中 表示滤波器响应 与已知的轮廓标记图像I 之间的相似
度 ,当 取 极大 值 时 ,获 得最 优 尺度 mo p t和 方向θop t ;
mark
和 分别表示 与I 之间在亮度、对比度
mark
和结构上的定量相似性度量;uGabor、umark分别表示图像 和I 的亮度均值,δGabor、δmarkmark mark
分别表示图像 和I 的亮度标准差, 分别表示图像 和I 的亮度方
mark
差,δG,m代表图像 和I 的亮度协方差;为了避免由于式(6)~(8)中的各项分母接近零值时所引起的系统不稳定,C1、C2和C3设置为某个正常数,小于滤波器响应 亮度均值的
3%;
将mopt和θopt作为非下采样轮廓波变换的频率分离参数,非下采样轮廓波变换对图像I(x,y)分解得到轮廓子图 由于非下采样轮廓波变换分解过程尺寸保持不变,因此将 与I(x,y)直接进行像素级的特征增强融合操作,最终获得输入图像I(x,y)的初级轮廓响应E(x,y),如式(9)和(10)所示;
式中, 表示尺度mopt和方向θopt参数条件下的非下采样轮廓波变换,
表示对应的非下采样轮廓波变换轮廓子图;t表示轮廓子图 的亮度均值;max表示取最大值函数,下同;
步骤2:将步骤1获得的初级轮廓响应E(x,y),传输至全卷积神经网络,获得分别由FCN‑
5 4 3
32S、FCN‑16S、FCN‑8S网络单元训练得到的热图F ,F ,F ;全卷积神经网络分为特征编码器和特征解码器两部分,整个网络包含8个卷积块,5个最大池化层,5个上采样和2个卷积层;
具体结构如下:

1.特征编码器
以VGG‑16作为基础网络进行全卷积神经网络的优化改造;为实现网络计算速度的提高,增强泛化能力,在卷积块(3×3、1×1、3×3)结构中,每两个3×3的卷积核中加入1×1卷积核;为加强学习图像特征的非线性和平移不变性,每层卷积模块后面加入最大池化层;同时E(x,y)经过池化层Max pool5处理后,尺寸变成I(x,y)的1/32,记为 表示经过FCN‑
32S网络单元训练后输出的特征图;E(x,y)经过池化层Max pool4和卷积层1×1,尺寸变成I(x,y)的1/16,记为 表示经过FCN‑16S网络单元训练后输出的特征图;同理,E(x,y)经过池化层Max pool3和卷积层1×1,尺寸变成I(x,y)的1/8,记为 表示经过FCN‑8S网络单元训练后输出的特征图;其中每个池化层输出利用Relu激活函数实现稀疏编码功能;特征编码器包括如下十三层结构,其中步长stride均为1:
第一层,卷积层CONV1‑1,通道个数8,卷积核大小3×3;CONV1‑2,通道个数8,卷积核大小为3×3;
第二层,最大池化层Max pool1,池化区域大小为2×2;
第三层,卷积层CONV2‑1,通道个数16,卷积核大小为3×3;CONV2‑2,通道个数16,卷积核大小为1×1;CONV2‑3,通道个数16,卷积核大小为3x3;
第四层,最大池化层Max pool2,池化区域大小为2×2;
第五层,卷积层CONV3‑1,通道个数32,卷积核大小为3×3;CONV3‑2,通道个数32,卷积核大小为1×1;CONV3‑3,通道个数32,卷积核大小为3×3;
第六层,最大池化层Max pool3,池化区域大小为2×2;
第七层,卷积层CONV4‑1,通道个数64,卷积核大小为3×3;CONV4‑2,通道个数64,卷积核大小为1×1;CONV4‑3,通道个数64,卷积核大小为3×3;
第八层,最大池化层Max pool4,池化区域大小为2×2;
第九层,卷积层CONV5‑1,通道个数128,卷积核大小为3×3;CONV5‑2,通道个数128,卷积核大小为1×1;CONV5‑3,通道个数128,卷积核大小为3×3;
第十层,最大池化层Max pool5,池化区域大小为2×2;
第十一层,卷积层CONV6,通道个数256,卷积核大小为1×1;
第十二层,卷积层CONV7,通道个数256,卷积核大小为1×1;
第十三层,卷积层CONV8,通道个数1,卷积核大小为1×1;

2.特征解码器
初级轮廓响应E(x,y)经过特征编码不断缩小为原来的1/8,1/16,1/32,获得的特征图分辨率低,因此加入特征解码器,对低分辨率的特征图进行双线性上采样操作;对于经过32
5
倍下采样的图像 利用32倍双线性上采样得到与I(x,y)一样大小的热图,记为F ;在池化层Max pool4后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像 同时把32倍下采样的图像 进行两倍上采样,所得结果与 对应元素相加,再利用16倍双线
4
性上采样得到与I(x,y)一样大小的热图,记为F ;在池化层Max pool3后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像 同时把16倍下采样的图像 进行两倍上采样,所得结果与 对应元素相加,再利用8倍双线性上采样得到与I(x,y)一样大小的热
3
图,记为F;
5 4 3
步骤3:对步骤2获得的热图F ,F ,F ,利用max函数取各像素上的最大像素值,融合得到mark
图像轮廓掩模图F,再经过Relu激活函数作用,与已知的轮廓标记图像I 进行损失运算,结果记为loss,并采用随机梯度下降,不断迭代更新各个网络层的参数,当loss值小于阀值ε时训练结束,ε设为训练图像样本像素总数的1~3%,获得训练后的全卷积神经网络;
步骤4:将待检测图像经过步骤1~3所构建的Gabor滤波器、非下采样轮廓波变换以及训练后的全卷积神经网络,得到图像轮廓掩模图,与待检测图像进行点乘操作,最终获得图像轮廓检测结果。
说明书

技术领域

[0001] 本发明属于机器学习和图像处理领域,具体涉及一种基于多级特征信道优化编码的图像轮廓检测方法。

背景技术

[0002] 轮廓信息对于图像数据的分割和识别具有重要意义,它将实现对图像目标区域的快速勾勒,有助于在有限特征维度上对图像进行分析和理解,因此图像轮廓自动检测是机器学习和图像处理领域的重要研究内容之一。基于区域梯度信息的传统检测算法通常考虑图像的线性滤波和局部方向性特征,例如基于图像局部能量方法,但它们一般并不涉及主动轮廓、纹理边缘以及区域边界等重要信息。目前基于深度学习的轮廓检测方法受到了关注,通过深度网络结构模拟人类视觉感知系统对视觉信息的处理过程,主动进行特征学习,有效地简化了原本复杂的特征提取和数据重建过程,但是这类方法普遍存在以下问题:(1)直接通过神经网络进行图像的分割和融合,会导致分割结果的不精细和特征信息的泛化。(2)未能将深度学习与传统基于特征的方法相结合,检测性能严重依赖于训练样本的数量和质量,对包括纹理背景在内的冗余信息过滤能力较弱。(3)部分方法虽然考虑了多源特征的提取问题,例如基于Gabor‑NSCT和脉冲神经网络的SAR图像分割,它涉及了Gabor和NSCT在多尺度下的多源特征提取,然后将提取的Gabor特征和NSCT特征分别作为两个脉冲神经网络的输入进行训练,因此分割性能将严重依赖于Gabor和NSCT对于图像内容的感知能力,并没有充分利用多尺度下的多源特征信号融合编码能力,另外脉冲神经网络从模型层次和结构上也并不属于深度学习的范畴。例如还有基于Gabor‑NSCT和视觉机制的图像轮廓提取方法,它同样涉及不同尺度下的多源特征提取,但考虑到视觉机制模型的运算能力,通常采用一种简化的融合编码方式,本质上缺失了以卷积神经网络训练为代表的学习过程,因此并不能真正体现多源特征在表达轮廓上的有效性。

发明内容

[0003] 本发明针对现有技术的不足,提出一种基于多级特征信道优化编码的图像轮廓检测方法。
[0004] 虽然NSCT变换在表征图像细节方面具有优越的性能,但其通常采取在尺度和方向上对分解结果进行某种加权方式下的优化编码,处理过程中加权参数的人为设定使得检测结果具有较大的不确定性。考虑到Gabor滤波器在感知图像目标尺度和方向时的有效性,因此本发明针对输入图像I(x,y),首先计算Gabor滤波器对应的最优尺度mopt和方向θopt,并将获得的mopt和θopt作为NSCT变换的频率分离参数,改变了传统上需要对Gabor和NSCT遍历所有尺度和方向的冗余融合模式;另外本发明将NSCT得到的轮廓子图与I(x,y)进行特征增强融合,有助于高效准确获得I(x,y)的初级轮廓响应E(x,y);接着将E(x,y)传入至由FSC‑32S、FSC‑16S、FSC‑8S网络单元构成的全卷积神经网络,利用特征编码器的卷积与池化模块实现网络参数的主动学习,通过特征解码器的反卷积与上采样模块得到与I(x,y)对应的图像轮廓掩模图,并与I(x,y)进行点乘操作,最终实现图像轮廓的准确检测。具体包括如下步骤:
[0005] 步骤1:获取输入图像I(x,y)的初级轮廓响应。首先计算输入图像I(x,y)的Gabor滤波器响应,结果记为 如式(1)~(4)所示。
[0006]
[0007]
[0008]
[0009]
[0010] 式中: 表示图像I(x,y)经过Gabor滤波器在尺度m,方向θ=nπ/K上得到的Gabor特征信息;σx,σy分别表示Gabor小波基函数沿x轴和y轴的标准偏差;ω为高斯函数的复调制频率;以ψ(x,y)为母小波,通过对其进行尺度和旋转变换,得到Gabor滤波器ψm,n(x,y);其中,u,v是ψm,n(x,y)的模板尺寸;m=0,...,S‑1,n=0,...,K‑1,S和K分别表示尺度数和方向数;α为ψ(x,y)的尺度因子,式中:α>1。
[0011] 基于相似度指标SSIM,计算Gabor滤波器对应的最优尺度mopt和方向θopt,如式(5)~(8)所示。
[0012]
[0013]
[0014]
[0015]
[0016] 其中 表示滤波器响应 与已知的轮廓标记图像Imark之间的相似度 ,当 取极大值时 ,获得最优尺度mo pt和方向θop t;
mark
和 分别表示 与I 之间在亮度、对比度和
mark
结构上的定量相似性度量;uGabor、umark分别表示图像 和I 的亮度均值,δGabor、δmark分mark mark
别表示图像 和I 的亮度标准差, 分别表示图像 和I 的亮度方差,
mark mark
δG,m代表图像 和I 的亮度协方差;I 图像的轮廓区域像素为1,其余像素为0;为了避免由于式(6)~(8)中的各项分母接近零值时所引起的系统不稳定,C1、C2和C3设置为某个正常数,小于滤波器响应 亮度均值的3%。
[0017] 将mopt和θopt作为NSCT的频率分离参数,NSCT对图像I(x,y)分解得到轮廓子图由于NSCT分解过程尺寸保持不变,因此将 与I(x,y)直接进行像素级的特征增强融合操作,最终获得输入图像I(x,y)的初级轮廓响应E(x,y),如式(9)和(10)所示。
[0018]
[0019]
[0020] 式中, 表示尺度mopt和方向θopt参数条件下的非下采样轮廓波变换,表示对应的NSCT轮廓子图;t表示轮廓子图 的亮度均值;max表示取最大值函数,下同。
[0021] 步骤2:将步骤1获得的初级轮廓响应E(x,y),传输至全卷积神经网络,获得分别由5 4 3
FCN‑32S、FCN‑16S、FCN‑8S网络单元训练得到的热图F ,F ,F 。全卷积神经网络分为特征编码器和特征解码器两部分,整个网络包含8个卷积块,5个最大池化层,5个上采样和2个卷积层。具体结构如下:
[0022] 1.特征编码器
[0023] 以VGG‑16作为基础网络进行全卷积神经网络的优化改造。为实现网络计算速度的提高,增强泛化能力,在卷积块(3×3、1×1、3×3)结构中,每两个3×3的卷积核中加入1×1卷积核;为加强学习图像特征的非线性和平移不变性,每层卷积模块后面加入最大池化层;同时E(x,y)经过池化层Max pool5处理后,尺寸变成I(x,y)的1/32,记为 表示经过FCN‑32S网络单元训练后输出的特征图;E(x,y)经过池化层Max pool4和卷积层1×1,尺寸变成I(x,y)的1/16,记为 表示经过FCN‑16S网络单元训练后输出的特征图;同理,E(x,y)经过池化层Max pool3和卷积层1×1,尺寸变成I(x,y)的1/8,记为 表示经过FCN‑8S网络单元训练后输出的特征图。其中每个池化层输出利用Relu激活函数实现稀疏编码功能。特征编码器包括如下十三层结构,其中步长stride均为1:
[0024] 第一层,卷积层CONV1‑1,通道个数8,卷积核大小3×3;CONV1‑2,通道个数8,卷积核大小为3×3;
[0025] 第二层,最大池化层Max pool1,池化区域大小为2×2;
[0026] 第三层,卷积层CONV2‑1,通道个数16,卷积核大小为3×3;CONV2‑2,通道个数16,卷积核大小为1×1;CONV2‑3,通道个数16,卷积核大小为3x3;
[0027] 第四层,最大池化层Max pool2,池化区域大小为2×2;
[0028] 第五层,卷积层CONV3‑1,通道个数32,卷积核大小为3×3;CONV3‑2,通道个数32,卷积核大小为1×1;CONV3‑3,通道个数32,卷积核大小为3×3;
[0029] 第六层,最大池化层Max pool3,池化区域大小为2×2;
[0030] 第七层,卷积层CONV4‑1,通道个数64,卷积核大小为3×3;CONV4‑2,通道个数64,卷积核大小为1×1;CONV4‑3,通道个数64,卷积核大小为3×3;
[0031] 第八层,最大池化层Max pool4,池化区域大小为2×2;
[0032] 第九层,卷积层CONV5‑1,通道个数128,卷积核大小为3×3;CONV5‑2,通道个数128,卷积核大小为1×1;CONV5‑3,通道个数128,卷积核大小为3×3;
[0033] 第十层,最大池化层Max pool5,池化区域大小为2×2;
[0034] 第十一层,卷积层CONV6,通道个数256,卷积核大小为1×1;
[0035] 第十二层,卷积层CONV7,通道个数256,卷积核大小为1×1;
[0036] 第十三层,卷积层CONV8,通道个数1,卷积核大小为1×1;
[0037] 2.特征解码器
[0038] 初级轮廓响应E(x,y)经过特征编码不断缩小为原来的1/8,1/16,1/32倍,获得的特征图分辨率低,因此加入特征解码器,对低分辨率的特征图进行双线性上采样操作。对于经过32倍下采样的图像 利用32倍双线性上采样得到与I(x,y)一样大小的热图,记为5
F ;在池化层Max pool4后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像同时把32倍下采样的图像 进行两倍上采样,所得结果与 对应元素相加,再利
4
用16倍双线性上采样得到与I(x,y)一样大小的热图,记为F;在池化层Max pool3后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像 同时把16倍下采样的图像进行两倍上采样,所得结果与 对应元素相加,再利用8倍双线性上采样得到与I(x,y)一
3
样大小的热图,记为F。
[0039] 步骤3:对步骤2获得的热图F5,F4,F3,利用max函数取各像素上的最大像素值,融合mark得到图像轮廓掩模图F,再经过Relu激活函数作用,与已知的轮廓标记图像I 进行损失运算,结果记为loss,并采用随机梯度下降,不断迭代更新各个网络层的参数,当loss值小于阀值ε时训练结束,ε设为训练图像样本像素总数的1~3%,获得训练后的全卷积神经网络。
[0040] 步骤4:将待检测图像经过步骤1~3所构建的Gabor滤波器,非下采样轮廓波变换以及训练后的全卷积神经网络,得到图像轮廓掩模图,与待检测图像进行点乘操作,最终获得图像轮廓检测结果。
[0041] 本发明具有的有益效果为:
[0042] 1、提出一种多级特征信道优化编码的初级轮廓响应新方法。由于NSCT变换能够模拟外膝体LGN在视觉信息处理中的频域分离作用,但在图像分解过程中加权参数的人为设定使得检测结果具有较大的不确定性。考虑到Gabor滤波器响应特性与人类的视觉系统类似,对光照、姿态具有一定的鲁棒性,有优质的空间局部性和方向选择性。因此本发明提出对每张图片都寻找基于Gabor滤波器响应的最优尺度和方向,然后将它们作为NSCT设定频率分离参数的直接依据;将NSCT得到的轮廓子图与原图像进行特征增强融合,有助于高效准确的获得初级轮廓响应。构建一种多级特征信道优化编码的初级轮廓响应新方法,获得低维且冗余度低的图像特征信道,对于缓解网络压力,降低卷积神经网络计算复杂度,提高网络的训练效率具有重要的应用前景。
[0043] 2、构建一种全卷积神经网络进行多尺度训练,对FCN‑32S、FCN‑16S、FCN‑8S在热图表达中的平滑性和精细性等特性进行充分互补。将网络分为特征编码器和特征解码器两部分,从端到端不需要对目标图像进行区域上的选择,特征编码器通过卷积和池化操作,不断主动学习特征参数,特征图按比例减小,特征解码器通过反卷积与上采样过程保证提取特征的二维特性,并且得到与原图像同一尺寸的热图来表示图像的主要轮廓,实现对每个像素预测,同时保留原图像的空间信息。

实施方案

[0047] 下面结合附图来说明本发明的具体实施过程,如图1所示,
[0048] 步骤1:获取输入图像I(x,y)的初级轮廓响应。首先计算输入图像I(x,y)的Gabor滤波器响应,结果记为 如式(11)~(14)所示。
[0049]
[0050]
[0051]
[0052]
[0053] 式中: 表示图像I(x,y)经过Gabor滤波器在尺度m,方向θ=nπ/K上得到的Gabor特征信息;σx,σy分别表示Gabor小波基函数沿x轴和y轴的标准偏差;ω为高斯函数的复调制频率;以ψ(x,y)为母小波,通过对其进行尺度和旋转变换,得到Gabor滤波器ψm,n(x,y);其中,u,v是ψm,n(x,y)的模板尺寸;m=0,...,S‑1,n=0,...,K‑1,S和K分别表示尺度数和方向数;α为ψ(x,y)的尺度因子,式中:α>1。
[0054] 基于相似度指标SSIM,计算Gabor滤波器对应的最优尺度mopt和方向θopt,如式(15)~(18)所示。
[0055]
[0056]
[0057]
[0058]mark
[0059] 其中 表示滤波器响应 与已知的轮廓标记图像I 之间的相似度,当 取极大值时 ,获 得最优尺度mopt和方向θo pt;
mark
和 分别表示 与I 之间在亮度、对比度和
mark
结构上的定量相似性度量;uGabor、umark分别表示图像 和I 的亮度均值,δGabor、δmark分mark mark
别表示图像 和I 的亮度标准差, 分别表示图像 和I 的亮度方差,
mark mark
δG,m代表图像 和I 的亮度协方差;I 图像的轮廓区域像素为1,其余像素为0;为了避免由于式(16)~(18)中的各项分母接近零值时所引起的系统不稳定,C1、C2和C3设置为某个正常数,小于滤波器响应 亮度均值的3%。
[0060] 将mopt和θopt作为NSCT的频率分离参数,得到轮廓子图 由于NSCT对图像I(x,y)分解后的尺寸保持不变,因此将 与I(x,y)直接进行像素级的特征增强融合操作,最终获得输入图像I(x,y)的初级轮廓响应E(x,y),如式(19)和(20)所示。
[0061]
[0062]
[0063] 式中, 表示尺度mopt和方向θopt参数条件下的非下采样轮廓波变换,表示对应的NSCT轮廓子图;t表示轮廓子图 的亮度均值;max表示取最大值函数,下同。
[0064] 步骤2:如图2所示,构建全卷积神经网络,获得分别由FCN‑32S、FCN‑16S、FCN‑8S网5 4 3
络单元训练得到的热图F ,F,F。全卷积神经网络分为特征编码器和特征解码器两部分,整个网络包含8个卷积块,5个最大池化层,5个上采样和2个卷积层。具体结构如下:
[0065] 1.特征编码器
[0066] (1)初级轮廓响应E(x,y)经过3×3‑8、3×3‑8的CONV1卷积块,再进行2×2的最大1
池化,和Relu激活函数作用得到图像F1 /2,如式(21)所示,表示I(x,y)经过卷积‑Max pool1,尺寸变成1/2。
[0067]
[0068] 其中,conv1()表示第一层的卷积操作;pool1()表示第一次最大池化操作;Relu()表示稀疏结果的激活函数,下同。
[0069] (2)将 经过3×3‑16、1×1‑16、3×3‑16的CONV2卷积块,再进行2×2的最大池化,后接加入调节特征图像通道个数的1×1的预测卷积,和Relu激活函数作用得到图像如式(22)所示,表示图像 经过卷积‑Max pool2,尺寸变成I(x,y)的1/4。
[0070]
[0071] 其中,conv2()表示第二层卷积操作;pool2()表示第二次最大池化操作。
[0072] (3)将 经过3×3‑32、1×1‑32、3×3‑32的CONV3卷积块,再进行2×2的最大池化,经过Relu激活函数作用得到图像 如式(23)所示,表示图像 经过卷积块‑Max pool3‑预测卷积,尺寸变成I(x,y)的1/8。
[0073]
[0074] 其中,conv3()表示第三层卷积操作;pool3()表示第三次最大池化操作,conv1×1()表示1×1的卷积核,下同。
[0075] (4)将 经过3×3‑64、1×1‑64、3×3‑64的CONV4卷积块,再进行2×2的最大池化,后接加入调节特征图像通道个数的1×1的预测卷积,和Relu激活函数作用得到图像如式(24)所示,表示图像 经过卷积块‑Max pool4‑预测卷积,尺寸变成I(x,y)的1/16。
[0076]
[0077] 其中,conv4()表示第四层卷积操作;pool4()表示第四次最大池化操作。
[0078] (5)将 经过3×3‑64、1×1‑64、3×3‑64的CONV5卷积块,再进行2×2的最大池化,和Relu激活函数作用得到图像 如式(25)所示,表示图像 经过卷积‑Max pool4,尺寸变成I(x,y)的1/32。
[0079]
[0080] 其中,conv5()表示第五层卷积操作;pool5()表示第五次最大池化操作。
[0081] 2.特征解码器5
[0082] (1)图像 利用32倍的双线性上采样得到与I(x,y)一样大小的热图,记为F。如式(26)所示。
[0083]
[0084] 其中,bilinear()表示双线性上采样操作,下同。
[0085] (2)在池化层Max pool4后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像 同时把32倍下采样的图像 进行两倍上采样,所得结果与 对应元素相4
加,再利用16倍双线性上采样得到与I(x,y)一样大小的热图,记为F,如式(27)所示。
[0086]
[0087] 其中,sum()表示矩阵相加操作,下同。
[0088] (3)在池化层Max pool3后加入调节特征图像通道个数的预测卷积层1×1,输出得到图像 同时把16倍下采样的图像 进行两倍上采样,所得结果与 对应元素相加,3
再利用8倍双线性上采样得到与I(x,y)一样大小的热图,记为F,如式(28)所示。
[0089]
[0090] 步骤3:对步骤2获得的热图F5,F4,F3,利用max函数取各像素上的最大像素值,融合得到图像轮廓掩模图F,如式(29)所示。再经过Relu激活函数作用,与已知人工标记轮廓的训练图像进行损失运算,结果记为loss,如式(30)所示。并采用随机梯度下降(Stochastic gradient descent),不断迭代更新各个网络层的参数,当loss值小于阀值ε时训练结束,ε设为训练图像样本像素总数的1~3%,获得训练后的全卷积神经网络。
[0091] F=max(F5,F4,F3)  (29)
[0092]
[0093] 其中,M、N为训练图像的行列数,Fi,j表示图像轮廓掩模图F在坐标(i,j)上的像素mark值, 为已知的轮廓标记图像I 在坐标(i,j)上的像素值。
[0094] 步骤4:将待检测图像经过步骤1~3所构建的Gabor滤波器,非下采样轮廓波变换以及训练后的全卷积神经网络,得到图像轮廓掩模图,与待检测图像进行点乘操作,最终获得图像轮廓检测结果。

附图说明

[0044] 为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
[0045] 图1为本发明的图像轮廓检测流程图;
[0046] 图2为本发明的全卷积神经网络结构框图;
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号