首页 > 专利 > 杭州电子科技大学 > 一种基于分频视觉机制的轮廓特征提取方法专利详情

一种基于分频视觉机制的轮廓特征提取方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2020-01-16
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2020-06-26
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2023-02-03
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2040-01-16
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN202010049312.7 申请日 2020-01-16
公开/公告号 CN111222518B 公开/公告日 2023-02-03
授权日 2023-02-03 预估到期日 2040-01-16
申请年 2020年 公开/公告年 2023年
缴费截止日
分类号 G06V10/44G06V10/80 主分类号 G06V10/44
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 2 被引证专利数量 0
非专利引证 1、1987.06.04Mingming Tan et al..Image-DehazingMethod Based on the Fusion Coding ofContours and Colors《.IEEE Access》.2019,第07卷郎波等.利用多层视觉网络模型进行图像局部特征表征的方法《.计算机辅助设计与图形学学报》.2015,(第04期),郭金朋等.引入视通路视觉响应与融合模型的轮廓检测《.中国图象图形学报》.2018,(第02期),;
引用专利 US2013011029A、WO8703398A 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 范影乐、方琳灵、武薇 第一发明人 范影乐
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
杨舟涛
摘要
本发明涉及一种基于分频视觉机制的轮廓特征提取方法。首先利用高斯函数模拟视通路中外侧膝状体经典感受野对视觉信息的分频作用;然后利用空间频率和朝向调谐之间的全局性抑制作用,并引入低对比度加强后的视觉特征,构建一种朝向敏感以及低对比度适应的感受野,通过外侧膝状体非经典感受野中心‑外周信息差异的检测,从而实现对外周纹理的选择性抑制;最后将纹理抑制后的轮廓信息并行传递至初级视皮层区,实现分频视觉信息流的快速融合编码,以达到轮廓特征提取的快速调节和完整性融合。
  • 摘要附图
    一种基于分频视觉机制的轮廓特征提取方法
  • 说明书附图:图1
    一种基于分频视觉机制的轮廓特征提取方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2023-02-03 授权
2 2020-06-26 实质审查的生效 IPC(主分类): G06K 9/46 专利申请号: 202010049312.7 申请日: 2020.01.16
3 2020-06-02 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于分频视觉机制的轮廓特征提取方法,其特征在于,该方法具体包括以下步骤:
步骤1:针对输入图像I(x,y),引入如式(1)所示的高斯函数 模拟LGN经
典感受野所具有的频域响应特性;
其中
利用高斯函数 的尺度参数σj作为LGN经典感受野对视觉信息流的分频
特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同; 表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
针对某个尺度参数σj,计算第i个朝向角 的LGN经典感受野分频激励响应
如式(3)所示;
式(3)中默认γ=0.5,*表示卷积运算;
步骤2:在步骤1所获得的 基础上,提取f个空间频率调谐通道的初级轮
廓响应E(x,y,σj);具体实现过程如下:
针对步骤1所获得的激励响应 在固定某个尺度参数σj情况下,使 遍
历Nθ个不同朝向角,采用最大值策略,选取 的最大值,从而获得初级轮廓响应E(x,y,σj),如式(4)所示;同时记录各尺度参数σj情况下 最大值所对应的朝向角,记为θCRF(j);
其中max表示取最大值函数,下同;
步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下 最大值所对应的朝向角为θNCRF
(j);定义第j条空间频率调谐通道上LGN非经典感受野中心‑外周的抑制强度如式(7)所示;
式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算;
步骤4:针对步骤2和步骤3分别获取的θCRF(j)和θNCRF(j),计算两者的朝向差异特性,得到侧抑制强度
首先分别计算朝向差异△θCRF‑NCRF(j),如式(8)所示;
再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示;
其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同;
计算得到反映朝向差异特性的侧抑制强度 如式(10)所示;
步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y);
首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示;
然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示;
接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示;
其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示;
其中Cc表示修正阈值,
步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性 将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示;
再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示;
计算得到反映低对比度差异特性的侧抑制强度 如式(17)所示,其中上标j的
含义同前;
步骤7:针对步骤4和步骤6分别得到的 和 调制空间频率调谐通
j j
道上的特征抑制强度E_Inh (x,y),最终得到图像纹理抑制后的轮廓信息r (x,y),如式(18)~(20)所示;
j j
r(x,y)=max(E(x,y;σj)‑α·E_Inh(x,y),0)    (18)
式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3;
j
步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的r (x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示;
其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],按式(22)进行设置;
说明书

技术领域

[0001] 本发明属于生物视觉和图像处理领域,具体涉及一种基于分频视觉机制的轮廓特征提取方法。

背景技术

[0002] 轮廓检测是从杂乱场景中快速地提取人类感兴趣区域的过程,如何在较低漏检率的情况下实现伪轮廓和纹理信息的去除,对于降低后续视通路特征提取的难度,并进一步提高轮廓检测性能具有重要意义。轮廓检测的难点主要体现在:(1)在不同光照或视角下,视觉信息加工机理存在差异;(2)在保留轮廓信息的前提下,尽可能多的去除背景纹理信息,通常是相互矛盾的。
[0003] 随着生理实验手段的发展以及数据分析技术在神经科学中的运用,对于视觉信息处理机制的研究受到广泛的关注。有研究基于生物视觉的中心‑周围相互作用特性,构建了各向同性和各向异性的抑制模型,利用二维Gabor函数来表征初级视皮层(V1)感受野轮廓方向的选择性,并引入高斯差(Difference of Gaussian,DoG)函数来模拟外周环绕的侧抑制作用;还有研究进一步提出了外侧膝状体(LGN)感受野组合模型,揭示简单细胞的定向抑制和对比度不变性;此外还有研究视通路中多个视觉特征提取和融合,例如朝向、亮度、对比度三个特征策略组合,实现选择性的纹理抑制,凸显主体轮廓;例如也有研究利用LGN细胞的频域敏感特性,提出了一种基于nCRF抑制和X‑Y信息通道的生物学启发模型。需要指出的是,上述算法仅考虑到视通路中单一感受野的生理特性,忽略了视觉信息传递过程的分频处理机制,而越来越多的实验证明视通路上存在着不同功能的感受野,它们之间的电生理活动不仅采用串行关联,还采用分频并行处理的模式;此外目前的研究大都没有关注各个层次间感受野的视觉特征,尤其是LGN感受野的时空频率调谐特征对轮廓快速检测的作用。

发明内容

[0004] 本发明为解决上述存在的问题,提出一种基于分频视觉机制的轮廓特征提取方法。该方法通过模拟LGN感受野的频域响应特性和V1区的分频视觉信息流融合机制来实现轮廓特征提取。首先模拟LGN经典感受野对视觉信息流的分频特性,引入视觉信息中若干个独立的空间频域调谐作用;然后利用LGN细胞的朝向与低对比度特征的选择性抑制机制,实现非经典感受野的全局调节特性;最后提出分频视觉信息流的融合模型,用于表征初级视皮层中的上下文整合机制,实现视觉信息流的并行处理以及关联性传递,最终达到快速响应和完整性融合的轮廓特征提取。本发明提出一种基于分频视觉机制的轮廓特征提取方法,包括如下步骤:
[0005] 步骤1:针对输入图像I(x,y),引入如式(1)所示的高斯函数 模拟LGN经典感受野所具有的频域响应特性。
[0006]
[0007] 其中
[0008]
[0009] 利用高斯函数 的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同。 表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
[0010] 针对某个尺度参数σj,计算第i个朝向角 的LGN经典感受野分频激励响应如式(3)所示。
[0011]
[0012] 式(3)中默认γ=0.5,*表示卷积运算。
[0013] 步骤2:在步骤1所获得的 基础上,提取f个空间频率调谐通道的初级轮廓响应E(x,y,σj);具体实现过程如下:
[0014] 针对步骤1所获得的激励响应 在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取 的最大值,从而获得初级轮
廓响应E(x,y,σj),如式(4)所示。同时记录各尺度参数σj情况下 最大值所对应的朝向角,记为θCRF(j)。
[0015]
[0016] 其中max表示取最大值函数,下同。
[0017] 步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下 最大值所对应的朝向角为θNCRF(j)。定义第j条空间频率调谐通道上LGN非经典感受野中心‑外周的抑制强度如式(7)所示。
[0018]
[0019]
[0020]
[0021] 式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算。
[0022] 步骤4:针对步骤2和步骤3分别获取的θCRF(j)和θNCRF(j),计算两者的朝向差异特性,得到侧抑制强度
[0023] 首先分别计算朝向差异△θCRF‑NCRF(j),如式(8)所示。
[0024]
[0025] 再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示。
[0026]
[0027] 其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同。
[0028] 计算得到反映朝向差异特性的侧抑制强度 如式(10)所示;
[0029]
[0030] 步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y)。
[0031] 首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示。
[0032]
[0033] 然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示。
[0034]
[0035] 接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示。
[0036]
[0037] 其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
[0038] 最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示。
[0039]
[0040] 其中Cc表示修正阈值,
[0041] 步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性 ,将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示。
[0042]
[0043] 再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示。
[0044]
[0045] 计算得到反映低对比度差异特性的侧抑制强度 如式(17)所示,其中上标j的含义同前。
[0046]
[0047] 步骤7:针对步骤4和步骤6分别得到的 和 调制空间频率调谐j j
通道上的特征抑制强度E_Inh (x,y),最终得到图像纹理抑制后的轮廓信息r (x,y),如式(18)~(20)所示。
[0048] rj(x,y)=max(E(x,y;σj)‑α·E_Inhj(x,y),0)   (18)
[0049]
[0050]
[0051] 式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3。
[0052] 步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示。
[0053]
[0054] 其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置。
[0055]
[0056] 本发明具有的有益效果为:
[0057] ①、提出了一种基于LGN经典感受野分频视觉机制的轮廓特征提取新方法。通过对视网膜和LGN细胞的频率响应特性建模,引入高斯函数模拟LGN经典感受野所具有的频域响应特性,实现初级主体轮廓的提取。
[0058] ②、提出了一种基于LGN非经典感受野响应的侧抑制机制。针对空间频率、朝向调谐以及对比度对LGN经典感受野存在全局性抑制作用,构建多特征信息引导的外周抑制方法,实现背景信息的选择性抑制。
[0059] ③、提出了一种V1区分频多通道视觉信息流的融合模型。改变了传统方法仅考虑串行的电生理特性,在初级视皮层内针对多个特定LGN细胞的输入信息,进行分频多通道并行处理以及关联性传递,可以有效的保留轮廓信息,得到最终轮廓响应。

实施方案

[0061] 为了使本发明的目的、技术方案和有益效果更加清楚,下面结合图1对本发明进行说明:
[0062] 步骤1:针对输入图像I(x,y),引入如式(1)所示的高斯函数 模拟LGN经典感受野所具有的频域响应特性。
[0063]
[0064] 其中
[0065]
[0066] 利用高斯函数 的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同。 表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
[0067] 针对某个尺度参数σj,计算第i个朝向角 的LGN经典感受野分频激励响应如式(3)所示。
[0068]
[0069] 式(3)中默认γ=0.5,*表示卷积运算。
[0070] 步骤2:在步骤1所获得的 基础上,提取f个空间频率调谐通道的初级轮廓响应E(x,y,σj);具体实现过程如下:
[0071] 针对步骤1所获得的激励响应 在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取 的最大值,从而获得初级轮
廓响应E(x,y,σj),如式(4)所示。同时记录各尺度参数σj情况下 最大值所对应的朝向角,记为θCRF(j)。
[0072]
[0073] 其中max表示取最大值函数,下同。
[0074] 步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下 最大值所对应的朝向角为θNCRF(j)。定义第j条空间频率调谐通道上LGN非经典感受野中心‑外周的抑制强度如式(7)所示。
[0075]
[0076]
[0077]
[0078] 式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算。
[0079] 步骤4:针对步骤2和步骤3分别获取的θCRF(j)和θNCRF(j),计算两者的朝向差异特性,得到侧抑制强度
[0080] 首先分别计算朝向差异△θCRF‑NCRF(j),如式(8)所示。
[0081]
[0082] 再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示。
[0083]
[0084] 其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同。
[0085] 计算得到反映朝向差异特性的侧抑制强度 如式(10)所示;
[0086]
[0087] 步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y)。
[0088] 首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示。
[0089]
[0090] 然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示。
[0091]
[0092] 接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示。
[0093]
[0094] 其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
[0095] 最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示。
[0096]
[0097] 其中Cc表示修正阈值,
[0098] 步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性 将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示。
[0099]
[0100] 再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示。
[0101]
[0102] 计算得到反映低对比度差异特性的侧抑制强度 如式(17)所示,其中上标j的含义同前。
[0103]
[0104] 步骤7:针对步骤4和步骤6分别得到的 和 调制空间频率调j j
谐通道上的特征抑制强度E_Inh (x,y),最终得到图像纹理抑制后的轮廓信息r (x,y),如式(18)~(20)所示。
[0105] rj(x,y)=max(E(x,y;σj)‑α·E_Inhj(x,y),0)   (18)
[0106]
[0107]
[0108] 式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3。
[0109] 步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示。
[0110]
[0111] 其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置。
[0112]

附图说明

[0060] 图1为本发明的图像轮廓检测流程图。
专利联系人(活跃度排行)
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号