[0004] 本发明为解决上述存在的问题,提出一种基于分频视觉机制的轮廓特征提取方法。该方法通过模拟LGN感受野的频域响应特性和V1区的分频视觉信息流融合机制来实现轮廓特征提取。首先模拟LGN经典感受野对视觉信息流的分频特性,引入视觉信息中若干个独立的空间频域调谐作用;然后利用LGN细胞的朝向与低对比度特征的选择性抑制机制,实现非经典感受野的全局调节特性;最后提出分频视觉信息流的融合模型,用于表征初级视皮层中的上下文整合机制,实现视觉信息流的并行处理以及关联性传递,最终达到快速响应和完整性融合的轮廓特征提取。本发明提出一种基于分频视觉机制的轮廓特征提取方法,包括如下步骤:
[0005] 步骤1:针对输入图像I(x,y),引入如式(1)所示的高斯函数 模拟LGN经典感受野所具有的频域响应特性。
[0006]
[0007] 其中
[0008]
[0009] 利用高斯函数 的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同。 表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
[0010] 针对某个尺度参数σj,计算第i个朝向角 的LGN经典感受野分频激励响应如式(3)所示。
[0011]
[0012] 式(3)中默认γ=0.5,*表示卷积运算。
[0013] 步骤2:在步骤1所获得的 基础上,提取f个空间频率调谐通道的初级轮廓响应E(x,y,σj);具体实现过程如下:
[0014] 针对步骤1所获得的激励响应 在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取 的最大值,从而获得初级轮
廓响应E(x,y,σj),如式(4)所示。同时记录各尺度参数σj情况下 最大值所对应的朝向角,记为θCRF(j)。
[0015]
[0016] 其中max表示取最大值函数,下同。
[0017] 步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下 最大值所对应的朝向角为θNCRF(j)。定义第j条空间频率调谐通道上LGN非经典感受野中心‑外周的抑制强度如式(7)所示。
[0018]
[0019]
[0020]
[0021] 式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算。
[0022] 步骤4:针对步骤2和步骤3分别获取的θCRF(j)和θNCRF(j),计算两者的朝向差异特性,得到侧抑制强度
[0023] 首先分别计算朝向差异△θCRF‑NCRF(j),如式(8)所示。
[0024]
[0025] 再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示。
[0026]
[0027] 其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同。
[0028] 计算得到反映朝向差异特性的侧抑制强度 如式(10)所示;
[0029]
[0030] 步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y)。
[0031] 首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示。
[0032]
[0033] 然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示。
[0034]
[0035] 接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示。
[0036]
[0037] 其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
[0038] 最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示。
[0039]
[0040] 其中Cc表示修正阈值,
[0041] 步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性 ,将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示。
[0042]
[0043] 再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示。
[0044]
[0045] 计算得到反映低对比度差异特性的侧抑制强度 如式(17)所示,其中上标j的含义同前。
[0046]
[0047] 步骤7:针对步骤4和步骤6分别得到的 和 调制空间频率调谐j j
通道上的特征抑制强度E_Inh (x,y),最终得到图像纹理抑制后的轮廓信息r (x,y),如式(18)~(20)所示。
[0048] rj(x,y)=max(E(x,y;σj)‑α·E_Inhj(x,y),0) (18)
[0049]
[0050]
[0051] 式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3。
[0052] 步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示。
[0053]
[0054] 其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置。
[0055]
[0056] 本发明具有的有益效果为:
[0057] ①、提出了一种基于LGN经典感受野分频视觉机制的轮廓特征提取新方法。通过对视网膜和LGN细胞的频率响应特性建模,引入高斯函数模拟LGN经典感受野所具有的频域响应特性,实现初级主体轮廓的提取。
[0058] ②、提出了一种基于LGN非经典感受野响应的侧抑制机制。针对空间频率、朝向调谐以及对比度对LGN经典感受野存在全局性抑制作用,构建多特征信息引导的外周抑制方法,实现背景信息的选择性抑制。
[0059] ③、提出了一种V1区分频多通道视觉信息流的融合模型。改变了传统方法仅考虑串行的电生理特性,在初级视皮层内针对多个特定LGN细胞的输入信息,进行分频多通道并行处理以及关联性传递,可以有效的保留轮廓信息,得到最终轮廓响应。