[0031] 以下结合附图对本发明实施例作进一步说明:
[0032] 如图1-4所示,一种人脸深度跟踪装置,包括红外发射模块、红外测距采集模块、计算模块。
[0033] 所述的红外发射模块用于对待测人脸进行红外照明,红外发射模块发射波长在780~940nm的红外光,提供背光源照射目标物和背景,以确保采集环境中有良好的照明条件;
[0034] 所述的红外测距采集模块用于对人脸深度图像信息的采集,该模块包括对红外波长敏感的感光芯片和半透玻璃膜,结果可参看图2;由红外发射模块发出的红外射线经过半透玻璃膜之后分为反射光线和透射光线两部分,反射光线则直接经过半透玻璃膜反射后照射在感光芯片上,而透射光线则透过半透玻璃膜后照射到人脸并且经由人脸反射至感光芯片上,如此形成两个光信号,然后测量两个光信号间的距离,从而将信号间的距离经过特定的公式计算出人脸的深度,并且向人脸深度图转换,并且绘制出深度图。
[0035] 所述的红外测距采集模块的特点如下:感光芯片具有抗可见光干扰,抗电磁波干扰识别稳定,运算速度高等优点,可以在红外发射模块照明下采集到红外波长(780~940nm)范围内的红外光线。半透玻璃膜具有透射率远高于反射率的特点,因为在感光芯片上收到的两个光信号其一是经过一次半透膜的反射而得到的,另一个是经过两次半透膜的透射、一次人脸的反射得到的,所以,为了保证两个光信号的强度尽可能相等,要选取透射率远高于反射率的半透玻璃膜材质。
[0036] 所述的计算模块:首先进行人脸区域的判断,然后读取红外测距采集模块采集到的人脸深度图像信息,最后对人脸五官进行的跟踪计算,具体实现如下:
[0037] 首先利用计算模块中的摄像头直接捕捉图像,记作原图像;其次利用haar分类器直接检测该原图像是否为人脸图像,若不是人脸图像,则该帧原图像不予以跟踪,若是人脸图像,则利用NPD特征来初步确定五官的大致位置,并且获取该人脸图像的中心坐标O,然后使用红外发射模块对目标人脸图像进行红外照明;红外发射模块发射波长在780~940nm 的红外光,由红外测距采集模块进行人脸图像深度采集,并将采集到的人脸深度图像信息传输给计算模块,计算模块读取接收到的人脸深度图像信息,并在人脸深度图像上利用已经通过NPD获取的中心坐标O作测试补丁:以五官各自的中心坐标O为中心,特定长度为边长,作一个小的矩形,该矩形的边长正好与人脸成一定比例,并且使得五官各自的信息包含于对应的矩形中,该矩形称为测试补丁。最后对人脸深度图各个测试补丁(包括包括眼睛、鼻子、眉毛、嘴巴和耳朵)进行主成分分析,提取每类测试补丁的主分量,设其中一类测试补丁眼睛用A表示,那么将训练集中所有A所对应的极大无关组取出,若补丁A的特征向量组能够由训练集中所得到的眼睛的极大无关组线性表出,则A被判定为眼睛。并对人脸深度图对应的补丁中心进行标点。并且将该人脸深度图上标点的坐标映射到原图像上去,并在原图像上将这些点标出,从而精确地跟踪人脸。
[0038] 红外测距采集模块中所述的将信号间的距离经过特定的公式计算出人脸的深度,并且向人脸深度图转换,并且绘制出深度图,具体实现如下:
[0039] 如图2和3所示,红外发射模块采用波长为780~940nm的红外光,红外发射模块呈可调节的偏转角θ发射平行的红外光线束至半透玻璃膜,之后每一道光线分为两道光线,一道直接反射,另一道经过透射再反射后照射到感光芯片上,感光芯片将采集到的所有的红外信号对的信息,发送至红外测距采集模块,测得每一个红外信号对中两个光信号之间的距离,并由公式计算出待测人脸与透射玻璃膜间的距离。由图2和3可以看到红外发射模块将密集的n束红外光线,以与水平面成θ角的方向向人脸发射,从而搜集每一对信号的坐标,得到n组坐标对,而由图2 俯视图看到,获取纵坐标相同坐标点组成坐标对,每一个坐标对中两坐标点的横坐标b、a作差之后得到的差值就是两个光信号之间的距离d,从而计算出θ角和光信号之间的距离d有如下关系:
[0040] D=[(b-a)*tanθ]/2 ⑹
[0041] D=(d*tanθ)/2 ⑺
[0042] 通过上述公式能够计算出人脸图像上某一列像素点的深度,而对于整张人脸图像的深度,则通过逐渐连续增大θ角来实现,而深度图上每一个深度坐标的横坐标可由图2中每一个坐标对中的横坐标a确定(即与a点横坐标相同),纵坐标就是对应坐标对的纵坐标。从而得到待测人脸上每一点对应的与半透玻璃膜间的距离。
[0043] 由坐标对和该坐标对对应的距离d值构成距离矩阵A。在由红外光线扫描完整张人脸之后,选出距离矩阵A中数值最小的点,将矩阵A中所有的元素都减去这个数值得到矩阵B,求出矩阵B中所有元素的和记作s,矩阵C由以下公式计算得出:
[0044] C=(255/s)*B ⑻
[0045] 矩阵C中的每一个元素an更新为255-an,构成最终的深度图D。
[0046] 所述的NPD特征估计法如下:NPD是基于两个像素点之间的比较。利用两个像素之间的相对差值得出NPD特征。利用NPD特征进行特征分类,所述的NPD特征可以不受约束地进行人脸检测。其中NPD特征是两个点灰度的差值与灰度和值的比例,是两个像素值之间的相对差异。该差异定义为函数f(x,y):
[0047]
[0048] 其中,x,y为任意两个像素的像素值,并且规定f(0,0)=0。
[0049] 利用上述公式(1)采用一种新的树内节点分裂计算方法来训练分类器:
[0050] (a1x2+b1x+c1)<t (2)
[0051] t为分裂阈值,是人为给定的一个数值,这个值越小,则训练得出的分类器的查准率越高,联系一元二次方程的特性,通过给定系数,用来检测x是否处于[θ1,θ2]中,θ1,,θ2是两个已知的阈值。系数a1、b1、c1 需要通过反复迭代的方式不断修正,首先将N1张正例图片和N2张反例图片输入并读取,在正例图片上创建滑框,遍历所有的像素点,取滑框中像素值最大的点与像素值最小的点利用 计算出函数值,将函数值代入公式(2),若满足此公式,则被分类器判断为正例,若不满足,则被判断为反例。当所有的正例和反例被遍历完毕之后,计算出查准率。若查准率在一定范围之内,则分类器训练完毕,否则,进行下一步的训练,即调整系数,若查准率偏高,则逐渐增加b1,逐渐减小a1和c1,查准率偏低,则再
2
次遍历正反例,重复以上步骤,直到查准率在一定范围之内。这样得到的(a1x +b1x+c1)<t就能判断正反例。
[0052] 根据NPD特征将得到三种结构:
[0053] -1≤f(x,y)≤θ<0 (3)
[0054] 0<θ≤f(x,y)≤1 (4)
[0055] θ1≤f(x,y)≤θ2 (5)
[0056] 公式(3)表示了x的亮度低于y,公式(4)表示x的亮度高于y,公式(5)是处理脸部比背景暗也有可能比背景亮的不确定的情况。
[0057] 如此利用NPD特征训练出的分类器具有较高的查全率以及较低的查准率,因此用以下方法进一步完善,具体如下:
[0058] 利用NPD特征训练出的五官分类器进行初步五官检测从而在原图像中获取五官对应的坐标,检测后通过红外发射模块以及红外测距采集模块获取人脸深度图。在人脸深度图已获取的坐标处以特定长度为边长,作一个小的矩形,此矩形的边长正好与利用haar特征所检测出的人脸矩形成一定比例,该小矩形称为测试补丁。并通过以下方法求出测试补丁特征向量的极大无关组:
[0059] 1.首先获取人脸某一个特定五官部位的深度图测试补丁A。
[0060] 2.然后由方程|A-λE|=0求出所有特征值λ,E为单位向量。
[0061] 3.将每一个特征值λ代入方程(A-λE)X=0,求该方程的所有非零向量X。
[0062] 4.将该深度图测试补丁A中所有特征值对应的特征向量X分别读取其元素,依次排成矩阵的形式[X11 X12 X13 … X1n]。
[0063] 5.将该矩阵中以列向量的形式拼接上对应同类训练集补丁的极大无关组,组成增广矩阵,并通过初等行变换变为阶梯阵(每行首个非零元素下面全为0),并计算阶梯数,即为该增广矩阵的秩,称作R (测试)。
[0064] 那么我们比较测试补丁中对应的增广矩阵的秩R(测试),与其对应的训练集中极大无关组的秩R(训练),若R(测试)=R(训练),则被测试的补丁被判断为正例,反之,R(测试)>R(训练)则判断为反例。
[0065] 而训练集中的极大无关组的秩R由以下方法获得:
[0066] 1.首先获取人脸某一个特定部位的深度图训练集补丁库B。
[0067] 2.对于每一个补丁由|B-λE|=0,该方程求出所有特征值λ。
[0068] 3.将每一个特征值λ代入方程(B-λE)X=0,求该方程的所有非零向量X(即为特征向量),并将这些向量X储存。
[0069] 4.对于每一个同类补丁都进行步骤2和3,从而将所有同类补丁的特征向量X累积起来,并且列成矩阵的形式。如下所示:
[0070] Xi=[a1 a2 a3 ... an]Τ (9)
[0071] X=[X1 X2 X3 ... Xm] (10)
[0072]
[0073] 5.将该矩阵通过初等行变换变为阶梯阵.
[0074]
[0075] 并统计每一行第一个非零元素所在的列,将这些列取出排成一组,即为训练集补丁的极大线性无关组,将每一个同类训练集补丁的极大无关组储存起来,并且统计极大无关组中向量的个数,即为秩R(训练),同样也储存起来。
[0076] 这样,通过比较R(测试)与R(训练)的大小就能判断测试集中的特征向量能否由训练集中的特征向量线性表出了。
[0077] 若R(测试)=R(训练)成立,则判断为正例补丁,在原图像相应的坐标点做上标记。
[0078] 根据本发明的示例性实施例,依靠红外发射保证了采集环境的良好的抗干扰性,在进行人脸检测的过程中,本发明融合了Haar的检测性好, NPD检测速度快,以及PCA主成分分析的精确性的优点,并结合所设计的红外测距装置获取人脸深度图像进行人脸五官位置的获取,从而达到精确跟踪与识别的目的。