[0072] 为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
[0073] 实施例一
[0074] 本实施例公开了一种基于局部连续性的鲁棒性人脸识别方法,如图1所示,包括以下方法步骤:
[0075] S1:获取N张人脸图像,所述N张人脸图像由n类人脸图像组成,选择任意一类人脸图像,将该类人脸图像转换为向量图像,该向量图像组成一个子字典,遍历n类人脸图像,获得n个子字典,将n个子字典拼接为n类人脸图像的字典A,所述N张人脸图像均为没有遮挡情况下的人脸图像;
[0076] 预先采集的N张人脸图像是没有遮挡情况下的干净正视人脸,因为在这种情况下能得到更加准确的模板图,在本实施例中采用的是AR人脸图像数据集中的未遮挡的人脸作为训练集,有墨镜和围巾遮挡的图片作为测试集,
[0077] 在采集完N张人脸图像之后,要现将图片进行裁剪并缩放到合适的尺寸,要求是在保证精度的情况下尽可能的小,因为这样能加快模型的处理速度,本实施例中采用的尺寸是42*30。然后将图片转换成向量的形式,并且对每个向量进行L2范数的归一化:
[0078]
[0079] 这是由于通常人脸的数据会由于光照等因素的影响导致人脸数据之间的差异较大,导致算法的不稳定性,通过L2范数归一化后会减小这方面的影响,在处理完数据之后,需要构造一个过完备的字典,它是由训练数据组成的,同一类的人脸要邻接在一起形成一m×N个子字典A_i,将所有子字典拼接在一块形成一个过完备的字典A=[A1,A2,...,AK]∈R 。
[0080] S2:获取待识别人脸图像,采用PCA降维方法提取待识别向量图像中主成分,并将提取的主成分构建为第一模板图像;
[0081] 对待识别人脸图像的处理中,本实施例首先将其转换为向量图像,然后在计算匹配标记图像的时候需要一个不含遮挡的重构人脸作为一个模板图片,进而计算遮挡与未遮挡图片的差异,以此来初步确定遮挡区域,在后续过程中可以采用优化后的稀疏编码来重构图片会有一定的去遮挡的效果,但是在初步的时候需要一个模板图片,常用的是直接使用所有数据的平均值作为初始的模板,但是这样的精度不够高。
[0082] 本实施例中采用PCA降维提取主要的成分后重构图像作为模板图片,具体的转换方法是:
[0083] 1.先计算训练集样本的平均值amean:
[0084]
[0085] 2.计算出PCA降维的主成分的投影矩阵Q,具体计算方法是对AAT做特征值分解,通过训练集的方法,得到的投影矩阵,取最大的前面一些特征值所对应的特征向量。(本实施例中取前50个特征值对应的特征向量)
[0086] 3.对待识别样本提取主要的成分后重构图像作为初始化模板:y'为初始化模板[0087] y′=(y‑amean)T·Q·QT+amean
[0088] S3:基于第一模板图像,计算残差图像,基于残差图像,获得匹配标记图M;
[0089]
[0090] |E|=|y‑y′|
[0091] 其中,E为残差图像,τ为预设残差阈值,i为矩阵图像中的行数,j为矩阵图像中的列数。
[0092] 首先定义匹配标记图:M∈Rp×q,它的大小与原始图像尺寸一致,但是前面在初始化的时候待识别人脸数据y以及模板y'被转化成了向量,因此在计算匹配标记图的时候需要将待识别人脸一维数据y以及模板y'先暂时转换成二维的图像。
[0093] 匹配标记图M是对图片的遮挡情况的初步预判断,M的定义与残差图像的绝对值有关,即原始图像减去重构的图像的绝对值(残差图像)|E|=|y‑y′|,计算采用阈值判别方法,它的具体计算方法如下:y为原始图像的矩阵数据
[0094]
[0095] E(i,j)表示在(i,j)处的像素的残差值,τ是一个小的正标量值,他在计算遮挡支撑图像的值起着很重要的作用,如果τ值设置的太大,则表示一直认为所有像素点都能匹配上,那么所提出的模型就会退化为经典的SRC,对遮挡的鲁棒性就会下降,因为得到的M是几乎全“1”值,无法进一步的获得局部空间信息。
[0096] 而如果τ的值设置的太低,那么表示大部分像素点都没有匹配上,这会导致本算法可利用的像素点非常少,也会造成识别率的下降。实际上M为零值超过了一半的时候,表现在原始图像上就是遮挡面积超过一半,即使是人类视觉也难以识别,因此太大或太小的τ都会导致匹配标记图的不正确,本专利建议先将残差按从小到大排列,取在区间60%‑90%之间的值合适。
[0097] S4:基于匹配标记图M,获得遮挡支撑图像W1,通过迭代更新方法对遮挡支撑图像W1t进行处理,获得遮挡支撑图像W;
[0098] 如图3和图4所示,在图4当中,图中的b模板,d为匹配标记图,e为遮挡支撑图。
[0099] 基于匹配标记图M,计算遮挡支撑图像W1:
[0100] W1i,j=H(CM(i,j)‑ε)
[0101] 其中,CM(i,j)为在匹配标记图中,第i行第j列的一个像素点周围3*3领域的匹配点个数,即值为‘1’的像素点个数,其计算方法为:
[0102]
[0103] 所述匹配点为Mi,j矩阵中,|Ei,j|≤τ的点;
[0104] 基于遮挡支撑图像W1,通过迭代更新的方法,计算遮挡支撑图像Wt:
[0105]
[0106] 其中, 为在第t‑1个遮挡支撑图像中,第i行第j列的一个像素点周围3*3领域的匹配点个数,其计算方法为:
[0107]
[0108] H(·)是单位阶跃函数,ε是一个区间为[1,9]的整数值,它表示领域有ε个匹配像素点的时候该点才是匹配状态,否则为未匹配状态,也就是属于遮挡区域。
[0109] 如果每次仅做一次上述操作不能利用局部空间连续性,因此进一步地在每轮计算遮挡支撑图像的时候迭代进行上述类似于滤波的操作,W进行自我更新,正是因为这个机制,使得本发明专利的方法可以获得更精确的遮挡区域,从而能够消除遮挡的影响。
[0110] S5:将遮挡支撑图像Wt作为权重,计算待识别人脸图像的加权稀疏表示向量x,并判断遮挡支撑图像Wt是否满足收敛条件,若不满足,则进入步骤S5,若满足,则进入步骤S6;
[0111]
[0112] y*=w⊙y
[0113] A*=w⊙A
[0114] 其中,⊙表示Hadamard积,即向量的每个元素对应相乘。
[0115] 参数λ对于目标函数求解至关重要,它平衡了保真项(重构误差)和正则项(编码的约束) 之间的关系,较大的参数能加快模型速度,但是会导致编码不稀疏,进一步的会导致局部混叠现象,即待识别的人脸图像在其他类的编码响应比在本类的编码响应更大,占主导地位,最终导致分类出错;较小的参数反之。为了提高精度不降低效率,[0116] 在第一步计算遮挡支撑图像的时候使用较大的正则化因子λ1,
[0117] 在第二步计算用于分类任务的稀疏编码的时候使用较小正则化因子λ2(通常是λ1的 1/10)。
[0118] 加权稀疏表示的思想是使用一个权重向量,它为较小的误差提供更大的权重;为较大的误差提供较小的权重,从而可以降低异常点对目标函数的影响。而本实施例专利提出的二值化遮挡支撑图像具有更好的性质,即直接关注未遮挡的像素点,直接忽略遮挡点,这样异常点/遮挡点不会对目标函数造成不良影响。
[0119] 其实加权稀疏表示的求解方法本质上是一个lasso的求解过程,因此将它改成lasso形式:
[0120]
[0121] 其中y*=w⊙A,A*=w⊙A。
[0122] 其求解方式有很多,本发明专利采用的是交替方向乘子法(ADMM)方法对其进行求解:
[0123] 1.初始化向量x,z,u∈RN×1为全零向量
[0124] 2.交替迭代更新这三个向量,在更新一个向量的时候固定其他两个:
[0125] xk+1=(ATA+ρI)‑1(ATy+ρ(zk‑uk))
[0126] zk+1=Sλ/ρ(xk+1+uk)
[0127] uk+1=uk+xk+1‑zk+1
[0128] 3.重复2直到算法收敛,最后输出z作为加权稀疏表示向量。
[0129] S6:基于加权稀疏表示向量,构建待识别人脸图像的第二模板图像,并重复步骤S3~S4;第二模板图像的表达式为:
[0130]
[0131] 为第二模板图像。
[0132] 采用重新构建模板图像,并对图像重复上面的步骤进行计算,能够使得最终计算的得到的种类结果更精确。
[0133] S7:基于遮挡支撑图像Wt、加权稀疏表示向量x与字典A,获得待识别人脸图像的分类结果i。
[0134] 由于同一个人的人脸图片可以认为是分布在一个线性子空间上,同一个类别的人脸图像是可以相互线性表达的,因此在对编码进行稀疏约束下理想的最后稀疏表示向量对于第i个特定类别子字典Ai是非零,其他地方为零。基于这个理论,可以通过将字典A=[A1,A2,...,AK] 分成K个特定类别的子字典,然后与稀疏表示相应的区间相乘重构回不含遮挡的人脸图像,最后通过下面式子得到分类结果i:
[0135]
[0136]
[0137] A=[A1,A2,...,AK]∈Rm×N
[0138] 其中,m为人脸向量的长度。
[0139] 为了验证本发明所提方法基于局部连续性加权稀疏表示的人脸识别的优越性,将本发明所提方法(记做:LSCSR)与传统的方法如:NN,SVM,SRC,RSC等方法进行了比较,如图表5所示。从图表5可以看出,LSCSR的对墨镜和围巾遮挡的情况下的识别率是所对比方法中最高的,特别是比较于RSC来说由于引入了局部连续性,算法的提升特别明显。
[0140] 实施例二
[0141] 本实施例公开了一种基于局部连续性的鲁棒性人脸识别系统,人脸识别系统用于实现实施例一中的一种基于局部连续性的鲁棒性人脸识别方法,如图2所示,人脸识别系统包括:
[0142] 图像采集分析模块,用于获取N张人脸图像,所述N张人脸图像由n类人脸图像组成,选择任意一类人脸图像,将该类人脸图像转换为向量图像,该向量图像组成一个子字典,遍历n类人脸图像,获得n个子字典,将n个子字典拼接为n类人脸图像的字典A,所述N张人脸图像均为没有遮挡情况下的人脸图像;
[0143] 图像分析模块,用于获取待识别人脸图像,采用PCA降维方法提取待识别向量图像中主成分,并将提取的主成分构建为第一模板图像;
[0144] 第一图像计算模块,用于基于第一模板图像,计算残差图像,基于残差图像,获得匹配标记图M;
[0145] 第二图像计算模块,用于基于匹配标记图M,获得遮挡支撑图像W1,通过迭代更新1 t
方法对遮挡支撑图像W进行处理,获得遮挡支撑图像W;
[0146] 判断识别模块,用于将遮挡支撑图像Wt作为权重,计算待识别人脸图像的加权稀疏表示向量x,并判断遮挡支撑图像Wt是否满足收敛条件,若不满足,则将结果输入到所述重构模块中,若满足,则将结果输入到分类模块中;
[0147] 重构模块,用于基于加权稀疏表示向量,构建待识别人脸图像的第二模板图像,并将第二模板图像输入到所述第一图像计算模块中;
[0148] 分类模块,用于基于遮挡支撑图像Wt、加权稀疏表示向量x与字典A,获得待识别人脸图像的分类结果i。
[0149] 实施例三
[0150] 本实施例公开了一种手机终端,此终端实现实施例一中的人脸识别图像方法,[0151] 图6所示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图6,手机包括:射频(Radio Frequency,RF)电路、存储器、输入单元、显示单元、传感器、音频电路、无线保真(Wireless Fidelity,WIFI)模块、处理器、以及电源等部件。本领域技术人员可以理解,图6中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0152] RF电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址 (Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、第五代移动通信技术5G等。
[0153] 存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如图像播放功能) 等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、拍摄的图像数据等) 等,本发明中存储数据区可存储多个类别的人脸图像,其中,人脸图像可以被预先转化成向量的形式被存储。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0154] 输入单元可用于接收输入的数字或字符信息。本发明中的输入单元可用于接收待识别人脸图像。具体地,输入单元可包括触控面板以及其他输入设备。触控面板,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。除了触控面板,输入单元还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、鼠标、操作杆等中的一种或多种。
[0155] 显示单元可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元可包括显示面板,可选的,可以采用液晶显示器、有机发光二极管等形式来配置显示面板。进一步的触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类型,随后处理器根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图6中,触控面板与显示面板是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现手机的输入和输出功能。
[0156] 手机还可包括至少一种传感器,比如光传感器、运动传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在手机移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0157] 处理器是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器可包括一个或多个处理单元;
[0158] 尽管未示出,手机还可以包括电池、摄像头、蓝牙模块等,在此不再赘述。
[0159] 具体在本实施例中,终端中的处理器会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器中,并由处理器来运行存储在存储器中的应用程序,从而实现各种功能:
[0160] 1接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式,计算待识别人脸图像对应初始模板;
[0161] 2利用模板图片对所述待识别人脸图像计算遮挡支撑图像;
[0162] 3计算所述待识别人脸图像对应的编码向量;
[0163] 4利用所有训练集的人脸图像和待识别人脸的编码向量,重构待识别人脸图像的人脸,得到待识别人脸的重构无遮挡的人脸图像作为模板;
[0164] 5用于利用每个类别的人脸图像和所述类别对应的编码向量,重构所述待识别人脸图像,得到每个类别对应的重构人脸图像,结合遮挡支撑图像,计算误差最小的一个类别作为分类结果。
[0165] 对于装置实施例而言,由于其基本对应于方法实施例一,所以相关之处参见方法实施例一的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0166] 以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。