深度人脸识别的光照分析

江邓宏

安家（建筑与工程）

杭州海康威视数字技术股份有限公司广东业务中心广州市天河区 510000

摘要：人脸识别技术是一种基于人的脸部特征信息进行身份识别的生物识别技术，传统的人脸识别技术基于人工设计的描述子来提取局部特征，例如HOG、SIFT、Gabor、LBP等，这些计数在环境干扰较小的情况下，可以取得不错的效果。然而现实场景下的人脸识别任务还需要考虑光照、角度、距离和遮挡等复杂的识别环境。近些年，随着深度学习技术的发展，卷积神经网络在通用分类任务上取得了惊人的效果，例如AlexNet网络、VGG网络、ResNet网络等。

关键词：人脸三维模型;人脸图像建库;光照分析;人脸识别

引言

人脸识别技术作为一门重要的生物特征识别技术，已被广泛应用于身份验证领域。传统人脸识别方法多是基于人工特征加分类器的思路，而人工特征属于浅层表示，不足以表达高维的非线性人脸特征，导致人脸识别精度偏低。由于卷积神经网络能通过训练学习到深层次的隐性人脸特征，极大地提高了人脸识别准确率。因此，在人脸识别领域得到了广泛的研究和应用。

1人脸识别

将系统检测到的人脸特征信息与系统数据库中存在的已知人脸信息进行充分识别与匹配，以此获取相关信息，该过程的本质是选择正确的人脸模型和匹配策略。在实际生活的应用当中，由于成人的面部模型处于不断变化当中，且容易受到时间、光线、相机角度等方面的差异，因而很难用一张图纸表达同一个人的面部图像，这使得提取特征变得困难，由于大量的原始灰度图像数据，神经元的数量通常很大并且训练时间很长。除此之外，完全依赖于神经网络的识别方法具有当前计算机系统固有的局限性，尽管神经网络具有很强的感应能力，但是随着样本数量的增加，其性能可能会大大降低。简而言之，由于年龄，表情，倾斜度和其他表征对象的因素的多样性，很难进行人脸识别，因此，识别该对象的效果仍远未达到现实。目前，普遍采用Ada Boost算法来对出现在视频中的人脸区域进行检测，以此达到实时获取人脸图像的目的，Ada Boost算法的原理是通过训练得到多个不同的弱分类器并将这些弱分类器通过叠加、级联得到强分类器。

2人脸识别系统工作原理

人脸识别是基于人脸部的特征信息进行身份识别的一种生物识别技术。使用摄像头采集图像或视频流，通过算法在图像中检测和跟踪人脸，并对检测到的人脸进行脸部特征数据提取，进而与存储有已知身份人脸信息的数据库进行比对，最终识别出场景中单个或多个人的身份。人脸识别系统主要由图像预处理、人脸检测、特征提取与降维、人脸特征比对识别等基本单元组成。图像预处理：图像输入后，经过归一化、直方图均衡、图像灰度变换降低图像的噪声后，交后续处理。人脸检测：利用人脸检测分类器，采用神经网络算法，识别给定的图片中是否存在有人脸，若有人脸存在，则给出人脸的大小、人脸个数以及人脸的位置坐标等信息。特征提取与降维：提取是指抓住人脸的主要特征，适当忽略次要特征和人脸照片灰度值的细微变化，结合灰度直方图、Haar特征、LBP纹理特征、HOG特征（方向梯度直方图）完成同一张人脸在不同角度、不同照明下对人脸的主要特征提取;降维主要采用PCA方法（主成分分析法）通过提取主要特征、过滤次要特征来提高匹配的精确度，减少特征维度，减少计算的复杂度。人脸库：采用平均脸及特征脸相结合的方法进行构建。平均脸指从一定数量的人脸中提取面部特征，并将这些特征进行测量并求出平均值，最后合成的一张人脸。特征脸指从高维矢量空间的人脸图像通过协方差矩阵计算得来的一组特征向量，主要可以用来解决人脸识别中的人脸分类问题。人脸特征比对识别：即使用欧氏距离公式将人脸识别系统提取出的人脸特征数据与人脸数据库中存储的特征数据进行逐个比对，输出最终的结果。

3相关工作

3.1人脸识别中的光照处理方法

为降低光照变化对人脸识别的影响，早期主要有人脸光照归一和提取光照不变量种方法。然而，光照归一操作在调整图像光照的同时也会修改人脸身份信息;而光照不变量或特征在实际操作中，特别是在光照条件较差时难以提取，这些方法对于人脸识别率提升有限。最新的人脸识别方法大多基于深度学习技术实现该方法通过收集具有多样光照的人脸图像作为训练数据，利用深度神经网络的强大学习能力提取对于光照鲁棒的人脸特征，从而提高人脸识别率。例如，目前主流的人脸识别方法Arc Face在一些大规模识别库上已经达到99%左右的识别率，但是该网络仍旧难以应付实际场景中多变、极端的光照环境，无法满足实际应用的需求。这主要是因为现有数据集中人脸图像的光照还不够丰富，导致深度识别网络对于训练数据中的光照过拟合，使网络在特定数据上可获得高识别率，但当面对实际应用中多种不可控因素时失效。除了利用数据提高识别网络对于光照的鲁棒性外，也有工作从算法层面提高网络的识别率。利用人脸对称性降低光照影响，提高了网络对于极端光照下人脸的识别率;用多任务学习将光照分类作为人脸分类的辅助任务训练深度神经网络，提高了人脸识别率。本文也将从数据和算法2个层面研究深度人脸识别网络的优化方法。首先通过提出最优光照采样策略提高训练数据的质量，然后基于多任务学习研究光照标注数据的使用方法，进一步提高人脸识别率。

3.2低分辨率人脸

随着高清设备的出现，人脸识别技术的发展非常迅猛，低分辨率图像由逐渐退出历史舞台的趋势。但在一些特殊场合和历史资料中，低分辨率人脸也是不可避免的问题，一些多年前存档的标清成像资料（如自动取款机监控，重点区域监控），以及远距离成像，弱光线成像，雾气干扰成像等。低分辨率人脸还大量存在.因此，研究在特殊场景或条件下的低分辨率人脸的识别问题具有一定的应用价值。针对低分辨率人脸的研究，多数学者仍从传统特征方法入手，一种基于局部二值模式（Local Binary Pattern，LBP）纹理描述算子的低分辨率人脸识别算法，因其算法的旋转不变性和灰度不变性等特点，对人脸图像的表情、模糊等因素具有一定的鲁棒性。但该模型仅考虑到人脸特征的局部性，对整体特征的把握和局部特征如光照等因素的敏感变化仍欠缺深入研究。根据人眼视觉研究表明，图像的感知是自底向上而成的，从大细节至小细节，由全局到局部，多层次组合而成。因此众多学者将目光放在融合局部与全局特征的算法的研究上。赵等人提出的基于双树复小波变换（Dual Tree Complex Wavelet Transform，DTCWT）和局部二进制模式直方图的低分辨率算法，虽将DTCWT和LBP结合，得到平移不变性和运算效率的优势，一定程度上顾及人脸局部与全局特征的融合，但仍对存在数据量维数过大且特征缺乏一致性能力的不足。基于此，多尺度空间理论为局部特征提取与全局特征提取算法的融合提供了新的思路，目前以此理论为基础的人脸识别相关算法如基于WPD -HOG金字塔特征的人脸鉴别算法等，都取得了一定的实验成果。

3.3物联网人脸识别视频网络多目标算法优化

多目标优化问题的实质是协调并在各个子目标之间达成折中，以便使不同的子目标功能尽可能地最佳。工程优化的大多数实际问题都是多用途优化问题，目标通常相互冲突。长期以来，多目标优化一直受到人们的广泛关注，现在已经开发出更多的方法来解决多目标优化问题。如果多标准优化没有最差的解决方案，那么通常会有无限多的解决方案，这并不是最差的解决方案。解决面部强调时，人们不能直接应用许多次等解决方案。作为最后的决定，我们只能选择质量不是最低，最能满足我们要求的解决方案。找到最终解决方案的方法主要有三种。因此，只有通过找到大量有缺陷的解决方案以形成有缺陷的解决方案的子集，然后根据我们的意图找到最终的解决方案。基于此，多目标算法是通过将多准则问题转变为一个关键问题，这种方法也可以视为辅助手段。这种方法的棘手部分是如何获取实际体重信息，至于面部特征，我们将建议一种基于权重的多功能优化算法，该算法可以更好地反映脸部的特征。我们将人脸的每个特征都视为多个目标，并且在提取面部特征时，面部特征会受到外界的强烈影响，例如位置，光照条件和强度的变化，并且所有部位和每个部位都会受到影响。因此，我们可以使用加权方法从每个受影响的分数中提取不同的权重。

3.4轻量型人脸识别网络VIP Lite Net的设计

与CPU这类通用计算平台不同，基于FPGA的卷积神经网络加速器的优势在于并行执行大量的线性运算，统一的数据流可以减小控制逻辑的复杂度，并且最大化硬件资源的利用效率。而当前的卷积神经网络主要存在以下问题，使其在FPGA上执行效率较低，卷积核尺寸多样性，网络参数量大，网络计算量大，使用复杂的非线性函数。针对以上的问题，本文提出了硬件更加友好的轻量型人脸识别网络VIP Lite Net，网络由7层卷积和2层全连接构成，每一层之后加上线性整流函数（Rectified Linear Unit，ReLU）用于增加网络的非线性性能。网络中所有的卷积层使用统一的3*3卷积核，这样可以简化FPGA的控制逻辑，并且集中FPGA的资源计算一种卷积。为了使网络同样可以达到大尺寸卷积核的计算效果，本文将不同步长的卷积核堆叠来达到不同感受野的效果，保证网络的性能不会有所损失。

4基于多任务学习的光照不变特征提取方法

本文基于多任务学习框架对上述光照标注方法进行验证。训练网络基于ResNet-50设计。ResNet-50网络的隐藏层由4个模块组成，4个模块结构分别由3，4，6，3个残差结构组成;每个残差结构包含3层分别以卷积核大小为1×1，3×3，1×1的卷积层。本文采用硬共享的方式实现人脸识别任务与光照相关任务的参数共享，前2个模块共用参数，后2个模块学习各自任务的参数。其输出特征首先进行拉平操作，再通过全连接层输出最终结果。对于人脸识别分支和光照处理分支，通过隐藏层分别输出2048维的人脸特征和光照特征，人脸特征通过全连接层会得到一个维度与训练集人数相同的人脸分类特征向量;而光照处理分支根据不同光照任务确定输出向量的维度。网络的输入是带不同光照的人脸图像，人脸分类分支会更加关注不同人脸类别间的差异;而光照处理分支会执行与输入图像光照相关的任务，如光照参数估计和光照分类。随着2个分支的网络分别向特定的任务学习后，得到的特征之间的相关性将会逐渐降低，通过这种方式可以起到特征分离的效果。

结束语

人脸识别作为新兴的生物信息技术，我国目前尚无专门的立法规定，也尚未建立一套严格的准入和监管制度。面对我国当前由于人脸识别技术的滥用而缺乏相应安全保障的现状，如何进一步探索建立分级应对的精细化管理机制，亟待理论界和实务界予以深入研究。人脸识别的大规模使用不仅影响社会成员之间的交往关系，不利于促进社会合作，而且也关乎公民隐私权的保护，涉及公民的基本权利，这些都需要在立足于我国本土国情的基础上，借鉴和吸收国外已有的相关立法实践。在涉及人脸识别使用等公共政策的制定过程中，需要广泛进行话题辩论，鼓励社会公众参与，在争议较大的核心问题上听取公众意见，充分保障民众在公共政策制定上的参与权与知情权。

参考文献

[1]车生然，康佳美.人脸识别交互设计研究——以通行场景为例[J].工业设计研究，2019（00）：257-264.

[2]高旭，黄建琼.一种基于LBP改进的人脸识别算法[J].河南科技学院学报（自然科学版），2019，47（06）：70-74.

[3]王建霞，陈慧萍，李佳泽，张晓明.基于多特征融合卷积神经网络的人脸表情识别[J].河北科技大学学报，2019，40（06）：540-547.

[4]于艺春.基于神经网络算法的人脸识别[J].电子技术与软件工程，2019（24）：247-248.

[5]师磊磊，万健，司华友，陈彬彬.基于社交网络LinkedIn的用户年龄估计[J].浙江科技学院学报，2019，31（06）：464-469.

[6]吴蓉波.智能视频监控与人脸识别技术在监狱安防中的应用研究[J].中国安全防范技术与应用，2019（06）：16-19.

[7]龚亮.基于深度学习的人脸识别浅析[J].科技风，2019（36）：12.

[8]李振东，钟勇，陈蔓，王理顺.角度余量损失和中心损失联合的深度人脸识别[J].计算机应用，2019，39（S2）：55-58.

*本文暂不支持打印功能