首页 > 其他分享 >选择性细化网络用于高性能人脸检测

选择性细化网络用于高性能人脸检测

时间:2022-10-07 11:31:31浏览次数:57  
标签:人脸识别 细化 检测 回归 两步 高性能 人脸 CNN



选择性细化网络用于高性能人脸检测_人脸识别

人脸检测

人脸检测是自动人脸识别系统中的一个关键环节。早期的人脸识别研究主要针对具有较强约束条件的人脸图象(如无背景的图象),往往假设人脸位置一直或者容易获得,因此人脸检测问题并未受到重视。 

随着电子商务等应用的发展,人脸识别成为最有潜力的生物身份验证手段,这种应用背景要求自动人脸识别系统能够对一般图象具有一定的识别能力,由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视频检测等方面有着重要的应用价值。

导读

高性能人脸检测仍然是一个非常具有挑战性的问题,特别是在有很多小尺度人脸的情况下。今天分享的作者就提出了一种新的single-shot人脸检测方法-选择性细化网络(SRN),它将新的两步分类和回归操作选择性地引入到基于锚点的人脸检测器中,以减少假阳性,同时提高定位精度。

特别是SRN由两个模块组成:选择性两步分类(STC)模块和选择性两步回归(STR)模块。STC的目的是从低层检测层中筛选出大多数简单的负样本锚,以减少后续分类器的搜索空间,而STR的目的是粗略地调整高层次检测层中锚的位置和大小,以便为后续的回归器提供更好的初始化。

此外,还设计了一个感受野增强(RFE)模块,以提供更多样化的感受野,这有助于更好地捕捉一些极端姿势的面孔。因此,所提出的SRN检测器在所有广泛使用的人脸检测基准(包括AFW、PASCAL人脸、FDDB和WIDER FACE数据集)上都取得了最优的性能。

选择性细化网络用于高性能人脸检测_人脸检测_02

相关工作背景

上世纪90年代,人脸检测就是一个极具挑战性的研究领域。Viola和Jones首先使用Haar特征和Adaboost对人脸检测器进行训练,具有很好的准确性和效率,之后激发了几种不同的方法(【1】Liao, S.; Jain, A. K.; and Li, S. Z. 2016. A fast and accurate unconstrained face detector. TPAMI;【2】Brubaker, S. C.; Wu, J.; Sun, J.; Mullin, M. D.; and Rehg, J. M. 2008. On the design of cascades of boosted ensembles
for face detection. IJCV)。除了那些之外,另一个重要的工作是引入可变形的部件模型(DPM)。

最近,基于CNN的方法已经在人脸检测占据了重要位置。Cascade CNN通过训练一个复杂的CNN提高了检测精度。Qin等人建议对级联的CNNs进行联合训练,实现端到端优化(Qin, H.; Yan, J.; Li, X.; and Hu, X. 2016. Joint training of cascaded CNN for face detection. In CVPR.)。MTCN提出了多任务级联的检测和对齐方法。Faceness将人脸检测作为对人脸部件进行评分,以检测严重遮挡下的人脸。UnitBox引入IoU损失用于边界框预测。EMO提出了一个预期的最大重叠分数,以评估锚匹配质量。SAFD开发了一个尺度候选阶段,该阶段自动标准化检测前的人脸尺寸。SSAP注意力在图像金字塔中的特定比例和每个刻度层中的有效位置。最近的工作(Bai, Y.; Zhang, Y.; Ding, M.; and Ghanem, B. 2018. Finding tiny faces in the wild with generative adversarial network. In CVPR)设计了一种新的网络,从一个很小的模糊中以直接产生清晰的超分辨率人脸。


选择性细化网络用于高性能人脸检测_计算机视觉_03

此外,人脸检测还继承了一般目标检测器的一些成就,如 Faster RCNN、SSD、FPN和RetinaNet 。

Face R-CNN(Ren, S.; He, K.; Girshick, R. B.; and Sun, J. 2017. Faster R-CNN: towards real-time object detection with region proposal networks. TPAMI)将Faster  R-CNN 与难样本挖掘结合起来,并取得了优秀的结果。Face Boxes引入了一种基于SSD的CPU实时检测器。Face R-FCN在人脸检测中应用R-FCN ,并做出相应的进行改进。人脸检测模型为了寻找微小人脸为不同的尺度训练单独的探测器。S3FD在SSD上提出了多种策略,以补偿小面孔的匹配问题。SSH在每个预测模块上使用大型过滤器对上下文信息进行建模。PyramidBox利用具有改进的SSD网络结构的上下文信息。FAB提出了一个anchor-level的注意力引入RetinaNet,以检测被遮挡的人脸。

作者受RefineDet中的多步分类和回归启发和RetinaNet的focal loss,开发了一种最先进的人脸检测器。


主框架

选择性细化网络用于高性能人脸检测_人脸识别_04

Backbone

框架的主干是ResNet-50,有着6层特征金字塔结构用于SRN。特征图主要从C2、C3、C4和C5提取获得,C6和C7仅仅通过两个简单的下采样得到。自下而上和自上而下通道之间的横向结构是相同的。

Dedicated Modules

STC模块选择C2、C3、C4、p2、p3和p4执行两步分类,而STR模块选择C5、C6、C7、p5、p6和p7进行两步回归。RFE模块负责丰富特征的感受野用于预测目标的类别和位置。

Loss Function

作者在深层结构的末尾附加了一个混合损失,它利用focal loss和平滑的L1损失的优点,促使模型专注于更多的难训练样本,并学习更好的回归结果。

Selective Two-Step Classification

STC的损失函数由两部分组成,即第一步损失和第二步损失。对于第一步,计算这些样本的focal loss选择以执行两步分类;对于第二步,只关注那些在第一步过滤后仍然存在的样本。根据这些定义,将损失函数定义如下:

选择性细化网络用于高性能人脸检测_人脸识别_05

Selective Two-Step Regression

在检测任务中,如何使边界框的定位更加准确一直是一个具有挑战性的问题。现有的一步回归方法依赖于基于不同特征层的回归,这在一些具有挑战性的场景中是不准确的,如Ms COCO的评价标准。近年来,采用级联结构进行多步回归是提高检测边界框准确性的有效方法。

然而,盲目地在特定任务( 即人脸检测)中添加多步回归往往适得其反,实验结果(见下表  )表明三个较低金字塔水平的两步回归损害了性能。

选择性细化网络用于高性能人脸检测_人脸识别_06

这种现象背后的原因有两个: 1) 三个较低的金字塔层次是相关的,有大量的小锚来探测小面孔。 这些小面孔的特征是非常粗糙的特征表示,因此这些小锚很难进行两步回归; 2) 在训练阶段,如果让网络太关注难样本的回归,在低金字塔水平上的任务,它会导致更大的回归损失和阻碍更重要的分类任务。

 在上述分析的基础上,我们选择性地对三个较高的金字塔水平进行了两步回归。这种设计背后的动机是充分利用三个较高金字塔层次上大面的详细特征来回归更精确的边界框位置,并使三个较低的金字塔层次更加关注分类任务。这种分而治之的策略使整个框架更加有效。STR损失如下:

选择性细化网络用于高性能人脸检测_计算机视觉_07

Receptive Field Enhancement

选择性细化网络用于高性能人脸检测_人脸识别_08

实验结果

各种设计的有效性

选择性细化网络用于高性能人脸检测_计算机视觉_09

选择性细化网络用于高性能人脸检测_人脸检测_10

在不同数据集上的评估


选择性细化网络用于高性能人脸检测_人脸检测_11

WIDER FACE上的PR曲线

END


如果想加入我们“计算机视觉战队”,请扫二维码加入学习群。计算机视觉战队主要涉及机器学习、深度学习等领域,由来自于各校的硕博研究生组成的团队,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。

选择性细化网络用于高性能人脸检测_人脸检测_12


标签:人脸识别,细化,检测,回归,两步,高性能,人脸,CNN
From: https://blog.51cto.com/u_15726357/5734355

相关文章

  • 从人脸识别到行人重识别,下一个风口
    人脸识别在LFW超越人的识别能力之后,就很少有重大的突破了,逐渐转向视频中人脸识别或人脸属性学习等方向。CV顶级会议的接受论文量也出现了逐渐平稳的趋势。而行人重识别(Perso......
  • 对比python学julia(第四章:人工智能)--(第二节)人脸识别
    2.1. 项目简介人脸识别是基于人的脸部特征信息进行身份识别的一种图像识别技术。使用0PenCV进行人脸识别的过程如下。(1) 针对每个识别对象收集大量的......
  • 近期人脸对齐的实证性研究
    本次推送参考文献《AnEmpiricalStudyofRecentFaceAlignmentMethods》人脸对齐方法的发展具有以下5个里程碑的阶段:1、1995年Cootes的ASM算法;2、1998年Cootes的AAM......
  • 人脸对齐之GBDT(ERT)算法解读
    1.概述文章名称:OneMillisecondFaceAlignmentwithanEnsembleofRegressionTrees 文章作者:VahidKazemi,JosephineSullivan 简要介绍:OneMillisecondFaceAlignme......
  • 尺度不变人脸检测器(S3FD-Single Shot Scale-invariant Face Detector)
    今天讲尺度不变人脸检测前之前,我想讲解下一位热心研究者的问题,可以简单讲解下,希望也可以帮助其他读者,谢谢!这样的人脸尺度怎么去实现的,其实很简单,如果你有详细读过Spatialpy......
  • 汇总|3D人脸重建算法
    1、Nonlinear3DFaceMorphableModel(2018)论文链接:https://arxiv.org/abs/1804.03786项目链接:​​http://cvlab.cse.msu.edu/project-nonlinear-3dmm.html​​主要思想:三维......
  • 3D人脸重建和人脸分析常用的数据集汇总
    1、AFLWdatabase数据下载链接:​​http://lrs.icg.tugraz.at/research/aflw/​​AFLW人脸数据库是一个包括多姿态、多视角的大规模人脸数据库,而且每个人脸都被标注了21个特......
  • 【计算机视觉】人脸检测模型的评估方法-linux
    前言人脸检测标准库​​FDDB​​详细介绍了数据库和使用方法。对于训练的模型,如何评估模型的效果呢,本文对此进行介绍。说实话,参考了很多博客,但是感觉都不是很明白(当然本文......
  • 【计算机视觉】如何使用于仕琪老师的libfacedetect人脸检测库
    前言最近又开始进行人脸检测方向的内容,看到于仕琪老师的多角度检测想试一下,还不清楚原理,先测试效果如何。libfacedetect人脸检测库是深圳大学于仕琪老师发布的开源库,与openc......
  • 人脸表情识别系统介绍——离线环境配置篇
    摘要:本文详细介绍如何使用离线方法配置前面一篇博文《人脸表情识别系统介绍——上篇(python实现,含UI界面及完整代码)》项目中代码的Python环境,能够有效避免一些可能出现的依......