首页 > 编程语言 >人脸识别——Webface-OCC遮挡人脸识别算法解析

人脸识别——Webface-OCC遮挡人脸识别算法解析

时间:2024-05-29 09:32:11浏览次数:25  
标签:Webface 人脸识别 遮挡 OCC mask 数据

1. 概述

自2019年被誉为人脸识别技术的元年,各地纷纷引入这项技术。然而,自2020年起,为了抵御冠状病毒(COVID-19)的全球传播,人们普遍开始佩戴口罩。众所周知,现有人脸识别模型在面对遮挡物(如口罩)时,其识别精度会显著下降。这一现象的主要原因在于,现有数据集往往没有充分考虑遮挡因素。

目前,尚未有一个公开的数据集能够全面考虑人脸识别中的遮挡问题。尽管已有一些研究提出了针对遮挡感知的人脸识别模型,包括对面具和太阳镜的识别,但这些研究大多是基于自行构建的数据集。然而,这些自行构建的数据集与现实情况存在较大差异,因此其有效性受到限制。

例如,(a) 展示了2016年报道的MaskNet所使用的数据集样本。该数据集通过随机应用不同尺寸的黑色遮罩来模拟遮挡。然而,这种单一的遮挡类型预计会降低模型的泛化能力。此外,考虑到实际应用场景,这种咬合(遮挡)方式显得并不自然。

(b) 展示了2019年报道的成对差分连体网络(PDSN)所使用的三个数据集样本。这里提供了三种不同的遮挡类型,与(a)相比,遮挡类型的多样性有所增加。但是,从实际应用的角度来看,遮挡的位置和大小仍然不够自然。

© 展示了2020年报告的wID所使用的数据集样本。在这个数据集中,人脸图像被随机应用了方形框作为遮挡。尽管采用了综合方法,但这种方法仍然无法很好地适应实际条件。

近年来,使用生成对抗网络(GANs)的方法受到了广泛关注,因为它们能够生成视觉上更自然的遮挡图像。然而,这些图像在细节信息上的变化可能导致在这些图像上训练的人脸识别模型在实际应用中表现不佳。

因此,尽管目前已有一些考虑遮挡的数据集,但它们大多数与现实情况相去甚远。

为了改善这一状况,本文提出了一个新的公共遮挡感知数据集——Webface-OCC。(d) 展示了Webface-OCC的样本数据。该数据集包含10,575个不同主体的804,704张面部图像,涵盖了各种遮挡类型,有望为人脸识别技术的发展提供更贴近实际的支持。


论文地址:https://arxiv.org/abs/2103.02805
源码地址:https://github.com/Baojin-Huang/Webface-OCC

2. Webface-OCC

Webface-OCC是基于广泛使用的CASIA-Webface人脸识别数据集构建的。CASIA-Webface数据集包含了轻微遮挡的人脸图像,使得在该数据集上训练的人脸识别模型在小遮挡情况下表现出色。

为了进一步提升模型在遮挡条件下的表现,我们对CASIA-Webface进行了增强,创建了全新的Webface-OCC数据集。这一改进对于提高模型在面对遮挡时的人脸识别性能具有显著帮助。

以下是Webface-OCC数据集的示例。与以往使用方块随机遮挡人脸的方法不同,我们在Webface-OCC中采用了口罩和太阳镜等更符合实际情境的遮挡物,这些是人们在日常生活中经常遇到的。

Webface-OCC提供了多种类型的(a)纹理/颜色和(b)口罩/太阳镜,具体如下所示。然后,我们从未经遮挡的正常图像中提取了面部特征点。

接下来,利用这些面部特征点,我们通过精确地将口罩映射到覆盖口鼻区域,将太阳镜映射到覆盖眼睛区域,并调整它们的角度和大小,生成了一系列带有遮挡的人脸图像。

通过这种方式,我们增加了数据集的多样性,使得数据集包含了多种遮挡类型的组合。最终,Webface-OCC数据集包含了10,575个不同个体的804,704张人脸图像。
此外,数据集中每个ID都包含了正常和遮挡状态下的人脸图像,且两者数量相等,如下所示。

3.测试实验

Webface-OCC训练的模型在两种不同情境下进行了评估:

  1. 一般人脸识别:使用了Labeled Faces in the Wild (LFW)、Celebrity Frontal-Profile in the Wild (CFP-FP) 和 AgeDB-30 数据集进行评估。
  2. 遮挡人脸识别:使用了最新提出的LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 Real-World Masked Face Dataset (RMFRD) 进行评估。

LFW-mask、CFP-FP-mask 和 AgeDB-30-mask 是在原始数据集的基础上添加了遮挡物,这些数据集在图像数量和比例上与原始数据集保持一致,没有变化。

评估所用的模型基于六种具有代表性的人脸识别架构:CenterFace、SphereFace、FaceNet、CosFace、ArcFace 和 MaskNet。特别地,FaceNet 和 ArcFace 还在 WiderFace 数据集上进行了重新训练,以进一步验证其性能。

评估结果显示,由于人脸方向和年龄差异的影响,CFP-FP 和 AgeDB-30 的准确率显著低于 LFW。然而,使用 Webface-OCC 训练的模型与原始模型相比,准确率仅下降了大约 1%,表明这些模型在一般人脸识别数据集上的整体表现仍然较高。

模型性能比较图

此外,重新训练的模型(特别是 FaceNet 和 ArcFace)在性能上明显优于原始模型。例如,ArcFace 在四个遮挡人脸识别数据集(LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 RMFRD)上的准确率比原始模型分别提高了 36.22%、29.14%、27.04% 和 15.03%。

换言之,重新训练的模型在显著提升对遮挡人脸识别数据集的性能的同时,保持了对一般人脸识别数据集的高准确率。

与模拟遮挡的人脸识别数据集(LFW-mask、CFP-FP-FP-mask 和 AgeDB-30-mask)相比,真实遮挡的人脸识别数据集(RMFRD)的识别精度较低。这可能是由于 RMFRD 中遮挡物的未知性,或者是因为被试者是公众人物,他们可能会故意伪装,以隐藏自己的身份。

4.总结

本文介绍了一个新的公共数据集,专为闭塞感知人脸识别而设计。与传统的合成遮挡方法相比,我们采用了一种创新的面部特征点映射技术来合成遮挡物,这种方法更贴近现实世界的应用场景。我们提出了一种综合的遮挡合成方法,它能够更真实地模拟实际中的遮挡情况。

通过将此方法应用于现有的Webface数据集,我们成功构建了一个包含大规模遮挡图像的公共数据集。此外,我们在该数据集上对ArcFace模型进行了重新训练,结果表明,重新训练后的模型在LFW-Mask和RMFRD数据集上分别达到了97.08%和78.25%的高准确率。

据NIST等多个国际权威机构的报告,传统人脸识别模型在口罩遮挡下的准确率会有显著下降。我们预计,Webface-OCC的推出将为人脸识别领域带来一个规模更大、更多样化、更精确的遮挡人脸识别数据集,从而显著提升人脸识别模型的准确性。

标签:Webface,人脸识别,遮挡,OCC,mask,数据
From: https://blog.csdn.net/matt45m/article/details/139275843

相关文章

  • IdentiFace——多模态人脸识别系统,可捕捉从情绪到性别的所有信息及其潜力
    1.概述面部识别系统的开发极大地推动了计算机视觉领域的发展。如今,人们正在积极开发多模态系统,将多种生物识别特征高效、有效地结合起来。本文介绍了一种名为IdentiFace的多模态人脸识别系统。该系统利用基于VGG-16架构的模型,将人脸识别与性别、脸型和情绪等重要生物......
  • BEV与Occupancy怎样助力自动驾驶落地?
    自动驾驶领域中,什么是BEV?什么是Occupancy?BEV是Bird'sEyeView的缩写,意为鸟瞰视图。在自动驾驶领域,BEV是指从车辆上方俯瞰的场景视图。BEV图像可以提供车辆周围环境的完整视图,包括车辆前方、后方、两侧和顶部。BEV图像可以通过多种方式生成,包括:使用激光雷达:激光雷达可......
  • 人脸识别:基于卷积神经网络(CNN)分类思想的人脸识别系统
    ​本文来自公众号“AI大道理”  ——————项目配套视频课程:平台:荔枝微课链接:十方教育项目地址:https://github.com/AIBigTruth/CNN_faces_recognition 之前很多人来询问这个项目怎么做,代码跑不起来,里面的原理不是很懂,现在参与这个视频课程就能无痛做这个项目啦。 ......
  • 人脸识别库 虹软 客户端 服务端 示例
    https://github.com/18628271760/MultipleFacesProcess 一、前言虹软开发SDK以来,其免费使用的营销策略,成功降低了中小企业使用人脸识别技术的成本。然而,对.NET开发者来说,虹软没有提供C#版本的SDK供开发者直接调用(为什么JAVA就有?!),而是建议开发者利用C++版本封装。大龄的C系程......
  • [Paper Reading] Scene as Occupancy
    SceneasOccupancylink时间:23.06机构:ShanghaiAILab&&SenseTime&&CUHKTL;DR提出使用3DOccupancy来表征3D物理场景,相对于3D检测框,3DOcc可提供更细粒度细节。提出OccNet一种多目级连的时序模型,运动规划碰撞率降低15%~58%。创新性:bethefirsttoinvestigateoccupancy......
  • 结合人脸识别,实现渠道风控管理和客户精准营销
    数字客渠道风控系统,助力案场数字化,解决房企客户渠道飞单问题。我们结合阿里、华为、海康等最新计算机视觉算法,实现毫秒级抓拍、一秒上千张图片处理的计算能力,算法+软件开发的结合为房企渠道风控管理、智慧案场实现带来了全新的解决方案。一、客户到访全动线无感抓拍,案场数字化......
  • 信息融合是Occupancy任务必要的吗?工业界是怎么做的?
    前言 最近OCC的综述很多,这两天arxiv上又挂出来一篇,从信息融合的角度全面回顾了占用网络的相关工作,值得一看!本文转载自自动驾驶之心仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV方向的准......
  • 基于肤色模型的人脸识别FPGA实现,包含tb测试文件和MATLAB辅助验证
    1.算法运行效果图预览matlab2022a的测试结果如下:   vivado2019.2的仿真结果如下:   将数据导入到matlab中,   系统的RTL结构图如下图所示:   系统包括中值滤波,RGB转换为ycbcr,人脸检测三个模块 2.算法运行软件版本vivado2019.2 matlab2022a......
  • Unraid 使用 Docker Compose 安装 Immich 套件无法启用人脸识别的原因及修复方法
    原因问题原因是官方教程中的docker-compose.yml指明的机器学习组件immich-machine-learning中的container_name也就是docker-compose.yml中不同service可以互访的媒介hostname与immich-server默认设置中的机器学习服务器url的hostname不匹配造成的。解决方法......
  • [Python急救站]人脸识别技术练习
    这段时间做了一个用于初学者学习人脸识别系统的程序,在上代码时,先给说说事前准备:首先我们需要一个OpenCV的一个haarcascade_frontalface_default.xml文件,只要去GitHub上面即可下载:https://github.com/opencv/opencv点击Code,选择DownloadZIP,下载后解压在目录下opencv-4.x\data\ha......