人脸图像是整个图像领域里面研究人员最多,应用最广的一个方向。GAN作为时下最新兴的深度学习模型,在人脸图像领域里已经颇有建树,今天咱们就聊聊GAN对人脸图像算法的一些主要影响。
文/编辑 | 言有三
人脸检测
人脸检测是一个古老的课题了,从传统算法发展到深度学习算法,已经非常的成熟,不过这并不是意味着完美。GAN在人脸检测领域中的贡献主要体现在小脸的超分辨上。
以文[1]为代表,生成器使用了一个超分辨率网络(super-resolution network)和一个改进网络(refinement network)对模糊的小脸进行上采样,能够提高wider face难测试集(Hard subset)的结果。
[1] Bai Y, Zhang Y, Ding M, et al. Finding tiny faces in the wild with generative adversarial network[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 21-30.
遮挡人脸恢复与姿态仿真
人脸识别算法发展了很久也已经在工业界大规模应用,但是它的难题仍然是很明显的,遮挡就是其中一个大问题,GAN可以被应用于遮挡人脸的恢复。
另一方面,姿态对人脸识别等算法的影响非常大,也会造成上述的遮挡问题,将GAN用于姿态仿真,比如正脸化,将非常有助于人脸识别等模型的性能提升。FF-GAN[2]是其中的代表性模型,它是一个基于3DMM模型的条件GAN。
[2] Yin X, Yu X, Sohn K, et al. Towards large-pose face frontalization in the wild[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017: 3990-3999.
年龄与表情仿真
跨年龄的人脸识别和验证是一个非常具有挑战性的问题,如果能对年龄进行归一化,去除年龄因素的干扰,将大大提升跨年龄人脸识别的精度。
表情与年龄一样,也会对人脸识别算法构成一定挑战,年龄和表情编辑同时还是一个兼具娱乐性的应用方向,GAN在其中大有可为。
[3] Antipov G, Baccouche M, Dugelay J L. Face aging with conditional generative adversarial networks[C]//2017 IEEE International Conference on Image Processing (ICIP). IEEE, 2017: 2089-2093.
[4] Song L, Lu Z, He R, et al. Geometry guided adversarial facial expression synthesis[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 627-635.
换脸算法与伪造脸识别
换脸算法有很多种,不过时下最流行的自然是基于GAN的算法,使得换脸已经从实验室走向了工业界,甚至达到了以假乱真的效果。当然,一个工业级的应用肯定还需要GAN以外其他领域技术的辅助,我们后面会给大家介绍。
目前多个大规模的伪造数据集[6]也被发布,检测伪造脸的研究才刚刚开始,面临着巨大的挑战,只希望科技能尽量向善。
[5] Korshunov P, Marcel S. Deepfakes: a new threat to face recognition? assessment and detection[J]. arXiv preprint arXiv:1812.08685, 2018.
[6] FaceForensics++: Learning to Detect Manipulated Facial Images
人脸美颜与风格化
人脸美颜是一个由来已久的研究课题,传统的方法多是基于滤波算法和几何变换,可以实现磨皮美白以及脸型调整。随着GAN的流行,更多的个性化操作变得可行,比如人脸的妆造迁移,以BeautyGAN[7]为其中的典型代表。
另一方面,头像风格化等应用[8]在娱乐社交领域也有很重要的一席之地,感兴趣的可以跟进。
[7] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//2018 ACM Multimedia Conference on Multimedia Conference. ACM, 2018: 645-653.
[8] Kim J, Kim M, Kang H, et al. U-GAT-IT: unsupervised generative attentional networks with adaptive layer-instance normalization for image-to-image translation[J]. arXiv preprint arXiv:1907.10830, 2019.
如何进行实战深造
标签:Conference,人脸识别,杂谈,GAN,算法,人脸,2018 From: https://blog.51cto.com/u_14122493/5751234