深度学习-卷积神经网络--MT CNN-人脸检测-64

时间：2024-04-03 10:57:58浏览次数：30

1. MT CNN-的原理
2. 损失函数
4. 升华

Paper地址：
https://kpzhang93.github.io/MTCNN_face_detection_alignment/
github链接：
https://github.com/kpzhang93/MTCNN_face_detection_alignment

1. MT CNN-的原理

图像金字塔
对图片进行Resize操作，将原始图像缩放成不同的尺度，生成图像金字塔。
然后将不同尺度的图像送入到这三个子网络中进行训练，目的是为了可以检测到不同大小的人脸，从而实现多尺度目标检测。

读源码会发现，使用的是每次使面积为原有的1/2 不断的缩小hw 直到不满足12像素为止

P-Net（Proposal Network）
P-Net是一个人脸区域的候选网络，该网络的输入一个12x12x3的图像，通过3层的卷积之后，判断这个12x12的图像中是否存在人脸，并且给出人脸框的回归和人脸关键点。
网络的第一部分输出是用来判断该图像是否存在人脸，输出向量大小1x1x2，也就是两个值。
网络的第二部分给出框的精确位置，一般称为框回归。P-Net输入的12×12的图像块可能并不是完美的人脸框的位置，如有的时候人脸并不正好为方形，有可能12×12的图像偏左或偏右，因此需要输出当前框位置相对完美的人脸框位置的偏移。这个偏移大小为1×1×4，即表示框左上角的横坐标的相对偏移，框左上角的纵坐标的相对偏移、框的宽度的误差、框的高度的误差。
网络的第三部分给出人脸的5个关键点的位置。5个关键点分别对应着左眼的位置、右眼的位置、鼻子的位置、左嘴巴的位置、右嘴巴的位置。每个关键点需要两维来表示，因此输出是向量大小为1×1×10。
注意：P-Net是全卷积网络对于输入图片size要求不限定
R-Net（Refine Network）
从网络图可以看到，只是由于该网络结构和P-Net网络结构有差异，多了一个全连接层，所以会取得更好的抑制false-positive(预测有人脸但实际并不是人脸)的作用。在输入R-Net之前，都需要缩放到24x24x3，网络的输出与P-Net是相同的，R-Net的目的是为了去除大量的非人脸框。
O-Net（Output Network）
这个阶段类似于第二阶段，但是在这个阶段在此阶段，我们目的通过更多的监督来识别面部区域。特别是，网络将输出五个面部关键点的位置。
从网络图可以看到，该层比R-Net层有多了一层卷积层，所以处理的结果会更加精细。输入的图像大小48x48x3，输出包括N个边界框的坐标信息，score以及关键点位置。

从P-Net到R-Net，再到最后的O-Net，网络输入的图像越来越大，卷积层的通道数越来越多，网络的深度（层数）也越来越深，因此识别人脸的准确率应该也是越来越高的。

2. 损失函数

对于是否是人脸，直接使用交叉熵损失函数，
对于框回归和关键点定位，使用L2损失。
最后把这三部分的损失各自乘以自身的权重累加起来，形成最后的总损失。

人脸识别损失函数（cross-entry loss）

回归框的损失函数（Euclidean loss）

关键点的损失函数（Euclidean loss）

总损失：

最后的总损失前添加了一个权重 α ，即损失函数所对应的权重是不一致的

也就是说在O-net 对于landmark的检测更看重

4. 升华

MT CNN 是用来检测图片中哪里有人脸以及人脸的5个关键点位置进行输出（人脸是谁不是不属于MT CNN的任务）
思考下是否可以用这个来检测图片中哪里有人人体的key-point也进行标注？

改下项目是否能用于手掌的检测从而实现隔空的操作有戏里面的角色等等！！！

标签：位置,损失,MT,人脸,图像,CNN,64,Net,关键点
From： https://www.cnblogs.com/cavalier-chen/p/18112186

ASP.NET Core 使用 pdfjs 加载实时水印 base64 编码的 PDF
先下载pdfjs：https://github.com/mozilla/pdf.js目前最新版本是4.0.379把需要的文件放到项目下面，由于最新的pdfjs使用的mjs，看情况可以加下MIME类型：varprovider=newFileExtensionContentTypeProvider();provider.Mappings[".mjs"]="application/javascript";provider......
在aarch64上编译，fstack: master分支：5b97230c858598a10e1b82c tag: v1.23, origin/mast
F-Stack一个基于DPDK的开源和高性能网络框架基于DPDK23.11需要做如下操作sed替换：sed-n'/DEV_RX_OFFLOAD_IPV4_CKSUM/p'drivers/net/macb/*sed-i's/ETH_/RTE_ETH_/g'*.csed-i's/DEV_/RTE_ETH_/g'*.c f-stack适配dpdk20.11sed-i's/RTE_MBUF_F_RX_I......
Kernel调试追踪技术之 Kprobe on ARM64
kprobe是什么？kprobe是一种动态调试机制，用于debugging，动态跟踪，性能分析，动态修改内核行为等，2004年由IBM发布，是名为Dprobes工具集的底层实现机制[1][2]，2005年合入Linuxkernel。probe的含义是像一个探针，可以不修改分析对象源码的情况下，获取Kernel的运行时信息。kprobe的实现原理是......
初始化kubeadm init失败，再次初始化时显示6443、10259、10257、10250、2379、2380被占
第一次使用kubeadminit初始化时，因kubelet.service和和kubelet未启动等部分原因导致初始化失败，当再次初始化时显示6443、10259、10257、10250、2379、2380这几个端口被占用，一个个使用sudolsof-i:port查看太麻烦，直接使用kubeadmreset将当前节点恢复为未安装Kubernetes的状......
SMTP服务器搭建关键步骤？如何配置服务器？
SMTP服务器搭建的注意事项？怎么快速搭建SMTP服务器？电子邮件已经成为我们日常工作和生活中不可或缺的一部分。SMTP服务器作为电子邮件发送的核心组件，其搭建过程至关重要。下面，AokSend就来详细探讨一下SMTP服务器搭建的关键步骤。SMTP服务器搭建：明确需求在搭建SMTP服务器之前，......
日期格式处理EEE MMM dd HH:mm:ss 'GMT'zz yyyy
StringdateTimeString="SunMar1201:01:01GMT+08:002023";DateTimeFormatterformatter=newDateTimeFormatterBuilder().appendPattern("EEEMMMddHH:mm:ss'GMT'zzyyyy").toFormatter(......
url图片转base64
constbase64Str:string=awaitnewPromise(resolve=>{constimg=newImage()img.crossOrigin='anonymous';img.src=url;//图片链接img.onload=function(){constcanvas=document.createElement('canv......
【Python BUG】ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `CX
报错ImportError:/usr/lib/x86_64-linux-gnu/libstdc++.so.6:version`CXXABI_1.3.9‘notfound背景开发的一个python预测程序（算法分析+应用服务），在原本的linux服务器下配置了开发环境，打包后在另一台凝思服务器解压，发现报错。应该是linux系统之间存在差异，动态库缺失......
深度学习-卷积神经网络--Mask RCNN-62
目录1.总体网络结构2.MaskRCNN细节3.loss4.预测参考链接：https://blog.csdn.net/qq_47233366/article/details/131326554?ops_request_misc=%25257B%252522request%25255Fid%252522%25253A%252522171196013016800213023649%252522%25252C%252522scm%252522%25253A%252522201......
P8649 [蓝桥杯 2017 省 B] k 倍区间
importjava.util.*;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);//读取输入的整数n和kintn=sc.nextInt();//数组长度intk=sc.nextInt();//取模的值......

深度学习-卷积神经网络--MT CNN-人脸检测-64

1. MT CNN-的原理

2. 损失函数

4. 升华

相关文章

赞助商

阅读排行