首页 > 其他分享 >【CV数据集总结】face_landmark_dataset总结

【CV数据集总结】face_landmark_dataset总结

时间:2023-08-03 18:34:13浏览次数:40  
标签:总结 https dataset 300w file ibug landmark path

前言

本文主要整理总结face landmark有关的数据集。 Face 2D Keypoint ‒ MMPose 1.1.0 documentation https://github.com/open-mmlab/mmpose/blob/main/docs/en/dataset_zoo/2d_face_keypoint.md 关键特征点个数有5/15/68/98/106...

数据集

300W dataset

68个点,Indoor和Outdoor目录各300个人脸及其68个点的标注文件; 数据集下载 https://ibug.doc.ic.ac.uk/download/annotations/300w.zip.001 https://ibug.doc.ic.ac.uk/download/annotations/300w.zip.002 https://ibug.doc.ic.ac.uk/download/annotations/300w.zip.003 https://ibug.doc.ic.ac.uk/download/annotations/300w.zip.004 其他数据集下载链接 xm2vts: 只有2360个68点的标注文件 https://ibug.doc.ic.ac.uk/download/annotations/xm2vts.zip frgc:只有4950个68点的标注文件 https://ibug.doc.ic.ac.uk/download/annotations/frgc.zip

lfpw

测试和训练集共有2070/2=1035张图像及其68个点标注文件; https://ibug.doc.ic.ac.uk/download/annotations/lfpw.zip

helen

测试和训练集共有4660/2=2330个人脸及其68个点标注文件; https://ibug.doc.ic.ac.uk/download/annotations/helen.zip

AFW

674/2=337个人脸及其68个点标注文件; https://ibug.doc.ic.ac.uk/download/annotations/afw.zip

ibug

270/2=135个人脸及其68个点标注文件; https://ibug.doc.ic.ac.uk/download/annotations/ibug.zip

WFLW dataset

Look at Boundary: A Boundary-Aware Face Alignment Algorithm WFLW Dataset - Machine Learning Datasets 这是由商汤提供的,98个关键点,还包括occlusion, position, make-up, lighting, blur, and expression等人脸属性;训练集7500images(list_98pt_rect_attr_train.txt),测试集2500images(list_98pt_rect_attr_test.txt); 标签格式:196+4+6+1=207;
coordinates of 98 landmarks (196) + coordinates of upper left corner and lower right corner of detection rectangle (4) + attributes annotations (6) + image name (1)
  x0 y0 ... x97 y97 x_min_rect y_min_rect x_max_rect y_max_rect pose expression illumination make-up occlusion blur image_name
标注图像

 为什么出现两个wflw_annotations.tar文件呢?

Lapa dataset

GitHub - JDAI-CV/lapa-dataset: A large-scale dataset for face parsing (AAAI2020) 106points; GitHub - lucia123/lapa-dataset: A large-scale dataset for face parsing (AAAI2020)  

JD-landmark

Grand Challenge of 106-p Facial Landmark Localization https://sites.google.com/view/hailin-shi Grand Challenge of 106-Point Facial Landmark Localization 106个关键特征点; 需要注意的是每个图仅仅标注了一张人脸关键点。需要注意的坑是其中#75和#105重合,#84和#106重合。

合并后数据集链接: https://pan.baidu.com/s/179crM6svNbK3w28Z0ycBHg 提取码: 7guh  

Kaggle dataset

Facial Keypoints Detection 4+15points;  

分析总结

68个关键点的数据集:

300w(600) / lfpw(1035) / helen(2330) / AFW(337) / ibug(135); 600+1035+2330+337+135=4437; 300w_name,包含indoor和outdoor; lfpw_train/test_name,训练集和测试集的名字重名,需要区分开,直接使用train/test或者0/1指定; helen,train/test数据集,应该没有重名的,可以直接使用,需要验证注意,因为名字没有规律; afw,与helen相似,不知道二者有没有重复的; ibug,有规律,但是不知道会不会和lfpw重复; 故,最好都加上原数据集的名称,然后组成新的数据集,再分割train/valid; gen68kp.sh
#!/bin/sh
'''
generate 68 keypoints face landmark dataset from 300w/lfpw/helen/afw/ibug dataset.
300w  01_Indoor/02_Outdoor 300w_name
lfpw  trainset/testset     lfpw0/1_name
helen trainset/testset     helen_name
afw                        afw_name
ibug                       ibug_name
'''

script_path="$(pwd)"
kp68path="$script_path/68kp"
# 300w
for file in $script_path/300w/300w/01_Indoor/*; do
    echo $file
    base=$(basename $file)
    newfile=$kp68path/"300w_"$base
    cp $file $newfile
done
for file in $script_path/300w/300w/02_Outdoor/*; do
    echo $file
    base=$(basename $file)
    newfile=$kp68path/"300w_"$base
    cp $file $newfile
done
# lfpw
for file in $script_path/lfpw/trainset/*; do
    echo $file
    base=$(basename $file)
    newfile=$kp68path/"lfpw0_"$base
    cp $file $newfile
done
for file in $script_path/lfpw/testset/*; do
    echo $file
    base=$(basename $file)
    newfile=$kp68path/"lfpw1_"$base
    cp $file $newfile
done
# helen/afw/ibug
# jpg ---> png
for file in $kp68path/*.jpg; do
# for file in $script_path/aaa/*jpg; do
    pngname=${file%.jpg}.png
    # convert "$file" "${file%.jpg}.png"
    ffmpeg -pix_fmt rgb24 -i $file -pix_fmt rgb24 $pngname
    rm $file
done

# split dataset to train/valid with png/pts.
'''
.dataset68
├── train
│   ├── png
│   └── pts
└── valid
    ├── png
    └── pts
'''
dataset_path="$script_path/dataset68"
cd $script_path
find $script_path/68kp/ -name "*.png" > $script_path/image.txt
rm -r $dataset_path
mkdir $dataset_path
cd $dataset_path
mkdir train valid
cd train
mkdir png pts
cd ../valid
mkdir png pts
cd $script_path
python genpath.py  # 分割数据集
View Code

98个关键点的数据集:

wflw(10000) / JD-landmarks-98(unavaiable?)

106个关键点的数据集:

JD-landmark(?) / Lapa(22000) 可以先使用68个点的进行训练,后续再训练98/106的,需要预处理数据集;

参考

  1. Face 2D Keypoint ‒ MMPose 1.1.0 documentation
  2. mmlab_2d_face_keypoint
  3. Look at Boundary: A Boundary-Aware Face Alignment Algorithm
  4. GitHub - lucia123/lapa-dataset: A large-scale dataset for face parsing (AAAI2020)
  5. GitHub - JDAI-CV/lapa-dataset: A large-scale dataset for face parsing (AAAI2020)
  6. Grand Challenge of 106-p Facial Landmark Localization
  7. Facial Keypoints Detection

 

标签:总结,https,dataset,300w,file,ibug,landmark,path
From: https://www.cnblogs.com/happyamyhope/p/17603063.html

相关文章

  • HTML总结笔记
    HTML总结学习来源:https://www.bilibili.com/video/BV1x4411V75C?p=11&vd_source=c406cec6bb9d5441fcb8903f9c8242d5基本标签<h1>一级标签</h1><h2>二级标签</h2><h3>三级标签</h3><h4>四级标签</h4><h5>五级标签</h5><h6>六级......
  • 大模型(LLM)最新趋势总结
    关键结论:开源社区模型不具备真正智能,更好的小模型来自大模型的ScaleDownGPT-4模型信息:采用MoE架构,16个experts,800b参数如何减少幻觉hallucination?scaling/retrieval/rewardmodel指令遵循的开源小模型被过度炒作,已经到达瓶颈,突破方向是更强的BaseModel和更进一步的反馈......
  • 模拟赛总结(1)
    一.题目解析1.遗忘的来年花期20%:因为序列严格递增,所以直接cout<<0;即可。100%:注意不等号和\(i\)的范围,之后直接模拟。#include<iostream>#include<cstring>#include<cstdio>#include<cmath>#include<algorithm>#include<stack>#include<queue>#......
  • web前端技能方法总结(css、js、jquery、html)(2)
    创建链接块display:block;列表样式在一个无序列表中,列表项的标志(marker)是出现在各列表项旁边的圆点。在有序列表中,标志可能是字母、数字或另外某种计数体系中的一个符号。要修改用于列表项的标志类型,可以使用属性list-style-type:ul{list-style-type:square;}1上面的声明把......
  • 【考后总结】8 月 CSP-S 模拟赛 1
    8.3CSP模拟13\(\text{zero4338round}\)T1y显然\(\text{xt}\)会选择四个角,对每个格子求出到四个角的曼哈顿距离最大值,操作一定会优先选择最大值较小的,所以把距离数组排个序就行了。T2s经典套路是设答案是\(a\),把小于\(a\)的位置设成\(0\),大于等于设成\(1\),这样按......
  • Tita 升级|总结模板,满足多种管理要求
    升级详情一、【总结】支持自定义总结模板「总结模板」菜单1.都谁可见总结管理员、超管、老板、助理可见总结模板菜单,并可查看系统模板与公司的所有自定义模板;当你被授权为某个自定义菜单的管理员时,也可看到总结模板菜单与被授权管理的模板;注意:系统模板不可编辑,仅总结管......
  • 微信小程序页面跳转方法总结
    在我们日常的开发过程中,跳转页面是每个项目中必有的需求,包括监听返回按钮,回到指定页面,在小程序中页面跳转即页面路由页面栈框架以栈的形式维护了当前的所有页面。当发生路由切换的时候,页面栈的表现如下:getCurrentPages()函数用于获取当前页面栈的实例,以数组形式按栈的顺序给出,第一......
  • 嵌入式软件开发就业面试题。2022最新,最全总结
    1.select和epoll的区别解题思路(这个我在找面试题之前没了解过,还是学的太少了,多学!!!)select的时间复杂度O(n)。它仅仅知道了,有I/O事件发生了,却并不知道是哪那几个流(可能有一个,多个,甚至全部),我们只能无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作。所以select具有O......
  • 做每日总结的重要性
    每日总结是一种对自己工作和学习的反思和总结,具有重要的意义和作用。以下是每日总结的重要性:1.提高工作效率:每日总结可以帮助我们回顾一天的工作,发现工作中存在的问题和不足之处,并提出改进的方法和措施。通过总结,我们可以更好地规划和安排下一天的工作,提高工作的效率和质量。2......
  • 【Java】多线程面试题总结
    最近在看面试题,所以想用自己的理解总结一下,便于加深印象。为什么使用多线程使用多线程可以充分利用CPU,提高CPU的使用率。提高系统的运行效率,对于一些复杂或者耗时的功能,可以对其进行拆分,比如将某个任务拆分了A、B、C三个子任务,如果子任务之间没有依赖关系,那么就可以使用多线程......