摘要:这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类、目标检测及人脸识别任务,对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的数据集较大,官网的下载速度可能比较慢,为了方便大家管理,这里我将其整理到了个人公众号平台中,可通过下方卡片“AI技术研究与分享”关注,并在后台回复各数据集关键字即可获取网盘链接。数据集文件均为官方网站下载,仅用于学习交流,博主会持续更新,欢迎关注。
1. 分类数据集
数据集:MNIST
手写数字数据集,包含一组60,000个示例的训练集和一组10,000个示例的测试集。
官网地址:MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
关键字(建议复制):Face-Place
数据集:CIFAR-10
包含了10个类别的60,000个图像(每个类在上图中表示为一行)。总共有50,000个训练图像和10,000个测试图像。
官网地址:CIFAR-10 and CIFAR-100 datasets
关键字(建议复制):CIFAR-10
数据集:Fashion-MNIST
包含60,000个训练图像和10,000个测试图像。类似MNIST的时尚产品数据库。
官网地址:GitHub - zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark
关键字(建议复制):fashion-mnist
数据集:Imagenet
Imagenet数据集有1400多万幅图片,涵盖2万多个类别,关于图像分类、定位、检测等研究工作大多基于此数据集展开。
官网地址:http://www.image-net.org/about-stats
关键字(建议复制):ImageNet
2. 目标检测数据集
数据集:MS-COCO
COCO是一个规模大且丰富的物体检测,分割和字幕数据集。330K图像,80个物体类别,每幅图像5个字幕,250,000个有关键点的人。
官网地址:COCO - Common Objects in Context
关键字(建议复制):MS-COCO
数据集:PASCAL-VOC
PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统,包括20个目录。
官网地址:The PASCAL Visual Object Classes Homepage
关键字(建议复制):PASCAL-VOC
数据集:BDD100K
自动驾驶常用大型多样化数据集,标注超过100,000张图像,类别包含公共汽车,行人,自行车,卡车,小汽车,火车和骑手等,用于目标检测、全帧分割等。
官网地址:Berkeley DeepDrive
关键字(建议复制):BDD-100K
数据集:Open-Images
Open Images是一个包含近900万个图像URL的数据集。这些图像已经用数千个类别的图像级标签边框进行了注释。
官网地址:Open Images V6
关键字(建议复制):Open-Images
3. 人脸识别数据集
数据集:CASIA-WebFace
包含了10575 个人的494414 张图像。CASIA-webface数据库,里面包含了10000个人,一共50万张人脸图片,均来源于网络。
官网地址:NameBright - Coming Soon
关键字(建议复制):CASIA-WebFace
数据集:PubFig
哥伦比亚大学的公众人物脸部数据集,包含有200个人的58k+人脸图像,主要用于非限制场景下的人脸识别。
官网地址:Pubfig: Public Figures Face Database
关键字(建议复制):PubFig
数据集:CelebA
香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片,人脸属性有40多种,主要用于人脸属性的识别。
官网地址:CelebA Dataset
关键字(建议复制):CelebA
数据集:ColorFeret
包括了一个通用人脸库以及通用测试标准,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。
官网地址:color FERET Database | NIST
关键字(建议复制):ColorFeret
数据集:MTFL
该数据集包含了将近13000张人脸图片,均采自网络。
官网地址:Facial Landmark Detection by Deep Multi-task Learning
关键字(建议复制):MTFL
数据集:FaceDB
包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。
官网地址:BioID Face Database | Face Detection Dataset | facedb - BioID
关键字(建议复制):FaceDB
数据集:LFW
为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于Internet。
官网地址:http://vis-www.cs.umass.edu/lfw/
关键字(建议复制):LFW
数据集:Person identification in TV series
该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。
官网地址:Semi-supervised Learning with Constraints for Person Identification in Multimedia Data
关键字(建议复制):PITVS
数据集:CMUVASC-PIE
CMU PIE人脸库建立于2000年11月,它包括来自68个人的40000张照片,其中包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片。
官网地址:http://vasc.ri.cmu.edu/idb/html/face/index.html
关键字(建议复制):CMUVASC-PIE
数据集:CASIA-FaceV5
该数据集包含了来自500个人的2500张亚洲人脸图片。
官网地址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9
关键字(建议复制):CASIA-FaceV5
数据集:The CNBC Face Database
该数据集采集了200个人在不同状态下(不同的神情,装扮,发型等)的人脸照片。
官网地址:http://wiki.cnbc.cmu.edu/Face_Place
关键字(建议复制):Face-Place
数据集:IMDB-WIKI
IMDB-WIKI人脸数据库总共523,051张人脸数据库,每张图片都被标注了人的年龄和性别,对于年龄识别和性别识别的研究有着重要的意义。
官网地址:IMDB-WIKI - 500k+ face images with age and gender labels
关键字(建议复制):IMDB-WIKI
数据集:FDDB
FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。
官网地址:http://vis-www.cs.umass.edu/fddb/index.html
关键字(建议复制):FDDB
数据集:Caltech-10K-WebFaces
10k+人脸,提供双眼和嘴巴的坐标位置。
官网地址:ttp://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description
关键字(建议复制):Caltech-10K
数据集:JAFFE
该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像,10个人,全部都是女性,每个人做出7种表情。
官网地址:The Japanese Female Facial Expression (JAFFE) Dataset | Zenodo
关键字(建议复制):JAFFE
数据集:AFLW
前2000个AFLW样本的拟合3D面,可用于3D面对齐评估。
官网地址:http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm
关键字(建议复制):AFLW
数据集文件均为官方网站下载,仅用于学习交流,博主会持续更新,欢迎关注。
更多分享,敬请期待!
标签:附网盘,关键字,地址,复制,人脸,官网,数据,链接,下载 From: https://www.cnblogs.com/sixuwuxian/p/16756252.html