数据集
一、常见目标检测数据集
1、PASCAL VOC 07/12
Pascal Visual Object Classes(VOC)挑战赛。对四个目标类别进行分类和检测。这两个版本主要用于基准测试集。VOC2007 有5k个训练图像,超过12k的标注目标;VOC2012有11k个训练图像,超过27k个标注目标,目标类别扩展到了20类,增加了语义分割、动作识别的任务。Pascal VOC引入了mAP@0.5IoU作为评价指标评估模型性能。
2、ILSVRC
ImageNet Large Scale Visual Recognition Challenge。用作评估模型性能的基准集。数据集包含1000个类别、超过100万个图像,其中精选了200个类别、超过500k个图像被于目标检测。
3、MS-COCO
The Microsoft Common Objects in Context。COCO数据集是目前最具挑战的数据集之一,包含了自然环境中发现的、四岁儿童可识别的91种常见目标。包含了超过200万个实例,且平均每张图像中有3.5个类别、7.7个实例,也包括了多种视角的图像。COCO在IoU从0.5到0.95的范围内每隔0.5计算一次mAP,然后平均这十个mAP,得到AP。除此之外,它还将AP分别用于小型、中型和大型对象,以在不同的尺度上比较性能。
注:mAp(mean Average Precision),均值平均精度。
mAp = 所有类别的平均精度求和 / 类别总数
AP(Average Precision)平均精确度
4、Open Image
谷歌提供的数据集,由920万张图像组成。使用图像级标签、对象边界框和分割掩码等进行标注。对于目标检测,Open Image有1600万个包围框,包含190万张图像上的600个类别,每张图像有8.3个对象类别。
二、数据倾斜/偏差问题
图3和图6中,不同类别的图片数量差别很大。在Pascal VOC、MS-COCO、Open Image数据集中,除了前五类,后面类的图片数量显著下降。这种现象表示了数据集的一种倾斜,这必然会在任何目标检测模型的训练过程中产生一种偏差。
因此,在这些倾斜数据集上训练的目标检测模型,对于训练数据中数量较多的类,可能表现出更好的检测性能。
三、评价指标
True positive —— 预测正确,且为正样本
False positive —— 错误的预测成正样本
True negative —— 预测正确,且为负样本
False negative —— 错误的预测成负样本
AP (average precision):每一类的平均精度;
mAP:将所有类的AP求平均值。
标签:检测,常见,目标,AP,图像,类别,数据 From: https://www.cnblogs.com/dxmstudy/p/17813051.html