数据集介绍
MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。
该数据集特点如下:
- Object segmentation
- Recognition in context
- Superpixel stuff segmentation
- 330K images (>200K labeled)
- 1.5 million object instances
- 80 object categories
- 91 stuff categories
- 5 captions per image
- 250,000 people with keypoints
33万张图片,有20万张已标记;91个物体类别,其中80个目标检测类别。
person
bicycle
car
motorbike
aeroplane
bus
train
truck
boat
traffic light
fire hydrant
stop sign
parking meter
bench
bird
cat
dog
horse
sheep
cow
elephant
bear
zebra
giraffe
backpack
umbrella
handbag
tie
suitcase
frisbee
skis
snowboard
sports ball
kite
baseball bat
baseball glove
skateboard
surfboard
tennis racket
bottle
wine glass
cup
fork
knife
spoon
bowl
banana
apple
sandwich
orange
broccoli
carrot
hot dog
pizza
donut
cake
chair
sofa
pottedplant
bed
diningtable
toilet
tvmonitor
laptop
mouse
remote
keyboard
cell phone
microwave
oven
toaster
sink
refrigerator
book
clock
vase
scissors
teddy bear
hair drier
toothbrush
数据集组成
这里要注意下 COCO2017 与 COCO2014的区别,两者数据集总量一样,只是划分比率不一样
2014采用的是 train / val 是83K图片和41K图片的划分,测试采用 dev/stardard/reserve/challenge 四种模式
2017采用的是 train / val 是118k 图片和 5k图片的划分,测试采用的 dev / challenging 两种划分模式
目前目标检测使用的基本都是COCO2017数据集
├── coco2017
├── train2017所有训练图像文件夹(118287张)
├── val2017 所有验证图像文件夹(5000张)
├── annotations:标注文件夹
├── istances_train2017.json:对应目标检测、分割任务的训练集标注文件
├── instances_val2017.json: 对应目标检测、分割任务的验证集标注文件
├── captions_train2017.json: 对应图像描述的训练集标注文件
├── captions_val2017.json: 对应图像描述的验证集标注文件
├── person_keypoints_train2017.json: 对应人体关键点检测的训练集标注文件
├── person_keypoints_val2017.json: 对应人体关键点检测的验证集标注文件
标签:val2017,train2017,介绍,json,检测,COCO,数据,标注
From: https://www.cnblogs.com/qev211/p/17987775