首页 > 其他分享 >COCO数据集

COCO数据集

时间:2022-08-15 16:55:16浏览次数:79  
标签:__ jpg coco json train COCO 数据

1、基本介绍

MSCOCO 是具有80个类别的大规模数据集,其数据分为三部分:训练、验证和测试,每部分分别包含 118287, 5000 和 40670张图片,总大小约25g。其中测试数据集没有标注信息,所以注释部分只有训练和验证的。
关于COCO的测试集:2017年COCO测试集包含〜40K个测试图像。 测试集被分成两个大致相同大小的split约20K的图像:test-dev 和test-challenge。

Test-Dev:test-dev split 是在一般情况下测试的默认测试数据。通常应该在test-dev集中报告论文的结果,以便公正公开比较。
Test-Challenge:test-challenge split被用于每年托管的COCO挑战

1.1 anatation介绍

  • 图片分为3部分,test、train和val
  • 图片的标注类型分3种:object instances(目标实例), object keypoints(目标上的关键点), 和image captions; 保存格式是json文件,并且是所有图片标注放在一个json文件中
  • 对于目标检测而言,我们需要关注的标注是annotations文件夹下的instances_train.json和instances_val.json,分别对应的是train和val图片的标注
  • instances_train.json格式:
    3种标注类型的"info","licenses","images" 格式是一样的,且定义是共享的。不共享的是annotations这种结构体,它在不同类型的JSON文件中是不一样的

  • person_keypoints_train2017.json格式:
  • captions_train2017.json格式

2、COCO-API介绍使用

  • 1、安装依赖包
pip install pycocotools
>>> from pycocotools.coco import COCO
>>> anno_file="/home/pengyoucou/Data/coco/coco2017/annotations/instances_train2017.json"
>>> coco_train = COCO(anno_file)
loading annotations into memory...
Done (t=11.43s)
creating index...
index created!
>>> dir(coco_train)
['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'annToMask', 'annToRLE', 'anns', 'catToImgs', 'cats', 'createIndex', 'dataset', 'download', 'getAnnIds', 'getCatIds', 'getImgIds', 'imgToAnns', 'imgs', 'info', 'loadAnns', 'loadCats', 'loadImgs', 'loadNumpyAnnotations', 'loadRes', 'showAnns']
>>> len(coco_train.imgs)
118287
>>> coco_train.imgs[0]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 0
>>> type(coco_train.imgs)
<class 'dict'>
>>> type(coco_train.dataset["images"])
<class 'list'>
>>> coco_train.dataset["images"][0]
{'license': 3, 'file_name': '000000391895.jpg', 'coco_url': 'http://images.cocodataset.org/train2017/000000391895.jpg', 'height': 360, 'width': 640, 'date_captured': '2013-11-14 11:18:45', 'flickr_url': 'http://farm9.staticflickr.com/8186/8119368305_4e622c8349_z.jpg', 'id': 391895}
>>> coco_train.imgs[391895]
{'license': 3, 'file_name': '000000391895.jpg', 'coco_url': 'http://images.cocodataset.org/train2017/000000391895.jpg', 'height': 360, 'width': 640, 'date_captured': '2013-11-14 11:18:45', 'flickr_url': 'http://farm9.staticflickr.com/8186/8119368305_4e622c8349_z.jpg', 'id': 391895}
>>> 

参考:https://blog.csdn.net/yanghao201607030101/article/details/112575770

标签:__,jpg,coco,json,train,COCO,数据
From: https://www.cnblogs.com/pyclq/p/16588857.html

相关文章

  • 在一个千万级的数据库查寻中,如何提高查询效率?
     1、数据库设计方面A.对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引。B.应尽量避免在where子句中对字段进行null值判断,否......
  • 刘畊宏男孩女孩看过来!运动数据分析挖掘!⛵
    ......
  • Vue 检测数据
    主要逻辑类似:<script>letdata={name:'name',address:'address',};//创建了一个监视对象,监视data属性的变化constobs=ne......
  • U盘、FTP等传统数据摆渡方式的7大弊端 你入坑了吗?
    随着网络技术的高速发展,网络安全保障机制也受到了巨大的挑战。为了有效地保护内部的核心数据资产,比较普遍的防护手段会采用内外网隔离的策略。隔离之后,很多企业一开始都会......
  • 数据模型的建模方法
    数据模型的建模方法什么是数据模型对现实世界业务对象及关系的抽象为什么需要数据模型数据模型不是必需的,建模的目的是为了改进业务流程、消灭信息孤岛和数据差异及......
  • 取两个List<Object>的差集数据和交集数据 java
    List<ProjectSimpleInfoVO>projectSimpleInfoVOList=newArrayList<>();ProjectSimpleInfoVOprojectSimpleInfoVO=newProjectSimpleInfoVO();pr......
  • 2022-08-15 第六组 Myy 学习笔记_Mysql数据库
    Mysql数据库数据库数据库【按照数据结构来组织、存储和管理数据的仓库】,是一个长期存储载计算机内的、有组织的、可共享的、统一管理的大量数据的集合。数据对于公......
  • Ubuntu 18.04离线安装数据库
    Ubuntu离线安装MySQL8.0.26数据库 Ubuntu18.04离线安装Mysql8.0.26Ubuntu18.04离线安装Mysql8.0.26一、准备mysql下载mysql官网-->download-->社区版,选择对应操......
  • 数据库注入提权总结(四)
    OracleOracle权限分类权限是用户对一项功能的执行权力。在Oracle中,根据系统的管理方式不同,将Oracle权限分为系统权限与实体权限两类。系统权限是指是否被授权用户可以......
  • QGIS上传图层到PostgreSQL数据库
    1.打开QGIS,加载需要上传的图层数据2.右击PostGIS新建连接3.数据连接信息首次连接还需要输入数据库账号密码4.上传图层这个非常简单,只需要把图层拖拽过去,等待一会,即......