一、数据分析
该数据集采用COCO格式给出标注信息,即将所有训练图像的标注都存放到一个json文件中,数据以字典嵌套的形式存放。
对数据集进行分析:
检测数据集涉及3个场景,分别是“火灾检测”、“工业仪表检测”和“安全帽检测”,共7114张图像。这些图像按8:2的比例划分为训练集、验证集,即训练集中有5691张图像,验证集中有1423张图像。
keys: dict_keys(['images', 'type', 'annotations', 'categories']) 物体类别: [{'supercategory': 'none', 'id': 1, 'name': 'fire'}, {'supercategory': 'none', 'id': 2, 'name': 'head'}, {'supercategory': 'none', 'id': 3, 'name': 'helmet'}, {'supercategory': 'none', 'id': 4, 'name': 'person'}, {'supercategory': 'none', 'id': 5, 'name': 'meter'}] 图像数量: 5691 图像信息: {'file_name': '001772.jpg', 'height': 932.0, 'width': 1000.0, 'id': 0} 标注物体数量: 23053 查看一条目标物体标注信息: {'area': 472632.0, 'iscrowd': 0, 'bbox': [310.0, 58.0, 564.0, 838.0], 'category_id': 1, 'ignore': 0, 'image_id': 0, 'id': 1}标签:分析,none,比赛,supercategory,标注,图像,完整版,id,name From: https://www.cnblogs.com/yonuyeung/p/17347621.html