文章目录
前言
将JSON标注文件转换为YOLO格式通常涉及从JSON文件中提取图像尺寸、对象类别和边界框坐标,并将这些信息格式化为YOLO格式所需的格式。YOLO格式通常要求每行包含一个对象的类别ID、归一化后的中心坐标(x, y)以及归一化后的宽度和高度(w, h)。
一、步骤指南
- 读取JSON文件:使用Python的json库读取JSON文件。
- 提取图像尺寸:从JSON数据中获取图像的宽度和高度。
- 遍历标注:遍历JSON数据中的标注列表。
- 提取边界框和类别:对于每个标注,提取边界框的坐标(通常是左上角和右下角的x, y坐标)和对象类别。
- 转换边界框:将边界框坐标转换为YOLO格式所需的归一化中心坐标和宽度/高度。
- 写入YOLO格式文件:将类别ID和归一化后的边界框坐标写入文本文件,每行一个对象。
二、代码实现
1.类别名称到ID的映射
import json
import os
# 类别名称到ID的映射
name2id = {'dog': 0, 'cat': 1} # 根据您的数据集添加更多类别
这是一个字典,将类别名称(如dog和cat)映射到对应的ID(整数)。这是因为在YOLO格式中,目标类别是通过整数ID来表示的。
2.边界框转换函数
def convert(size, box):
dw = 1. / size[0]
dh = 1. / size[1]
x = (box[0] + box[2]) / 2.0
y = (box[1] + box[3]) / 2.0
w = box[2] - box[0]
h = box[3] - box[1]
x = x * dw
y = y * dh
w = w * dw
h = h * dh
return x, y, w, h
- 定义一个函数,这个函数接受两个参数:size(图像的宽度和高度)和box(边界框的坐标,格式为[x1, y1, x2, y2])。
- 将边界框的坐标转换为相对于图像尺寸的比例,并计算边界框的中心点(x, y)和宽度(w)及高度(h)。且这些值被归一化到0到1的范围内,这是YOLO格式的要求。
3.JSON解码函数
def decode_json(json_folder_path, json_filename):
# 构造YOLO格式文件的路径
txt_filename = os.path.join('F:\\path\\to\\your\\labels', json_filename.replace('.json', '.txt'))
with open(txt_filename, 'w') as txt_file:
# 读取JSON文件
json_path = os.path.join(json_folder_path, json_filename)
with open(json_path, 'r', encoding='utf-8') as json_file: # 根据您的JSON文件编码选择正确的编码
data = json.load(json_file)
# 提取图像尺寸(这里假设JSON结构有一个'width'和'height'字段)
img_width = data.get('width', 0)
img_height = data.get('height', 0)
# 遍历标注(这里假设JSON结构有一个'annotations'或'objects'字段包含标注列表)
for annotation in data.get('annotations', data.get('objects', [])):
label_name = annotation['label'] # 提取类别名称
if label_name in name2id: # 检查类别名称是否在映射中
# 提取边界框坐标(这里假设边界框是一个包含四个元素的列表或数组:[x1, y1, x2, y2])
bbox = annotation['bbox'] if 'bbox' in annotation else annotation['points'][0:2] + annotation['points'][2:4] # 根据您的JSON结构选择正确的字段
x1, y1, x2, y2 = bbox
# 转换边界框并写入文件
x, y, w, h = convert((img_width, img_height), (x1, y1, x2, y2))
txt_file.write(f"{name2id[label_name]} {x} {y} {w} {h}\n")
-
定义函数,这个函数接受JSON文件夹的路径和JSON文件的名称作为输入。
-
首先构造YOLO格式文件的输出路径。然后,它读取并解析JSON文件,提取图像的宽度和高度,以及标注信息。对于每个标注,它检查类别名称是否在name2id映射中。如果是,它提取边界框坐标,调用convert函数进行转换,并将结果写入YOLO格式的文本文件中。
4.主程序
if __name__ == "__main__":
json_folder_path = 'F:\\path\\to\\your\\jsons' # 替换为您的JSON文件夹路径
json_filenames = os.listdir(json_folder_path)
for json_filename in json_filenames:
if json_filename.endswith('.json'): # 只处理JSON文件
decode_json(json_folder_path, json_filename)
- 这是脚本的入口点。当脚本被直接运行时,这部分代码会被执行。
- 它设置JSON文件夹的路径,列出该文件夹中的所有文件,并对每个以.json结尾的文件调用decode_json函数。