首页 > 其他分享 >目标检测标签可视化工具(yolo、coco、voc)

目标检测标签可视化工具(yolo、coco、voc)

时间:2024-07-26 14:57:03浏览次数:25  
标签:img voc int yolo label objects coco path root

通用目标检测标签可视化工具

在目标检测的任务中,我们通常需要对检测结果进行可视化,以便更好地理解模型的性能。本文将介绍一个通用的目标检测标签可视化工具,该工具支持读取VOC格式(XML)、COCO格式(JSON)和YOLO格式(TXT)的标签,并将这些标签以边界框的形式绘制在对应的图像上。

工具简介

本文提供的代码可以自动读取指定目录下的图片和标签文件,并将标签信息绘制在图片上,然后将处理后的图片保存到指定目录。代码使用了OpenCV库进行图像处理,并提供了颜色管理类Colors,可以方便地为不同类别的对象分配不同的颜色。

代码实现

依赖库

首先,需要确保安装了以下依赖库:

pip install opencv-python

代码实现

以下是实现代码:

import os
import cv2
import xml.etree.ElementTree as ET
import json

class Colors:
    def __init__(self):
        hex = ('FF3838', 'FF9D97', 'FF701F', 'FFB21D', 'CFD231', '48F90A', '92CC17', '3DDB86', '1A9334', '00D4BB',
               '2C99A8', '00C2FF', '344593', '6473FF', '0018EC', '8438FF', '520085', 'CB38FF', 'FF95C8', 'FF37C7')
        self.palette = [self.hex2rgb('#' + c) for c in hex]
        self.n = len(self.palette)

    def __call__(self, i, bgr=False):
        c = self.palette[int(i) % self.n]
        return (c[2], c[1], c[0]) if bgr else c

    @staticmethod
    def hex2rgb(h):
        return tuple(int(h[1 + i:1 + i + 2], 16) for i in (0, 2, 4))

def plot_one_box(x, im, color=(128, 128, 128), label=None, line_thickness=3):
    assert im.data.contiguous, 'Image not contiguous. Apply np.ascontiguousarray(im) to plot_on_box() input image.'
    tl = line_thickness or round(0.002 * (im.shape[0] + im.shape[1]) / 2) + 1
    c1, c2 = (int(x[0]), int(x[1])), (int(x[2]), int(x[3]))
    cv2.rectangle(im, c1, c2, color, thickness=tl, lineType=cv2.LINE_AA)
    if label:
        tf = max(tl - 1, 1)
        t_size = cv2.getTextSize(label, 0, fontScale=tl / 3, thickness=tf)[0]
        c2 = c1[0] + t_size[0], c1[1] - t_size[1] - 3
        cv2.rectangle(im, c1, c2, color, -1, cv2.LINE_AA)
        cv2.putText(im, label, (c1[0], c1[1] - 2), 0, tl / 3, [225, 255, 255], thickness=tf, lineType=cv2.LINE_AA)

def parse_voc_annotation(xml_file):
    tree = ET.parse(xml_file)
    root = tree.getroot()
    objects = []
    for obj in root.findall('object'):
        cls = obj.find('name').text
        bbox = obj.find('bndbox')
        x1 = int(bbox.find('xmin').text)
        y1 = int(bbox.find('ymin').text)
        x2 = int(bbox.find('xmax').text)
        y2 = int(bbox.find('ymax').text)
        objects.append((cls, x1, y1, x2, y2))
    return objects

def parse_coco_annotation(json_file, img_id):
    with open(json_file, 'r') as f:
        data = json.load(f)
    objects = []
    for ann in data['annotations']:
        cls_id = ann['category_id']
        bbox = ann['bbox']
        x1 = int(bbox[0])
        y1 = int(bbox[1])
        x2 = int(bbox[0] + bbox[2])
        y2 = int(bbox[1] + bbox[3])
        objects.append((cls_id, x1, y1, x2, y2))
    return objects

def parse_yolo_annotation(txt_file, img_shape):
    with open(txt_file, 'r') as f:
        lines = f.readlines()
    w, h = img_shape[1], img_shape[0]
    objects = []
    for line in lines:
        parts = line.strip().split()
        cls_id = int(parts[0])
        x_center = float(parts[1]) * w
        y_center = float(parts[2]) * h
        width = float(parts[3]) * w
        height = float(parts[4]) * h
        x1 = int(x_center - width / 2)
        y1 = int(y_center - height / 2)
        x2 = int(x_center + width / 2)
        y2 = int(y_center + height / 2)
        objects.append((cls_id, x1, y1, x2, y2))
    return objects

def show_label(path_root_imgs, path_root_labels, save_path_root_imgs):
    class_categories = ['Abrasion', 'Crazing', 'Patches', 'Inclusion', 'Uneven', 'Blowhole', 'Break', 'Crack', 'Crescent_Gap', 'Crease', 'Silk-Spot', 'Water-Spot', 'Weld-Line', 'GC-Inclusion', 'Oil-Spot', 'Rolled-Pit', 'Punching', 'Waist-Folding', 'Bruise', 'Pitted_Surface', 'Rolled-in_Scale', 'Scratches', 'Bubble']

    if not os.path.exists(save_path_root_imgs):
        os.makedirs(save_path_root_imgs)

    colors = Colors()

    for root, _, files in os.walk(path_root_imgs):
        for file in files:
            if file.endswith('.jpg'):
                img_path = os.path.join(root, file)
                label_path = os.path.join(path_root_labels, file.replace('.jpg', '.txt'))
                save_path = os.path.join(save_path_root_imgs, file)

                img = cv2.imread(img_path)
                if img is None:
                    continue

                objects = []
                if os.path.exists(label_path):
                    objects = parse_yolo_annotation(label_path, img.shape)
                else:
                    xml_path = os.path.join(path_root_labels, file.replace('.jpg', '.xml'))
                    json_path = os.path.join(path_root_labels, file.replace('.jpg', '.json'))
                    if os.path.exists(xml_path):
                        objects = parse_voc_annotation(xml_path)
                    elif os.path.exists(json_path):
                        img_id = int(file.split('.')[0])
                        objects = parse_coco_annotation(json_path, img_id)

                img_tmp = img.copy()
                for obj in objects:
                    if isinstance(obj[0], int):
                        label = class_categories[obj[0]]
                    else:
                        label = obj[0]
                    plot_one_box(obj[1:], img_tmp, color=colors(obj[0]), label=label)

                cv2.imwrite(save_path, img_tmp)
                print(f"Saved: {save_path}")

if __name__ == '__main__':
    path_root_labels = r'路径到标签文件夹'
    path_root_imgs = r'路径到图片文件夹'
    save_path_root_imgs = r'保存结果的文件夹路径'
    
    show_label(path_root_imgs, path_root_labels, save_path_root_imgs)

代码使用说明

准备工作

  1. 安装依赖:确保安装了OpenCV库,使用以下命令安装:
    pip install opencv-python
    
  2. 文件组织:将图片文件和标签文件分别放置在两个不同的文件夹中。

参数设置

在运行代码前,需要根据自己的文件路径进行参数设置:

  • path_root_labels:标签文件夹路径。
  • path_root_imgs:图片文件夹路径。
  • save_path_root_imgs:保存结果的文件夹路径。

运行代码

配置好路径后,直接运行代码即可:

python your_script_name.py

功能说明

  • Colors类:用于管理颜色的分配,每个类别的对象会分配一个唯一的颜色。
  • plot_one_box函数:在图像上绘制一个边界框,并在边界框上显示标签信息。
  • parse_voc_annotation函数:解析VOC格式(XML)的标签文件。
  • parse_coco_annotation函数:解析COCO格式(JSON)的标签文件。
  • parse_yolo_annotation函数:解析YOLO格式(TXT)的标签文件。
  • show_label函数:读取指定目录下的图片和标签文件,调用上述函数解析标签并绘制在图片上,最后将结果保存到指定目录。

标签:img,voc,int,yolo,label,objects,coco,path,root
From: https://blog.csdn.net/qq_48626006/article/details/140715847

相关文章

  • Python,运行Yolo项目,报错AttributeError: ‘ImageDraw‘ object has no attribute ‘te
    Python3.9问题描述:其他电脑已经运行成功的Python,YOLO代码到我电脑上运行报错Traceback(mostrecentcalllast): File"C:\Users\Administrator\Desktop\20240725\识别项目\predict.py",line122,in<module>  frame=np.array(yolo.detect_image(frame)) Fil......
  • YOLOV8训练过程中的那些事
    经过一系列的折腾,终于可以开始训练模型了,好在官网上提供了多种情况下的训练代码,直接使用即可。官网提供的代码如下:点击查看代码fromultralyticsimportYOLO#加载模型model=YOLO("yolov8n.yaml")#从YAML中创建一个新的模型model=YOLO("yolov8n.pt")#使用一个......
  • 【PyTorch】基于YOLO的多目标检测项目(二)
    【PyTorch】基于YOLO的多目标检测项目(一)【PyTorch】基于YOLO的多目标检测项目(二)YOLO-v3网络由跨距为2的卷积层、跳跃连接层和上采样层组成,没有池化层。网络接收一幅416*416的图像作为输入,并提供三个YOLO输出。目录准备配置文件搭建YOLO模型 搭建PyTorch模块搭......
  • YOLOv8改进 | 主干网络 | ⭐重写星辰Rewrite the Stars⭐【CVPR2024】
     秋招面试专栏推荐:深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转......
  • yolov5-采用k-means进行锚框的聚类
    K-means算法是一种无监督学习方法,主要用于数据聚类,即将相似的数据点分组到同一类别中。其基本思想是通过迭代过程,将数据集划分为K个簇(cluster),每个簇由一个中心点(centroid)表示,而簇内的数据点与该簇中心点的距离最小。在计算机视觉中,它常被用于找到图像中物体的锚框。K-means算......
  • 在安卓上运行yolov8目标检测模型(ncnn)
    在安卓上运行yolov8目标检测模型(ncnn)关于首次发表日期:2024-07-25本人不会Java和Android,如有错误,敬请指出主要是整理一下以下资料https://medium.com/@gary.tsai.advantest/top-tutorials-for-deploying-custom-yolov8-on-android-️-dd6746afc1e6https://github.com/FeiGeCh......
  • YOLOv10实时端到端目标检测
    文章目录前言一、非极值大抑制(NMS)二、NMS算法的具体原理和步骤三、YOLOV10创新点四、YOLOv10使用教程五、官方github地址前言  距离上次写YOLOv5已经过去了两年,正好最近用YOLOv10重构了项目,总结下YOLOv10。YOLOv10真正实时端到端目标检测,那么什么是端到端? ......
  • 保卫萝卜PC版:解决libcocosdenshion.dll文件丢失的全面指南
    在畅玩游戏的过程中,遇到错误提示“找不到指定模块”或“缺少libcocosdenshion.dll”等问题,是许多玩家都会面临的困扰。这个问题通常意味着你的电脑系统中缺失了特定的动态链接库(DLL)文件,而这个文件是游戏《保卫萝卜》PC版运行所必需的。本文将深入探讨这一问题的原因及解决方案,......
  • DroneVehicle数据集标签转换(.xml→.txt yolo_obb)
    1.数据集下载:目录1.数据集下载:2.数据集介绍:3.数据集标签转换1.DroneVehicle转DOTA2.DOTA转YOLO_OBB5.数据集标签可视化DroneVenicle数据集是由天津大学收集、标注的大型无人机航拍车辆数据集。DroneVenicle训练集下载地址:https://pan.baidu.com/s/1ptZCJ1mKYqFnMn......
  • 边缘设备使用记录--阿加犀AIBox 6490(realsense+yolox部署)
    边缘设备使用记录--阿加犀AIBox6490:realsense+yolox部署前言RealsenseSDK+ROSYOLOx部署预处理后处理可视化ROS节点总结前言由于6490这个板子是有type-c接口的,所以这里准备用Realsense+YOLOx来先简单做一个实时的目标检测的东西出来,这里也用到上一篇文章所提到......