yoloV8训练标注数据生成模型

时间：2024-07-09 16:29:43浏览次数：18

标签：img os 模型 yoloV8 path data image dir 标注

1、标注工具：vott

2、yoloV8

2.1 仓库地址

https://github.com/ultralytics/ultralytics

2.2 参考教程文档

文档地址：
https://github.com/ultralytics/ultralytics/wiki

3、数据集|标注数据格式

3.1 数据集格式【coco128】

3.1.1 下载地址：

https://cocodataset.org/#download

3.1.2 官网示例：

3.2 项目配置coco128数据集

将下载的数据集解压至指定位置，*文件路径固定【跟路径下datasets】

path: ../datasets/coco8 
train: images/train
val: images/val

3.2.1 数据集格式转化

该数据集是使用labelme，对单图进行标注的json格式。转为yolo可以使用的格式

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2024/6/3
# @Author : CCM
# @Describe : 该数据集是使用labelme，对单图进行标注的json格式。转为yolo可以使用的格式

import os
import json
import base64
from PIL import Image
from io import BytesIO


# 辅助函数解码base64图像数据
def decode_image(image_data):
    img_data = base64.b64decode(image_data)
    img = Image.open(BytesIO(img_data))
    return img


# 将多边形点转换为YOLO bbox格式
def polygon_to_yolo_bbox(points, img_width, img_height):
    x_coords = [point[0] for point in points]
    y_coords = [point[1] for point in points]
    xmin = min(x_coords)
    xmax = max(x_coords)
    ymin = min(y_coords)
    ymax = max(y_coords)
    x_center = (xmin + xmax) / 2.0 / img_width
    y_center = (ymin + ymax) / 2.0 / img_height
    width = (xmax - xmin) / img_width
    height = (ymax - ymin) / img_height
    return [x_center, y_center, width, height]


# Paths
input_dir = r'C:\Users\ccm\Documents\印章数据集\印章标注\印章标注'  # 标注文件夹路径
images_dir = '../datasets/seal/images/train2017'
labels_dir = '../datasets/seal/labels/train2017'

# 如果目录不存在，创建目录
os.makedirs(images_dir, exist_ok=True)
os.makedirs(labels_dir, exist_ok=True)

# 处理输入目录中的每个JSON文件
for filename in os.listdir(input_dir):
    if filename.endswith('.json'):
        json_path = os.path.join(input_dir, filename)
        with open(json_path, 'r', encoding='utf-8') as file:
            data = json.load(file)
        image_name = data['imagePath']
        image_data = decode_image(data['imageData'])
        image_path = os.path.join(images_dir, os.path.basename(image_name))
        # 存图
        image_data.save(image_path)
        # 准备标签文件
        label_path = os.path.join(labels_dir, os.path.splitext(os.path.basename(image_name))[0] + '.txt')
        img_width, img_height = image_data.size
        with open(label_path, 'w') as label_file:
            for shape in data['shapes']:
                label = shape['label']
                points = shape['points']
                bbox = polygon_to_yolo_bbox(points, img_width, img_height)
                # 假设所有标签都是'stamp'，类id为0
                label_file.write(f"0 {' '.join(map(str, bbox))}\n")
        print(f"处理和保存图像和标签 {image_name}")
print("完成")

3.2.2 项目配置摘要

4、训练|验证|推理|存储模型

我使用yolov8n.pt 模型进行，根据自身条件选择合适的模型进行训练。

4.1 训练

学习率|训练次数深度|使用模型|数据集配置yaml|等参数自我配置

yolo detect train data=coco8.yaml model=yolov8n.pt epochs=100 imgsz=640 device=0,1
yolo detect train data=datasets/seal/seal_ccm.yaml model=yolov8n.yaml pretrained=ultralytics/yolov8n.pt epochs=100 batch=2 lr0=0.01 resume=True

4.2 验证

yolo detect val  data=datasets/seal/seal_ccm.yaml model=runs/detect/train/weights/best.pt batch=2

4.3 训练验证结果

4.4 评估模型

results = detect.run(weights='runs/train/exp/weights/best.pt', source='data/images', img_size=img_size)
print(results)

4.5 进行推理

detect.run(weights='runs/train/exp/weights/best.pt', source='path/to/your/test/images', img_size=img_size)

4.6 导出为ONNX或其它格式

python export.py --weights runs/train/exp/weights/best.pt --img 640 --batch 1

4.7 模型使用

import torch
from yolov5 import detect

# 加载模型
model = torch.hub.load('ultralytics/yolov5', 'custom', path='runs/train/exp/weights/best.pt')

# 进行推理
img = 'path/to/your/image.jpg'
results = model(img)
results.show()  # 展示结果
results.save()  # 保存结果

5、倾斜弯曲文字识别算法解析

相关流程和代码【后续更新】

标签：img,os,模型,yoloV8,path,data,image,dir,标注
From： https://blog.csdn.net/weixin_41828071/article/details/140289635

PointNet——源码调试（模型训练+可视化测试显示）
因为项目涉及到3D点云项目，故学习下PointNet这个用来处理点云的神经网络论文的话，大致都看了下，网络结构有了一定的了解，本博文主要为了下载调试PointNet网络源码，训练和测试调通而已，不涉及后续的改进优化。我是在Anaconda下创建一个新的虚拟环境空间部署项目测试大概用到的就......
开源大模型对比
随着chatgpt诞生，开源大模型的也获得了突飞猛进的进展，值得关注的是国内本地私有大模型已经在很多真实的场景中落地，比如智能客服。美国的技术研发能力遥遥领先，但是不得不说落地应用这块是我们的强项。企业使用大模型一般需要考虑数据隐私和安全的问题，所以一般会选择开源大模型......
分类模型的算法性能评价
一、概述分类模型是机器学习中一种最常见的问题模型，在许多问题场景中有着广泛的运用，是模式识别问题中一种主要的实现手段。分类问题概况起来就是，对一堆高度抽象了的样本，由经验标定了每个样本所属的实际类别，由特定算法训练得到一个分类器，输入样本属性即自动计算出其所属类别，从......
[大数据][机器学习]之Model Card（模型卡片）介绍
每当我们在公有云或者私有云发布训练好的大数据模型，为了方便大家辨识、理解和运用，参照huggingface所制定的标准制作一个ModelCard展示页，是种非常好的模型展示和组织形式。下面就是一个ModelCard的示例，我试着把它翻译成了中文，源网址，并且提供了Markdown的模板，供大家参考。在这里......
Java智能之Spring AI：5分钟打造智能聊天模型的利器
前言尽管Python最近成为了编程语言的首选，但是Java在人工智能领域的地位同样不可撼动，得益于强大的Spring框架。随着人工智能技术的快速发展，我们正处于一个创新不断涌现的时代。从智能语音助手到复杂的自然语言处理系统，人工智能已经成为了现代生活和工作中不可或缺的一部分。在这样......
RocketMQ概念与模型
为啥要用MQ？这个都应该会背了，6个字解耦、异步、削峰RocketMQ的优缺点？适用场景？主要与Kafka相比单机吞吐量：十万级（类似kafka）消息堆积：支持10亿级别消息堆积源码是Java天生为金融互联网领域而生，对于可靠性要求很高的场景，尤其电商里订单扣款、业务削峰，业务场景在阿里双11经历过......
拆解LangChain的大模型记忆方案
之前我们聊过如何使用LangChain给LLM（大模型）装上记忆，里面提到对话链ConversationChain和MessagesPlaceholder，可以简化安装记忆的流程。下文来拆解基于LangChain的大模型记忆方案。1.安装记忆的原理1.1.核心步骤给LLM安装记忆的核心步骤就3个：在对话之前调取之前的历史消息。......
深度学习 - 模型剪枝技术详解
模型剪枝简介模型剪枝（ModelPruning）是一种通过减少模型参数来降低模型复杂性的方法，从而加快推理速度并减少内存消耗，同时尽量不显著降低模型性能。这种技术特别适用于资源受限的设备，如移动设备和嵌入式系统。模型剪枝通常应用于深度神经网络，尤其是卷积神经网络（CNNs）。模型剪......
大模型算法方向实习会经常提问哪些问题？看完手撕面试官拿下offer！
现互联网研发一枚，曾拿过多个算法/研发岗SPoffer，简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容，实际上可以拆解成两部分，一是算法岗通用的面试内容，二是大模型专有相关部分。算法岗通用面试内容这部分内容很重要，因为通用的面试内容可以适用于不同......
职场人该如何学习使用AI大模型（非常详细）零基础入门到精通，收藏这一篇就够了
非技术背景的职场人想要学习和使用AI大模型，可以遵循以下步骤：基础学习：首先，需要掌握人工智能的基础知识，包括但不限于机器学习、深度学习等领域。可以通过阅读《ArtificialIntelligence:AModernApproach》和《MachineLearning》等书籍来了解这些概念[1]。此外，高等数学、......