Yolo目标检测：Yolo v1简介

时间：2024-10-21 22:22:07浏览次数：6

标签：YOLO 检测 Yolo 网格 v1 算法 grid 简介 stage

一、Yolo系列介绍

YOLO（You Only Look Once）是一种基于深度学习的目标检测算法，由Joseph Redmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位置。YOLO算法将输入图像分成SxS个网格，每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外，YOLO算法还采用了多尺度特征融合的技术，使得算法能够在不同尺度下对目标进行检测。相比于传统的目标检测算法，如R-CNN、Fast R-CNN和Faster R-CNN等，YOLO算法具有更快的检测速度和更高的准确率。这得益于其端到端训练方式和单阶段检测的特性，使其可以同时处理分类和定位任务，避免了传统方法中的多阶段处理过程。因此，YOLO算法广泛应用于实时目标检测和自动驾驶等领域。

二、经典检测方法

现如今的经典检测方法分为两种，一是one-stage,二是two-stage

1、 one-stage

优点：one-stage是一种端到端的检测方法，识别速度非常快，适合做实时检测任务

缺点：正确率相比较低

2、 two-stage

优点：正确率比较高，识别效果理想

缺点：识别速度比较慢，通常达到5FPS （FPS：每秒可以处理的图像数量）

三、评价模型性能优劣的指标--Map(Mean Average Precision)

Map是对不同类别目标检测精度的一种综合评价指标。它结合了多个方面的信息来衡量模型的性能，其中包括精确率(Precision)和召回率（Recall）。

1、精准率(Precision)

2、召回率（Recall）

3、Map

根据不同的阈值，绘制出召回率和精确率的曲线，将曲线以下的面积作为MAP值。当MAP值越大，则表示指标越好。

4、与其他模型对比

YOLO（You Only Look Once）算法是一种目标检测算法，把检测问题转换为回归问题，输出x,y,w,h。一个cnn就可以解决可以对视频进行实时检测，应用领域非常广。

yolo v1的Map相较于其他模型还比较低，但yolo后续版本Map会逐渐提高。

四、yolo v1核心思想

将一幅图像分成SxS个网格(grid cell)，如果某个object的中心落在这个网格中，则这个网格就负责预测这个object。

五、yolo v1网络架构

网络结构借鉴了 GoogLeNet 。24个卷积层，2个全链接层。（用1×1 reduction layers 紧跟 3×3 convolutional layers 取代Goolenet的 inception modules ）

7×7意味着7×7个grid cell，30表示每个grid cell包含30个信息，其中2个预测框，每个预测框包含5个信息(x y w h c)，分别为中心点位置坐标，宽高以及置信度，剩下20个是针对数据集的20个种类的预测概率(即假设该grid cell负责预测物体，那么它是某个类别的概率)。

每个grid有30维，这30维中，8维是回归box的坐标，2个B是box的confidence，还有20维是类别。其中坐标的x,y（相对于网格单元格边界的框的中心）用对应网格的归一化到0-1之间，w,h用图像的width和height归一化到0-1之间。

标签：YOLO,检测,Yolo,网格,v1,算法,grid,简介,stage
From： https://blog.csdn.net/qq_61600833/article/details/143127935

YOLO11改进-注意力-引入非局部注意力机制NonLocalBlockND 增强小目标、遮挡检测
本篇文章将介绍一个新的改进机制——NonLocalBlockND，并阐述如何将其应用于YOLOv11中，显著提升模型性能。首先，我们将解析NonLocalBlockND的工作原理，非局部注意力机制NonLocalBlockND通过在全局范围内捕捉特征图中所有位置的相互关系，提升......
jsp房屋租赁系统的设计与实现v1s9o（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表租客,房东,中介,小区信息,房源信息,房源类型,求租信息,房源委托,托管类别,租赁订单开题报告内容一、项目背景随着城市化进程的加速，房屋租赁市场日益繁荣，但传统......
YOLOv8性能提升：基于SPD-Conv的高效空间深度转换卷积技术解析【YOLOv8】
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录YOLOv8性能提升：基于SPD......
YOLOv8改进：引入LSKAttention大核注意力机制，助力目标检测性能极限提升【YOLOv8】
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录YOLOv8改进：引入LSKAtte......
HL7协议简介及其在STM32上的解析实现
近期完成一个医疗相关的项目，其中包括了体征监测设备，该设备使用的通信协议便是HL7V2.4协议，在医疗信息化领域，HL7（HealthLevelSeven）协议扮演着至关重要的角色。它是一种国际标准，用于定义医疗机构间以及医疗设备与信息系统之间的数据交换格式和通信协议。HL7标......
CAE教程：HyperMesh概述与有限元分析简介
1.1HyperMesh概述本节将介绍有限单元法基本原理，HyperMesh软件基本功能及界面介绍，获取在线帮助等内容。1.1.1有限元分析方法简介有限单元法（FEM）是一种可以精确预测复杂结构在外界载荷作用下响应的方法，该数值方法起源于上世纪50年代。在有限单元法出现之前，验证设计方案或评......
YOLOv11环境搭建&推理测试
引子2024年9月30日，Ultralytics在其活动YOLOVision中正式发布了YOLOv11。YOLOv11是由位于美国和西班牙的Ultralytics团队开发的YOLO的最新版本。几个月前YOLOv10发布（感兴趣的童鞋可以移步https://blog.csdn.net/zzq1989_/article/details/139408779?spm=1001.2014.3001.5502），这才......
基于YOLOv10的农场实时目标检测系统（python+pyside6界面+系统源码+可训练的数据集+也完
摘要：基于YOLOv10的农场实时目标检测系统，利用4393张图片（3905张训练集，488张验证集）进行模型训练，最终开发出一个高效的农场目标检测模型。为了方便用户操作和实时检测，本系统还开发了基于Python和PySide6的图形用户界面（GUI），实现了农场目标的实时检测功能。此外，为保......
探索性数据分析 (EDA) 简介
文章目录一、介绍二、探索性数据分析(EDA)三、探索性数据分析的类型3.1单变量分析3.2双变量分析3.3多元分析四、理解EDA五、结论一、介绍探索性数据分析是研究或理解数据并提取洞察数据集以识别数据模式或主要特征的过程。EDA通常分为两种方法，即图形分析和非......
ultralytics yolo 训练及推理自定义人脸关键点数据 - python 实现
Ultralytics YOLO 是计算机视觉和ML领域专业人士的高效工具。深度学习的关键点任务也是基础和常见任务，所以这里进行基于ultralyticsyolo自定义关键点数据集的模型训练和模型推理。根据需求，可能会发布其webui版本，现在已经发布......