Yolo 系列v2简介

时间：2024-10-23 17:16:20浏览次数：6

简介

YOLO v2（You Only Look Once version 2）是一种用于目标检测的深度学习模型，由 Joseph Redmon 等人于 2016 年提出。yolo v2在v1的基础上进行了一些改进使它在保持高速检测的同时，显著提升了检测的精度和泛化能力，成为实时目标检测领域的重要算法之一。

YOLO v2 在 YOLO v1 的基础上进行了多方面的改进

（1）、去除了全连接层

YOLO v1 使用了全连接层，全连接层会丢失较多的空间信息，对目标的定位不够准确。YOLO v2 去掉了全连接层，采用全卷积网络结构，这使得模型能够更好地保留空间信息，提高了定位的准确性。YOLO v2 去除了全连接层，因此可以输入任意尺寸的图像。通过使用不同尺寸的图像对模型进行训练，让模型能够从不同分辨率的图像中学习特征，从而提高了模型的泛化能力。

（2）、增加批次归一化层（Batch Normalization）

在每一个卷积层后面都添加了批归一化层。这有助于解决反向传播过程中的梯度消失和梯度爆炸问题，降低对一些超参数（如学习率、网络参数的大小范围、激活函数的选择）的敏感性，提高了模型的训练速度和收敛效果，并且起到了一定的正则化作用，在舍弃 Dropout 优化后依然不会过拟合。

（3）、调整网络输入尺寸

YOLO v1 输入图像尺寸为 448×448，YOLO v2 将输入图像的尺寸调整为 416×416。因为 YOLO v2 模型下采样的总步长为 32，对于 416×416 大小的图片，最终得到的特征图大小为 13×13，维度是奇数，这样特征图恰好只有一个中心位置。对于一些大物体，它们中心点往往落入图片中心位置，此时使用特征图的一个中心点去预测这些物体的边界框相对容易些。

（4）、采用高分辨率分类器

YOLO v1 在预训练时使用的是 224×224 的输入，在检测时采用 448×448 的输入，从分类模型切换到检测模型时，模型需要适应图像分辨率的改变。YOLO v2 首先在低分辨率（224×224）的 ImageNet 分类数据集上预训练模型的主体部分，然后将 ImageNet 分类数据集 resize 成高分辨率（448×448）图像，使用该高分辨率数据集微调预训练模型，最后再用目标检测数据集进行微调。这使得模型在检测之前已经适应了高分辨率输入，提高了检测精度。

（5）、聚类提取先验框

在模型训练之前，提前把训练集的标签值提取出来，通过k-means聚类的方法，聚类出5个类别。结果当作是先验框。最后在进行模型训练。

（6）、直接位置预测（Directed Location Prediction）

Directed Location Prediction（直接位置预测）是 YOLO v2 算法中对目标边界框位置预测方式的一种改进策略2。其主要目的是让模型的位置预测更为稳定、准确，且能更好地适应不同形状和大小的物体检测。

yolo v1 中存在的问题

预测的偏移量包括tx、ty、tw、th（第一次为先验框及初始化的中心坐标在模型中输出的结果与真实框损失值得到的偏移量值）。调整后的预测值bx、by、bw、bh是通过计算得到的。

标签：Yolo,简介,模型,YOLO,v1,v2,448,检测
From： https://blog.csdn.net/qq_61600833/article/details/143185989

YoloV8改进策略：归一化改进|ContraNorm在YoloV8中的创新应用（全网首发）
论文介绍ContraNorm提出背景：过平滑是图神经网络（GNNs）和Transformer中普遍存在的一种现象，随着层数的增加，性能会恶化。现有方法多从表征完全收敛到单一点的视角来刻画过平滑，但论文深入到一个更一般的维度坍缩视角，其中表征位于一个狭窄的锥体中。ContraNorm的提出：受对比学习......
YoloV9改进策略：归一化改进| ContraNorm在YoloV8中的创新应用（全网首发）
论文介绍ContraNorm提出背景：过平滑是图神经网络（GNNs）和Transformer中普遍存在的一种现象，随着层数的增加，性能会恶化。现有方法多从表征完全收敛到单一点的视角来刻画过平滑，但论文深入到一个更一般的维度坍缩视角，其中表征位于一个狭窄的锥体中。ContraNorm的提出：受对比学习......
YOLO11改进：卷积变体系列篇 | DCNv3可形变卷积基于DCNv2优化 | CVPR2023
......
Springboot餐饮结算系统v20h7
Springboot餐饮结算系统v20h7本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表项目功能：用户,菜品分类,菜品信息开题报告内容一、研究背景与意义随着餐饮行业的快速发展，餐饮企业对高效、准确、智能化的餐饮......
CodeQL和数据流分析的简介
文章目录前言一、CodeQL简介二、编写污点跟踪查询扩展传播功能总结前言最近，CodeQL使用非常广泛（GitHub开发的一种强大的静态分析工具）来将代码扫描作为CI/CD管道的一部分。其核心是QL语言，它用于编写对代码进行推理的查询。与竞争对手相比，CodeQL擅长污点跟踪......
通过集成平台实现聚水潭销售出库单与金蝶云星辰V2的无缝对接
PACKAGE-聚水潭销售出库单对接销售出库单-1在企业信息化系统的集成过程中，数据的高效、准确传输至关重要。本文将分享一个具体的技术案例：如何通过轻易云数据集成平台，将聚水潭·奇门的数据无缝对接到金蝶云星辰V2，实现销售出库单的自动化处理。本次集成方案命名为“PACKAGE-聚水潭......
YOLOv1目标检测
目标检测ObjectDetection文章目录目标检测ObjectDetection前言YOLOv1思想检测策略实现过程YOLOv1的损失函数公式YOLOv1的优缺点优点：局限：核心代码结构损失函数计算iou计算NMS前言在YOLOv1(2016)提出之前，R-CNN系列算法在目标检测领域独占鳌头。R-CNN系列......
Yolo系列 V1和V2的对比
在计算机视觉领域中，目标检测是一个核心问题，旨在识别图像中所有感兴趣的目标，并给出它们的类别和位置。近年来，随着深度学习技术的发展，目标检测领域取得了巨大的进步。Yolo（YouOnlyLookOnce）系列算法以其出色的速度和合理的精度，在实时目标检测任务中占据了重要的地位。本文将详细......
解决：YOLOv8训练数据集时P、R、mAP等值均为0的问题
文章目录问题解决1.匹配pytorch与cuda的版本2.使用Adam优化器3.加大训练轮数epoch4.删除data/labels下的train.cache和val.cache问题使用YOLOv8训练自己的数据集时，出现P、R、mAP等值均为0的问题Modelsummary(fused):186layers,2,685,733parameters,0g......
YOLOv8模型改进第十三讲添加卷积和注意力融合模块（CAFM）提升小目标和遮挡检测
本文旨在介绍一种全新的改进机制——卷积和注意力融合模块（CAFM），并详细阐述其在YOLOv8中的应用，以显著提升模型性能。首先，CAFM的设计目的是融合卷积神经网络（CNNs）和Transformer的优势，从而能够对全局和局部特征进行有效建模。随后，我们将深入探讨该模块的模......