《深度学习》YOLO V3 网络构架解析

时间：2024-10-23 18:52:05浏览次数：8

标签：scale YOLOv3 特征 YOLO 图上 V3 softmax 先验构架

一、YOLO V3

1、了解YOLOv3

一、YOLO系列 V3

1、了解YOLOv3

相比于YOLOv1和v2，YOLOv3最大的改进就是网络结构，使其更适合小目标检测，特征做的更细致，融入多持续特征图信息来预测不同规格物体

先验框更丰富了，3种scale，每种3个规格，一共9种

softmax改进，预测多标签任务。

和YOLOv2一样都是使用的darknet网络结构，v1用的GoogLeNet网络

2、3个scale

为了能检测到不同大小的物体，设计了三个尺度scale

scale变换的经典方法：

不同特征图融合后进行预测：YOLOv3

3、残差连接

YOLOv3使用了ResNet残差网络的私信，堆叠更多的层再进行特征提取

二、YOLOv3核心网络构架

1、核心网络构架

没有池化层和全连接层，全部卷积，下采样通过stride卷积核滑动步长为2来实现，使用3种scale尺度，更多的先验框

Conv Block表示该模块是一个普通的卷积模块，Residual Bolck代表该模块是一个残差网络。

2、输入映射到输出

3、先验框设计

YOLOv2使用了5个先验框，这里的v3使用了9种先验框

例如，13*13的特征图上使用(116x90)、(156x198)、(373x326)的先验框

26*26的特征图上使用(30x61)、(62x45)、(59x119)的先验框

52*52的特征图上使用(10x13)、(16x30)、(33x23)的先验框

大的先验框在感受野大的特征图中检测

YOLO3延续了K-means聚类得到先验框的尺寸方法，为每种下采样尺度设定3种先验框，总共聚类出9种尺寸的先验框。在COCO数据集这9个先验框是：(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。分配上，在最小的13*13特征图上（有最大的感受野）应用较大的先验框(116x90)，(156x198)，(373x326)，适合检测较大的对象。中等的26*26特征图上（中等感受野）应用中等的先验框(30x61)，(62x45)，(59x119)，适合检测中等大小的对象。较大的52*52特征图上（较小的感受野）应用较小的先验框(10x13)，(16x30)，(33x23)，适合检测较小的对象。

COCO数据集介绍：

COCO数据集介绍-CSDN博客

4、softmax层替代

在模型的输出端需要进行一个softmax的处理，可以处理物体检测任务中一个物体有多个标签

以前使用logistic激活函数来完成，将所有的值输入输入到函数内变成0-1之间的数值，这样就能预测每个类别是或不是，但是只有一个类别的识别，如下图所示

logistic指的是未经过softmax函数处理的网络输出，也就是各个类别的得分（score）或概率（probability）值，因此沿用了logit这个术语。在逻辑回归（logistic regression）模型中，logits表示某个事件发生的概率与不发生的概率之比的对数值。

标签：scale,YOLOv3,特征,YOLO,图上,V3,softmax,先验,构架
From： https://blog.csdn.net/qq_64603703/article/details/143183766

2024小白YOLOv8环境配置
目录前言一、PyCharm的安装1.下载 2.安装步骤二、配置YOLOv8的虚拟环境1.Anaconda中创建一个虚拟环境 2.Pycharm中使用虚拟环境（1）下载YOLOv8开源包（要挂梯子）（2）在设置中找到解释器，选择创建好的YOLOv8环境（3）配置终端的启动路径（4）启动终端，下载YOLOv8依赖包（5）下载权重......
KerasCV YOLOv8实现交通信号灯检测
关注底部公众号，回复暗号：13，免费获取600多个深度学习项目资料，快来加入社群一起学习吧。1.项目简介本项目旨在通过深度学习模型实现交通信号灯的检测，以提高交通管理系统的智能化水平，增强驾驶辅助功能。随着智能交通系统的快速发展，准确地识别交通信号灯对于无人驾驶汽车和高......
Yolo 系列v2简介
简介YOLOv2（YouOnlyLookOnceversion2）是一种用于目标检测的深度学习模型，由JosephRedmon等人于2016年提出。yolov2在v1的基础上进行了一些改进使它在保持高速检测的同时，显著提升了检测的精度和泛化能力，成为实时目标检测领域的重要算法之一。YOLOv2在YOLOv1的......
YoloV8改进策略：归一化改进|ContraNorm在YoloV8中的创新应用（全网首发）
论文介绍ContraNorm提出背景：过平滑是图神经网络（GNNs）和Transformer中普遍存在的一种现象，随着层数的增加，性能会恶化。现有方法多从表征完全收敛到单一点的视角来刻画过平滑，但论文深入到一个更一般的维度坍缩视角，其中表征位于一个狭窄的锥体中。ContraNorm的提出：受对比学习......
YoloV9改进策略：归一化改进| ContraNorm在YoloV8中的创新应用（全网首发）
论文介绍ContraNorm提出背景：过平滑是图神经网络（GNNs）和Transformer中普遍存在的一种现象，随着层数的增加，性能会恶化。现有方法多从表征完全收敛到单一点的视角来刻画过平滑，但论文深入到一个更一般的维度坍缩视角，其中表征位于一个狭窄的锥体中。ContraNorm的提出：受对比学习......
YOLO11改进：卷积变体系列篇 | DCNv3可形变卷积基于DCNv2优化 | CVPR2023
......
FTP管理工具 FileZilla Pro v3.66.1 中文绿色便携版
FileZilla是一款跨平台免费开源的多线程FTP工具，支持SL/TLS(FTPS)协议、SFTP等多种主流的传输协议，软件采用了有条理、简洁的用户界面，支持多站点管理，可以管理多个FTP站点，可以自由新建站点，提供了一个简单化，高效的FTP工具，拥有很多实用的功能，包括拖放操作、传输队列、代理服务......
YOLOv1目标检测
目标检测ObjectDetection文章目录目标检测ObjectDetection前言YOLOv1思想检测策略实现过程YOLOv1的损失函数公式YOLOv1的优缺点优点：局限：核心代码结构损失函数计算iou计算NMS前言在YOLOv1(2016)提出之前，R-CNN系列算法在目标检测领域独占鳌头。R-CNN系列......
Yolo系列 V1和V2的对比
在计算机视觉领域中，目标检测是一个核心问题，旨在识别图像中所有感兴趣的目标，并给出它们的类别和位置。近年来，随着深度学习技术的发展，目标检测领域取得了巨大的进步。Yolo（YouOnlyLookOnce）系列算法以其出色的速度和合理的精度，在实时目标检测任务中占据了重要的地位。本文将详细......
解决：YOLOv8训练数据集时P、R、mAP等值均为0的问题
文章目录问题解决1.匹配pytorch与cuda的版本2.使用Adam优化器3.加大训练轮数epoch4.删除data/labels下的train.cache和val.cache问题使用YOLOv8训练自己的数据集时，出现P、R、mAP等值均为0的问题Modelsummary(fused):186layers,2,685,733parameters,0g......

《深度学习》YOLO V3 网络构架解析

一、YOLO系列 V3

1、了解YOLOv3

2、3个scale

3、残差连接

二、YOLOv3核心网络构架

1、核心网络构架

2、输入映射到输出

3、先验框设计

4、softmax层替代

相关文章

赞助商

阅读排行