深度学习之目标检测3

时间：2024-10-12 15:49:11浏览次数：12

YOLO

YOLO（You Only Look Once）系列是由Joseph Redmon等人在2016年首次提出的是一种目标对象检测算法。这一系列算法通过将对象检测视为单次回归问题，从输入图像直接预测对象边界框和类别，极大提高了检测速度。YOLO系列在其每个版本中都进行了改进和优化，逐步提升了精度和速度。

YOLOv4

YOLOv4 的开发历程很有意思，其中评估、修改和整合了很多有趣的新技术。而且其也优化了计算效率，使检测器在单个 GPU 上也能很好地完成训练。

Bag of freebies (BoF)

为了提升准确度，可以针对训练过程进行一些优化，比如数据增强、类别不平衡、成本函数、软标注…… 这些改进不会影响推理速度，可被称为「Bag of freebies」。

Mosaic data augmentation：参考CutMix然后四张图像拼接成一张进行训练

数据增强

Random Erase：用随机值或训练集的平均像素值替换图像的区域

Hide and Seek：根据概率设置随机隐藏一些补丁

Self-adversarial-training(SAT)：通过引入噪音点来增加游戏难度

DropBlock：dropout是随机选择点(b) ，现在吃掉一个区域

Label Smoothing：

神经网络最大的缺点：自觉不错（过拟合），让它别太自信

例如原来标签为（0,1）：

使用之后效果分析（右图）：簇内更紧密，簇间更分离

IOU损失：

IOU损失： (也经常1-IOU)

没有相交则IOU =0无法梯度计算，相同的IOU却反映不出实际情况到底咋样

GIOU损失：

公式：

引入了最小封闭形状C（ C可以把A ， B包含在内）

在不重叠情况下能让预测框尽可能朝着真实框前进

DIOU损失

公式：

其中分子计算预测框与真实框的中心点欧式距离d

分母是能覆盖预测框与真实框的最小BOX的对角线长度c

直接优化距离，速度更快，并解决GIOU问题

CIOU损失：

公式：

损失函数必须考虑三个几何因素：重叠面积，中心点距离，长宽比

其中α可以当做权重参数

DIOU-NMS

之前使用NMS来决定是否删除一个框，现在改用DIOU-NMS

公式：

不仅考虑了IoU的值,还考虑了两个Box中心点之间的距离

其中M表示高置信度候选框， Bi就是遍历各个框跟置信度高的重合情况

SOFT-NMS

Bag of specials(BOS)

增加稍许推断代价，但可以提高模型精度的方法

网络细节部分加入了很多改进，引入了各种能让特征提取更好的方法

注意力机制，网络细节设计，特征金字塔等，你能想到的全有

读折一篇相当于把今年来部分优秀的论文又过了一遍

SPPNet(Spatial Pyramid Pooling)

V3中为了更好满足不同输入大小，训练的时候要改变输入数据的大小

SPP其实就是用最大池化来满足最终输入特征一致即可

CSPNet（ Cross Stage Partial Network）

每一个block按照特征图的channel维度拆分成两部分

一份正常走网络，另一份直接concat到这个block的输出

CBAM

其实就是加入了注意力机制，已经很常见了在各种论文中

V4中用的是SAM ，也就是空间的注意力机制

不光NLP,语音识别领域在搞attention ， CV中也一样

Spatial attention module

PAN(Path Aggregation Network)

自顶向下的模式，将高层特征传下来

是否可以选择双向？答：PAN

PAN(Path Aggregation Network)

引入了自底向上的路径，使得底层信息更容易传到顶部

并且还是一个捷径，红色的没准走个100层(Resnet) ，绿色的几层就到了

YOLOV4中并不是加法，而是拼接

Mish：

公式：f(α)=·tanh(ln(1+ew))

eliminate grid sensitivity

比较好理解，坐标回归预测值都在0-1之间，如果在grid边界怎么表示？

此时就需要非常大的数值才可以达到边界

为了缓解这种情况可以在激活函数前加上

一个系数（大于1的）：

整体网络架构

标签：NMS,公式,检测,IOU,损失,学习,Bag,深度,PAN
From： https://blog.csdn.net/lyqherenlai/article/details/142879466

LLM权威教程：吴恩达面向开发者的LLM入门教程+开源大模型食用指南，普通学习者也能看懂！
今天给大家推荐一本由吴恩达和OpenAI团队共同编写的关于大型语言模型（LLM）的权威教程<面向开发者的LLM入门教程>！在Github上已经高达50kstar了，这含金量不用多说，在这里给大家强烈推荐一波，不多bb直接开始介绍！这本教程旨在为开发者提供全面而系统的LLM知识和技能，结合了吴恩达在......
机器学习（MachineLearning）（7)——分类_朴素贝叶斯
机器学习（MachineLearning）（1）——机器学习概述机器学习（MachineLearning）（2）——线性回归机器学习（MachineLearning）（3）——决策树回归机器学习（MachineLearning）（4）---------分类_逻辑回归机器学习（MachineLearning）（5)——分类_决策树机器学习（MachineLearning）（6)——分类_支持向量机一......
【机器学习】随机森林算法（看我以弱博强）
目录算法引入：算法介绍：1.集成学习：2.训练过程：3.分类和回归：算法优点：算法缺点：算法实现：1.数据准备2.划分数据集3.创建随机森林模型4.训练模型5.预测6.评估模型完整代码示例人工智能领域在当今可谓炙手可热，在人工智能与机器学习领域，随机森林（RandomForest）......
脉冲目标检测网络模型SpikeYOLO——基于整值训练和脉冲驱动推理的高性能节能目标检测
最近看到目标检测领域又出新作，ECCV2024满分Oral论文——《Integer-ValuedTrainingandSpike-DrivenInferenceSpikingNeuralNetworkforHigh-performanceandEnergy-efficientObjectDetection》论文地址在这里，如下所示：感兴趣的话可以移步阅读原文，这里趁着中午午休......
机器学习之概率图模型PGM，看这一篇就够了！
第一部分：基本含义能够通过微小的现象看到事物的本质“见微知著，睹始知终”：见到事情的苗头，就能知道它的实质和发展趋势。看到开始就知道结局了。比喻小中见大、以小见大。我们前面研究过朴素贝叶斯模型，但是人家是有各种独立分布的条件假设的，它无法处理又相互关联的特征属性，也......
神经网络与深度学习基础教程笔记(附案例讲解)
神经网络与深度学习基础教程笔记(附案例讲解)引言神经网络和深度学习是人工智能领域中最重要的技术之一，它们在图像识别、自然语言处理、语音识别等领域取得了巨大的成功。本教程将从基础概念出发，逐步深入到高级主题，帮助你全面理解并掌握这些强大的工具。本文是神经网络与......
学年2022-2024-1学号20241311《计算机基础与程序设计》第3周学习总结
学期（2024-2025-1）学号（20241311）《计算机基础与程序设计》第3周学习总结作业信息这个作业属于哪个课程<班级的链接>（2024-2025-1-计算机基础与程序设计](https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP)）这个作业要求在哪里<作业要求的链接>((https://edu.cnblo......
安全帽穿戴检测人脸闸机联动系统
安全帽穿戴检测人脸闸机联动系统结合安全帽穿戴检测技术和人脸识别技术，安全帽穿戴检测人脸闸机联动系统实现对进入工地施工区域人员是否穿戴安全帽进行精准监测和身份识别，安全帽穿戴检测人脸闸机联动系统通过摄像头对人员进行安全帽穿戴检测和人脸识别，只有在满足这两个条件的情况......
AC自动机学习
左程云讲解102加了fail指针的前缀树通过在前缀树上构建fail指针，如下图，abcda，abcdb，bcdc如果我要查询的是abcdcdc先顺着1234号结点向下，abcdc，遇到最后的c时当前串上找不到了，通过fail跳到bcdc串上，因为abcd后缀和bcdc前缀重合，这么跳能减少重新匹配的成本相当于对于要查询的串，我先从......
地平线双目深度估计参考算法 StereoNetPlus优化思路解读
【参考算法】地平线双目深度估计参考算法StereoNetPlus-v1.2.11.引言本文将介绍地平线基于公版的双目深度估计算法StereoNet做的优化设计。首先介绍了双目深度估计的原理以及双目点云和Lidar点云的对比，然后由公版StereoNet的介绍切入到地平线参考算法的针对性优化，最后对......

深度学习之目标检测3

相关文章

赞助商

阅读排行