目标检测网络发展历程

标签：HOG 特征检测尺度网络目标缺点历程

双阶段：

传统计算机视觉：

滑动窗口+分类器：

工作原理：

在图像上使用滑动窗口，逐个窗口提取图像特征，使用分类器判断窗口内是否含有目标

特点：

穷举式搜索耗时

缺点：

计算开销大依赖于手工设计特征精度差

手工设计特征：

由研究人员靠经验和直觉设计，非模型自动学习，低级手工特征包括像素值、灰度级别直方图；高级手工特征包括HOG方向梯度直方图、SIFT尺度不变特征变化、SURF加速鲁棒特征、LBP局部二值模式

SIFT + SVM：

缺点：

计算复杂度高局部特征匹配（关键点提取）滑动窗口不适合SIFT特征的提取方式代价高

HOG + SVM（Dalal and Triggs, 2005）：

工作原理：

使用 Histogram of Oriented Gradients (HOG) 提取图像中的梯度方向信息，再结合支持向量机（SVM）进行分类

HOG解决的问题：将低级手工特征变为高级手工特征

特点：

HOG特征对目标轮廓和边缘信息敏感全局性特征描述

缺点：

HOG对复杂物体和背景噪声表现一般

DPM (Deformable Part-based Model, 2008)：

工作原理：

将物体建模为若干部分，每个部分通过HOG特征描述，再用可变形模型将这些部分组合起来

特点：

可处理一定程度的物体变形处理姿势和形状变化时效果好

缺点：

代价高

RCNN系列：

RCNN（2014）：

工作原理：

将卷积神经网络引入目标检测的模型，选择性搜索生成候选区域，使用 CNN 提取这些区域的深度特征，最后进行分类和边界框回归

CNN解决的问题：将特征学习引入目标检测代替了以往的手工设计特征

特点：

深度学习特征区域提议（ss：图像分割和区域合并）

缺点：

每个候选区域都需要进行一次完整的卷积计算候选框重叠

Fast R-CNN（2015）：

特点：

共享卷积特征（由rcnn的裁剪进步为生成一个共享特征图） ROI Pooling 部分端到端训练只需要进行一次卷积

ROI Pooling解决的问题：将rcnn的裁剪和完整卷积节省为对共享特征图进行一次卷积

缺点：

ss 处理小物体的能力有限固定的 ROI Pooling 尺寸边界框回归效果依赖特征

Faster R-CNN（2015）：

特点：

区域建议网络（RPN：基于学习到的特征划分）端到端训练显著提升速度和准确性

RPN解决的问题：ss生成候选区域效率低，基于学习到的特征提升候选区域的质量

缺点：

双阶段检测速度慢小目标检测不佳难以并行化

单阶段：

SSD（2016）：

工作原理：

特征提取 多尺度特征图 锚框机制分类和边界框回归损失函数

特点：

单阶段检测多尺度特征图端到端 并行计算

多尺度特征图解决的问题：检测不同大小的目标，替换单一分辨率的特征图

并行计算解决的问题：提升速度

YOLO系列：

YOLOV1（2017）：

特点：

将目标检测转化为单一神经网络回归问题速度快实时性

单一神经网络解决的问题：快速、实时

缺点：

群体性小目标检测很差定位不准确

YOLOV2（2017）：

创新：

Batch Normalization：对训练收敛有帮助

更高分辨率的分类器：捕获更多细节

基于anchor的目标边界框预测 ：简化目标框预测、anchor聚类(自适应锚框)

目标边界框预测的尝试：对最终预测的目标点进行限制

更底层的图像细节：实现低层特征与高层特征进行融合

多尺度训练：提高模型的尺度不变性

缺点：

缺乏对高层语义信息的利用处理多尺度不理想小物体检测不佳

YOLOV3(2018):

创新：

darknet-53：残差连接，网络更深特征提取能力强，网络参数少

网络预测目标中心点参数是相对于当前cell的左上角点

多尺度检测：在三个不同的尺度上进行物体预测，结合低层和高层的特征

增加正样本匹配：若iou都大于指定值，那么都被视为正样本，扩充正样本数量

缺点：

小目标检测差密集目标重叠漏检模型复杂超参数调整泛化能力差

YOLOV4(2020):

创新：

CSP：增强cnn学习能力、移除计算瓶颈、降低显存、增强特征的流动性

PAN：更有利于小特征的检测，fpn升级版，更兼容YOLO网络

Mosaic：扩充样本多样性

损失函数：GIOU+CIOU更精准

YOLOV5(2020)：

Pytorch框架：更容易二次开发和定义

多尺度模型：yolov5s、yolov5m….

Focus模块：替换为6*6卷积层，效率高

SPPF：更快

无锚框设计：

FCOS(2019)：

背景：

针对传统的One-Stage目标检测网络进行改进的

关键词：

Anchor-Free one-stage FCN-base

无锚框设计：简化了检测流程，避免了锚框选择和匹配的问题

中心性和距离：通过加权损失函数来强调离目标中心较近的像素，提高小目标和复杂场景下的检测性能

缺点：

小目标检测能力计算成本（全像素预测）高度依赖于特征提取器

YOLOX（2021）：

特点：

Anchor-free 解耦的检测头更加先进的正负样本匹配策略

创新：

解耦检测头：参数不共享，实现了分类和回归任务的独立优化

正负样本匹配SimOTA：在线样本分配

新模块：

Faster R-CNN+FPN（2017）：

特点：

多尺度特征加强有效利用多层次小物体检测较强

FPN解决的问题：将不同特征图的特征进行融合，更方便提取特征，多输出

YOLOV3 SPP(2018)：

SPP：多尺度融合，单一输出

缺点：

计算复杂性小目标检测差增加内存占用

标签：HOG,特征,检测,尺度,网络,目标,缺点,历程
From： https://blog.csdn.net/m0_61595251/article/details/143083477

目标检测网络发展历程

双阶段：

传统计算机视觉：

滑动窗口+分类器：

工作原理：

特点：

缺点：

手工设计特征：

SIFT + SVM：

缺点：

HOG + SVM（Dalal and Triggs, 2005）：

工作原理：

特点：

缺点：

DPM (Deformable Part-based Model, 2008)：

工作原理：

特点：

缺点：

RCNN系列：

RCNN（2014）：

工作原理：

特点：

缺点：

Fast R-CNN（2015）：

特点：

缺点：

Faster R-CNN（2015）：

特点：

缺点：

单阶段：

SSD（2016）：

工作原理：

特点：

YOLO系列：

YOLOV1（2017）：

特点：

缺点：

YOLOV2（2017）：

创新：

缺点：

YOLOV3(2018):

创新：

缺点：

YOLOV4(2020):

创新：

YOLOV5(2020)：

无锚框设计：

FCOS(2019)：

背景：

关键词：

缺点：

YOLOX（2021）：

特点：

创新：

新模块：

Faster R-CNN+FPN（2017）：

特点：

YOLOV3 SPP(2018)：

缺点：

相关文章

赞助商

阅读排行