双阶段:
传统计算机视觉:
滑动窗口+分类器:
工作原理:
在图像上使用滑动窗口,逐个窗口提取图像特征,使用分类器判断窗口内是否含有目标
特点:
穷举式搜索 耗时
缺点:
计算开销大 依赖于手工设计特征 精度差
手工设计特征:
由研究人员靠经验和直觉设计,非模型自动学习,低级手工特征包括像素值、灰度级别直方图;高级手工特征包括HOG方向梯度直方图、SIFT尺度不变特征变化、SURF加速鲁棒特征、LBP局部二值模式
SIFT + SVM:
缺点:
计算复杂度高 局部特征匹配(关键点提取) 滑动窗口不适合SIFT特征的提取方式 代价高
HOG + SVM(Dalal and Triggs, 2005):
工作原理:
使用 Histogram of Oriented Gradients (HOG) 提取图像中的梯度方向信息,再结合支持向量机(SVM)进行分类
HOG解决的问题:将低级手工特征变为高级手工特征
特点:
HOG特征对目标轮廓和边缘信息敏感 全局性特征描述
缺点:
HOG对复杂物体和背景噪声表现一般
DPM (Deformable Part-based Model, 2008):
工作原理:
将物体建模为若干部分,每个部分通过HOG特征描述,再用可变形模型将这些部分组合起来
特点:
可处理一定程度的物体变形 处理姿势和形状变化时效果好
缺点:
代价高
RCNN系列:
RCNN(2014):
工作原理:
将卷积神经网络引入目标检测的模型,选择性搜索生成候选区域,使用 CNN 提取这些区域的深度特征,最后进行分类和边界框回归
CNN解决的问题:将特征学习引入目标检测代替了以往的手工设计特征
特点:
深度学习特征 区域提议(ss:图像分割和区域合并)
缺点:
每个候选区域都需要进行一次完整的卷积计算 候选框重叠
Fast R-CNN(2015):
特点:
共享卷积特征(由rcnn的裁剪进步为生成一个共享特征图) ROI Pooling 部分端到端训练 只需要进行一次卷积
ROI Pooling解决的问题:将rcnn的裁剪和完整卷积节省为对共享特征图进行一次卷积
缺点:
ss 处理小物体的能力有限 固定的 ROI Pooling 尺寸 边界框回归效果依赖特征
Faster R-CNN(2015):
特点:
区域建议网络(RPN:基于学习到的特征划分) 端到端训练 显著提升速度和准确性
RPN解决的问题:ss生成候选区域效率低,基于学习到的特征提升候选区域的质量
缺点:
双阶段检测速度慢 小目标检测不佳 难以并行化
单阶段:
SSD(2016):
工作原理:
特征提取 多尺度特征图 锚框机制 分类和边界框回归 损失函数
特点:
单阶段检测 多尺度特征图 端到端 并行计算
多尺度特征图解决的问题:检测不同大小的目标,替换单一分辨率的特征图
并行计算解决的问题:提升速度
YOLO系列:
YOLOV1(2017):
特点:
将目标检测转化为单一神经网络回归问题 速度快 实时性
单一神经网络解决的问题:快速、实时
缺点:
群体性小目标检测很差 定位不准确
YOLOV2(2017):
创新:
Batch Normalization:对训练收敛有帮助
更高分辨率的分类器:捕获更多细节
基于anchor的目标边界框预测 :简化目标框预测、anchor聚类(自适应锚框)
目标边界框预测的尝试:对最终预测的目标点进行限制
更底层的图像细节:实现低层特征与高层特征进行融合
多尺度训练:提高模型的尺度不变性
缺点:
缺乏对高层语义信息的利用 处理多尺度不理想小物体检测不佳
YOLOV3(2018):
创新:
darknet-53:残差连接,网络更深特征提取能力强,网络参数少
网络预测目标中心点参数是相对于当前cell的左上角点
多尺度检测:在三个不同的尺度上进行物体预测,结合低层和高层的特征
增加正样本匹配:若iou都大于指定值,那么都被视为正样本,扩充正样本数量
缺点:
小目标检测差 密集目标重叠漏检 模型复杂 超参数调整 泛化能力差
YOLOV4(2020):
创新:
CSP:增强cnn学习能力、移除计算瓶颈、降低显存、增强特征的流动性
PAN:更有利于小特征的检测,fpn升级版,更兼容YOLO网络
Mosaic:扩充样本多样性
损失函数:GIOU+CIOU更精准
YOLOV5(2020):
Pytorch框架:更容易二次开发和定义
多尺度模型:yolov5s、yolov5m….
Focus模块:替换为6*6卷积层,效率高
SPPF:更快
无锚框设计:
FCOS(2019):
背景:
针对传统的One-Stage目标检测网络进行改进的
关键词:
Anchor-Free one-stage FCN-base
无锚框设计:简化了检测流程,避免了锚框选择和匹配的问题
中心性和距离:通过加权损失函数来强调离目标中心较近的像素,提高小目标和复杂场景下的检测性能
缺点:
小目标检测能力 计算成本(全像素预测) 高度依赖于特征提取器
YOLOX(2021):
特点:
Anchor-free 解耦的检测头 更加先进的正负样本匹配策略
创新:
解耦检测头:参数不共享,实现了分类和回归任务的独立优化
正负样本匹配SimOTA:在线样本分配
新模块:
Faster R-CNN+FPN(2017):
特点:
多尺度特征加强 有效利用多层次 小物体检测较强
FPN解决的问题:将不同特征图的特征进行融合,更方便提取特征,多输出
YOLOV3 SPP(2018):
SPP:多尺度融合,单一输出
缺点:
计算复杂性 小目标检测差 增加内存占用
标签:HOG,特征,检测,尺度,网络,目标,缺点,历程 From: https://blog.csdn.net/m0_61595251/article/details/143083477