首页 > 其他分享 >目标检测多模型集成方法总结

目标检测多模型集成方法总结

时间:2022-10-05 11:32:55浏览次数:59  
标签:集成 X101 检测 模型 FPN YoloV3 方法


目标检测多模型集成方法总结_公众号

作者:Vikas S Shetty

编译:ronghuaiyang(AI公园)

导读

模型集成是一种提升模型能力的常用方法,但通常也会带来推理时间的增加,在物体检测上效果如何,可以看看。


目标检测多模型集成方法总结_3d_02

介绍

集成机器学习模型是一种常见的提升模型能力的方式,并已在多个场景中使用,因为它们结合了多个模型的决策,以提高整体性能,但当涉及到基于DNN(深度神经网络)的目标检测模型时,它并不仅仅是合并结果那么简单。

集成的需求

为了在任何模型中获得良好的结果,都需要满足某些标准(数据、超参数)。但在真实场景中,你可能会得到糟糕的训练数据,或者很难找到合适的超参数。在这些情况下,综合多个性能较差的模型可以帮助你获得所需的结果。在某种意义上,集成学习可以被认为是一种通过执行大量额外计算来弥补学习算法不足的方法。另一方面,另一种选择是在一个非集成系统上做更多的学习。对于计算、存储或通信资源的相同增加,集成系统使用两种或两种以上的方法可能会比使用单一方法增加资源的方法更有效地提高整体精度。

看起来挺好,有没有缺点呢?

  • 更难调试或理解预测,因为预测框是根据多个模型绘制的。
  • 推理时间根据模型和使用的模型数量而增加。
  • 尝试不同的模型以获得合适的模型集合是一件耗时的事情。

不同的模型集成

  1. OR方法:如果一个框是由至少一个模型生成的,就会考虑它。
  2. AND方法:如果所有模型产生相同的框,则认为是一个框(如果IOU >0.5)。
  3. 一致性方法:如果大多数模型产生相同的框,则认为是一个框,即如果有m个模型,(m/2 +1)个模型产生相同的框,则认为这个框有效。
  4. 加权融合:这是一种替代NMS的新方法,并指出了其不足之处。

目标检测多模型集成方法总结_微信_03

不同的集成方法

在上面的例子中,OR方法的预测得到了所有需要的对象框,但也得到了一个假阳性结果,一致性的方法漏掉了马,AND方法同时漏掉了马和狗。

验证

为了计算不同的集成方法,我们将跟踪以下参数:

  1. True positive:预测框与gt匹配
  2. False Positives:预测框是错误的
  3. False Negatives:没有预测,但是存在gt。
  4. Precision:度量你的预测有多准确。也就是说,你的预测正确的百分比[TP/ (TP + FP)]
  5. Recall:度量gt被预测的百分比[TP/ (TP + FN)]
  6. Average Precision:precision-recall图的曲线下面积

使用的模型

为了理解集成是如何起作用的,我们提供了用于实验的独立模型的结果。

1. YoloV3:

目标检测多模型集成方法总结_微信_04

2. Faster R-CNN — ResNeXt 101 [X101-FPN]:

目标检测多模型集成方法总结_3d_05

集成实验

1. OR — [YoloV3, X101-FPN]

目标检测多模型集成方法总结_微信_06

如果你仔细观察,FPs的数量增加了,这反过来降低了精度。与此同时,TPs数量的增加反过来又增加了召回。这是使用OR方法时可以观察到的一般趋势。

2. AND — [YoloV3, X101-FPN]

目标检测多模型集成方法总结_3d_07

与我们使用OR方法观察到的情况相反,在AND方法中,我们最终获得了较高的精度和较低的召回率,因为几乎所有的假阳性都被删除了,因为YoloV3和X101的大多数FPs是不同的。

检测框加权融合

在NMS方法中,如果框的IoU大于某个阈值,则认为框属于单个物体。因此,框的过滤过程取决于这个单一IoU阈值的选择,这影响了模型的性能。然而,设置这个阈值很棘手:如果有多个物体并排存在,那么其中一个就会被删除。NMS丢弃了冗余框,因此不能有效地从不同的模型中产生平均的局部预测。

目标检测多模型集成方法总结_公众号_08

NMS和WBF之间的主要区别是,WBF利用所有的框,而不是丢弃它们。在上面的例子中,红框是ground truth,蓝框是多个模型做出的预测。请注意,NMS是如何删除冗余框的,但WBF通过考虑所有预测框创建了一个全新的框(融合框)。

3. Weighted Boxes Fusion — [Yolov3, X101-FPN]

目标检测多模型集成方法总结_3d_09

YoloV3和X101-FPN的权重比分别为2:1。我们也试着增加有利于X101-FPN的比重(因为它的性能更好),但在性能上没有看到任何显著的差异。从我们读过的加权融合论文中,作者注意到了AP的增加,但如你所见,WBF YoloV3和X101-FPN并不比OR方法好很多。我们注意到的是,大部分的实验涉及至少3个或更多模型。

4. Weighted Boxes Fusion — [Yolov3, X101, R101, R50]

目标检测多模型集成方法总结_3d_10

在最后的实验中,我们使用了YoloV3以及我们在Detectron2中训练的3个模型[ResNeXt101-FPN, ResNet101-FPN, ResNet50-FPN]。显然,召回率有一个跳跃(约为传统方法的0.3),但AP的跳跃并不大。另外,需要注意的是,当你向WF方法添加更多模型时,误报的数量会激增。

总结

当使用相互补充的模型时,集成是提高性能的一种很好的方法,但它也会以速度为代价来完成推理。根据需求,可以决定有多少个模型,采用哪种方法,等等。但从我们进行的实验来看,性能提升的数量似乎与一起运行这些模型所需的资源和推断时间不成比例。


英文原文:https://medium.com/inspiredbrilliance/object-detection-through-ensemble-of-models-fed015bc1ee0

本文仅做学术分享,如有侵权,请联系删文。


目标检测多模型集成方法总结_3d_11

▲长按关注公众号


标签:集成,X101,检测,模型,FPN,YoloV3,方法
From: https://blog.51cto.com/u_14439393/5732464

相关文章

  • Transforrmer的时间序列模型
    Transformer的时间序列预测1、它利用输入嵌入中添加的位置编码来模拟序列信息。(位置编码)绝对位置编码:t表示位置索引,w为每个维度的频率信息相对位置编码:根据输入元素......
  • 第八章.Bom浏览器模型
    一、window对象常用的方法window.open('地址','名称','高','宽');//打开一个新的窗口window.alert();//提示框或者警告框window.prompt();//用户输入提示框window.conf......
  • 3D目标检测深度学习方法数据预处理综述
    前言​这一篇的内容主要要讲一点在深度学习的3D目标检测网络中,我们都采用了哪些数据预处理的方法,主要讲两个方面的知识,第一个是representation,第二个数据预处理内容是数据......
  • 3D目标检测深度学习方法之voxel-represetnation内容综述(一)
    前言​笔者上一篇文章有介绍了3D目标检测中比较重要的数据预处理的两个方面的内容,其一是几种representation的介绍,分别是point、voxel和grap三种主要的representation,具体......
  • 3D目标检测深度学习方法之voxel-represetnation内容综述(二)
    前言​前面的一篇文章:3D目标检测深度学习方法中voxel-represetnation内容综述(一)中笔者分享了如果采用voxel作为深度学习网络输入的backbone的几个重要的模块。也就是目前......
  • Asp-Net-Core开发笔记:集成Hangfire实现异步任务队列和定时任务
    前言最近把Python写的数据采集平台往.NetCore上迁移,原本的采集任务使用多进程+线程池的方式来加快采集速度,使用Celery作为异步任务队列兼具定时任务功能,这套东西用着还行......
  • 一文搞懂常见的网络I/O模型
    对于网络I/O模型的学习,在操作系统中是非常重要的一环,因为I/O也同样是我们系统设计中至关重要的一个方面和要考虑的因素,因此想利用一篇文章来解析一下,就目前而言,业界对五种网......
  • 机器学习概念漂移检测方法(Aporia)
    目前,有多种技术可用于机器学习检测概念漂移的方法。熟悉这些检测方法是为每个漂移和模型使用正确度量的关键。在本文章中,回顾了四种类型的检测方法:统计、统计过程控制、基于......
  • 云原生强大且灵活的持续集成CI开源框架Tekton实战-上
    @目录概述定义常见CICD工具使用好处组件基本概念安装前提条件安装TektonPipelines创建并运行任务安装Dashboard安装CliPipelines示例演示概述定义Tekton官网地址htt......
  • 关键点检测项目代码开源了!
     Datawhale干货 作者:闫永强,算法工程师,Datawhale成员本文通过自建手势数据集,利用YOLOv5s检测,然后通过开源数据集训练squeezenet进行手部关键点预测,最后通过指间的夹角算法......