首页 > 其他分享 >DETR

DETR

时间:2023-08-26 09:56:11浏览次数:28  
标签:NMS attention queries RCNN DETR 方法

目前的方法,无论是单阶段的还是两阶段的,无论是Anchor Based还是Ancho一例外的需要使用后处理方法->NMS来过滤掉冗余的预测框
这是因为目前的方法全都基于Dense Frediction,合人类识别物体的方在原理上,这种操作方式不符式。在实践中,这会导致目标检测中会有一系列的手工设计痕迹

 

摘要核心
1.本文将目标检测视作一个set prediction问题
2.我们的方法简化了目标检测pipeline->无需anchor以及NMS这种手工结构
3.方法名为DETR,包含一个set based loss和一个Transformer结构,
4. 新模型原理上很简洁,而且无需特殊库的支持
5,DETR的性能不错

RCNN系列:
比如Fast RCNN,Faster RCNN,Cascade RCNN等
都可以归纳为,预定位->Crop->分类,只是这几步怎么操作有一些细微的不同

 

所有的这些方法都可以统称为: Dense Pediction
不知道物体在哪里,所以先预定位,逐个分类。
只是在两阶段中,是将位置信息显式的标然后出来,然后逐个proposal分类+微调
而在单阶段中,位置信息是通过Feature Map上的相对位置关系得到,然后逐pixel分类+微调
这种思路下的目标检测总是需要后处理(NMS),因为总会有多个proposal对应同一个instance或者多个pixel对应同-instance,这些多出来的框就需要处理掉

 

Decoder

多了一个输入不同的MSA

左侧为编码器,右侧为解码器多出来的MSA,K和V来自于encoder而Q是来自于Obj queries
这种来QK来自于不同地方的attention也叫cross attention

 

Object queries
作用是什么?
这个东西的作用和cls token类似,也是在整合信息
Object queries是一个可学习的向量(num,b,dim)Num是人为给的值,远大于图片内物体数量,默认100b是batch sizedim是attention运行过程中用的维度数
最终学出来的东西类似于Anchor

 

标签:NMS,attention,queries,RCNN,DETR,方法
From: https://www.cnblogs.com/dwletsgo/p/17656233.html

相关文章

  • 30%Token就能实现SOTA性能,华为诺亚轻量目标检测器Focus-DETR效率倍增
    前言 目前DETR类模型已经成为了目标检测的一个主流范式。但DETR算法模型复杂度高,推理速度低,严重影响了高准确度目标检测模型在端侧设备的部署,加大了学术研究和产业应用之间的鸿沟。来自华为诺亚、华中科技大学的研究者们设计了一种新型的DETR轻量化模型Focus-DETR来解决这......
  • RT-DETR:可以满足实时性要求的DETR模型
    本文分享自华为云社区《高性能网络设计秘笈:深入剖析Linux网络IO与epoll》,作者:LionLong。一、epoll简介epoll是Linux内核中一种可扩展的IO事件处理机制,可替代select和poll的系统调用。处理百万级并发访问性能更佳。二、select的局限性(1) 文件描述符越多,性能越差。 单个进程......
  • DETR
    目录1.用卷积神经网络抽特征(1)按数据、标签取数据(2)把数据做成序列(3)拉平特征2.用TransformerEncoder去学全局特征3.用TransformerDecoder调整objectquery生成100个预测框4.二分图匹配和损失函数相较于传统目标检测,DETR是一种纯端到端的网络。它不再需要NMS(非极大值......
  • detrex | 面向detr系列的目标检测开源框架
    DETR作为Transformer应用于目标检测领域的开山之作,后续有大量的算法都是在其基础上改进而来,如Deformable-DETR,DAB-DETR,DN-DETR,DINO等。这些模型尽管都是采用DETR的基本架构,但其改进创新却各有千秋,能否有一个框架将这些算法融合在一起方便我们使用呢?CVR团队分别开源了DAB-DETR,DN-D......
  • 加速44%!RT-DETR量化无损压缩优秀实战
    RT-DETR模型是飞表目标检测套件PaddleDetection最新发布的SOTA目标检测模型。它是一种基于DETR架构的端到端目标检测器,在速度和精度上均取了SOTA性能。在现实部署中,为了追求“更准、更小、更快”的效率,本文使用飞模模型压缩工具PaddleSlim中的自动压缩工具(ACT,AutoCompressionTo......
  • 超越YOLOv8,飞桨推出精度最高的实时检测器RT-DETR!
    众所周知,实时目标检测(Real-TimeObjectDetection)一直由YOLO系列模型主导。飞桨在去年3月份推出了高精度通用目标检测模型PP-YOLOE,同年在PP-YOLOE的基础上提出了PP-YOLOE+。后者在训练收敛速度、下游任务泛化能力以及高性能部署能力方面均达到了很好的效果。而继PP-......
  • YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8
    前言 本文首先分析了现代实时目标检测器中NMS对推理速度的影响,并建立了端到端的速度基准。为了避免NMS引起的推理延迟,作者提出了一种实时检测Transformer(RT-DETR),这是第一个实时端到端目标检测器。具体而言,设计了一种高效的混合编码器,通过解耦尺度内交互和跨尺度融合来高效处理多......
  • gitee github 左侧栏树形显示插件 Octotree codetree 浏览器插件
    起因看到一位仁兄用gitee做仓库https://gitee.com/zhengqingya/java-developer-document然后左侧栏挺方便(抖音视频)下载chrome扩展市场搜octotree用于githubcodetree用于gitee双核浏览器扩展市场搜octotree用于githubgitcodetree用于gitee......
  • DINO-DETR论文学习记录
    摘要我们介绍了DINO(带有改进的去噪器box的DETR),一种最先进的端到端对象检测器。DINO通过使用对比方式进行去噪训练、混合查询选择方法进行锚点初始化以及用于框预测的ookfo......
  • DETR源码学习(一)之网络模型构建
    这篇文章主要为记录DETR模型的构建过程首先明确DETR模型的搭建顺序:首先是backbone的搭建,使用的是resnet50,随后是Transformer模型的构建,包含编码器的构建与解码器的构建,完......