DETR

DETR

时间：2023-08-26 09:56:11浏览次数：36

标签：NMS attention queries RCNN DETR 方法

目前的方法，无论是单阶段的还是两阶段的，无论是Anchor Based还是Ancho一例外的需要使用后处理方法->NMS来过滤掉冗余的预测框
这是因为目前的方法全都基于Dense Frediction,合人类识别物体的方在原理上，这种操作方式不符式。在实践中，这会导致目标检测中会有一系列的手工设计痕迹

摘要核心
1.本文将目标检测视作一个set prediction问题
2.我们的方法简化了目标检测pipeline->无需anchor以及NMS这种手工结构
3.方法名为DETR，包含一个set based loss和一个Transformer结构,
4. 新模型原理上很简洁，而且无需特殊库的支持
5，DETR的性能不错

RCNN系列:
比如Fast RCNN，Faster RCNN，Cascade RCNN等
都可以归纳为，预定位->Crop->分类，只是这几步怎么操作有一些细微的不同

所有的这些方法都可以统称为: Dense Pediction
不知道物体在哪里，所以先预定位，逐个分类。
只是在两阶段中，是将位置信息显式的标然后出来，然后逐个proposal分类+微调
而在单阶段中，位置信息是通过Feature Map上的相对位置关系得到，然后逐pixel分类+微调
这种思路下的目标检测总是需要后处理(NMS)，因为总会有多个proposal对应同一个instance或者多个pixel对应同-instance，这些多出来的框就需要处理掉

Decoder

多了一个输入不同的MSA

左侧为编码器，右侧为解码器多出来的MSA，K和V来自于encoder而Q是来自于Obj queries
这种来QK来自于不同地方的attention也叫cross attention

Object queries
作用是什么?
这个东西的作用和cls token类似，也是在整合信息
Object queries是一个可学习的向量(num,b,dim)Num是人为给的值，远大于图片内物体数量，默认100b是batch sizedim是attention运行过程中用的维度数
最终学出来的东西类似于Anchor

标签：NMS,attention,queries,RCNN,DETR,方法
From： https://www.cnblogs.com/dwletsgo/p/17656233.html

30%Token就能实现SOTA性能，华为诺亚轻量目标检测器Focus-DETR效率倍增
前言目前DETR类模型已经成为了目标检测的一个主流范式。但DETR算法模型复杂度高，推理速度低，严重影响了高准确度目标检测模型在端侧设备的部署，加大了学术研究和产业应用之间的鸿沟。来自华为诺亚、华中科技大学的研究者们设计了一种新型的DETR轻量化模型Focus-DETR来解决这......
RT-DETR：可以满足实时性要求的DETR模型
本文分享自华为云社区《高性能网络设计秘笈：深入剖析Linux网络IO与epoll》，作者：LionLong。一、epoll简介epoll是Linux内核中一种可扩展的IO事件处理机制，可替代select和poll的系统调用。处理百万级并发访问性能更佳。二、select的局限性（1）文件描述符越多，性能越差。单个进程......
DETR
目录1.用卷积神经网络抽特征(1)按数据、标签取数据(2)把数据做成序列(3)拉平特征2.用TransformerEncoder去学全局特征3.用TransformerDecoder调整objectquery生成100个预测框4.二分图匹配和损失函数相较于传统目标检测，DETR是一种纯端到端的网络。它不再需要NMS(非极大值......
detrex | 面向detr系列的目标检测开源框架
DETR作为Transformer应用于目标检测领域的开山之作，后续有大量的算法都是在其基础上改进而来，如Deformable-DETR，DAB-DETR，DN-DETR，DINO等。这些模型尽管都是采用DETR的基本架构，但其改进创新却各有千秋，能否有一个框架将这些算法融合在一起方便我们使用呢？CVR团队分别开源了DAB-DETR,DN-D......
加速44%！RT-DETR量化无损压缩优秀实战
RT-DETR模型是飞表目标检测套件PaddleDetection最新发布的SOTA目标检测模型。它是一种基于DETR架构的端到端目标检测器，在速度和精度上均取了SOTA性能。在现实部署中，为了追求“更准、更小、更快”的效率，本文使用飞模模型压缩工具PaddleSlim中的自动压缩工具（ACT,AutoCompressionTo......
超越YOLOv8，飞桨推出精度最高的实时检测器RT-DETR！
众所周知，实时目标检测(Real-TimeObjectDetection)一直由YOLO系列模型主导。飞桨在去年3月份推出了高精度通用目标检测模型PP-YOLOE，同年在PP-YOLOE的基础上提出了PP-YOLOE+。后者在训练收敛速度、下游任务泛化能力以及高性能部署能力方面均达到了很好的效果。而继PP-......
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP，远超YOLOv8
前言本文首先分析了现代实时目标检测器中NMS对推理速度的影响，并建立了端到端的速度基准。为了避免NMS引起的推理延迟，作者提出了一种实时检测Transformer（RT-DETR），这是第一个实时端到端目标检测器。具体而言，设计了一种高效的混合编码器，通过解耦尺度内交互和跨尺度融合来高效处理多......
gitee github 左侧栏树形显示插件 Octotree codetree 浏览器插件
起因看到一位仁兄用gitee做仓库https://gitee.com/zhengqingya/java-developer-document然后左侧栏挺方便（抖音视频）下载chrome扩展市场搜octotree用于githubcodetree用于gitee双核浏览器扩展市场搜octotree用于githubgitcodetree用于gitee......
DINO-DETR论文学习记录
摘要我们介绍了DINO（带有改进的去噪器box的DETR），一种最先进的端到端对象检测器。DINO通过使用对比方式进行去噪训练、混合查询选择方法进行锚点初始化以及用于框预测的ookfo......
DETR源码学习（一）之网络模型构建
这篇文章主要为记录DETR模型的构建过程首先明确DETR模型的搭建顺序：首先是backbone的搭建，使用的是resnet50,随后是Transformer模型的构建，包含编码器的构建与解码器的构建，完......

相关文章

赞助商

阅读排行