[Paper Reading] DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION

时间：2024-08-07 17:27:18浏览次数：19

标签：Attention END DEFORMABLE OBJECT TRANSFORMERS DETR

DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION

link
时间：2021(ICLR)
机构：Sensetime & USTC & CUHK

TL;DR

参考2D Deformable Conv，通过在Reference Point附近增加sample points，将DETR的收敛速度提升10倍，对于小目标效果也更好。

Method

背景知识：参考 DETR
核心思路：
1.Sample Points而非全局Points：每个Query与FeatureMap做Attention过程，仅与FeatureMap部分特征Attention，而不像DETR那样全部spatial feature都Attention，好处是计算量可以明显小。具体做法是Key的维度变为原来的3x倍，其中1x是原来的key（与query乘积softmax之后作为加权因子），剩下的2x用来预测2D的offset

2.Multi-Scale：从CNN Backbone中取出多尺度特征(不使用FPN)，各自使用Deformable Attention。

Code: https://github.com/fundamentalvision/Deformable-DETR

Experiment

相对于原生DETR变慢，可能是Backbone计算量加太猛了，不过效果提升明显。

其实相对于传统非E2E的方法(例如 ATSS)也只是基本打平而已

总结与发散

无

资料查询

折叠Title

FromChatGPT(提示词：XXX)

标签：Attention,END,DEFORMABLE,OBJECT,TRANSFORMERS,DETR
From： https://www.cnblogs.com/fariver/p/18347504

如何从 python socket.sendmsg 获取套接字 Tx 时间戳
在阅读此处、此处和此处时，我发现在Linux系统上，您可以通过设置套接字选项来请求接收和传输的数据包的时间戳。我目前可以使用SO_TIMESTAMPNS和SO_TIMESTAMPING来通过recvmsg获取Rx时间戳。使用sendmsg我不知道......
Python科研武器库 - 字符串操作 - 字符串开头结尾判断 startswith() endswith()
使用场景：按照开头的前缀、结尾的后缀来判断、筛选目标字符串。使用函数：str.startswith(search_string,start,end)str.endswith(search_string,start,end)search_string：要匹配的目标字符串。start:要从中匹配search_string的str的起始索引。end:要考虑匹配的str的结......
解决torchaudio.load报错（Couldn't find appropriate backend to handle uri ）
解决torchaudio.load报错（Couldn'tfindappropriatebackendtohandleuri）问题描述（报错信息）：问题：Traceback(mostrecentcalllast): File"resample.py",line43,in<module> resample_use_cuda() File"resample.py",line24,inres......
Unity强化工程之 SpriteRender
本文仅作笔记学习和分享，不用做任何商业用途本文包括但不限于unity官方手册，unity唐老狮等教程知识，如有不足还请斧正1.SpriteRenderer是什么渲染精灵用的，是渲染的核心组件，有许多重要参数所以要详细讲一讲SpriteRenderer-Unity手册2.参数DrawMode精灵绘制模式Sim......
复现opendrivelab的“点云预测”项目
本文的主要工作就是复现下述论文中的算法。该论文全称：VisualPointCloudForecasting论文内容在此不做过多介绍，直接上项目。一、准备工作首先通读readme.md文件的内容，了解所需要的相关依赖和数据等内容。一定要多读几遍，不要扫一眼就过了。接下来就是部署环境，根据readme......
2024牛客暑期补题 4 I Friends
新手做题当然会有许多的经验。本人就是蒟蒻(这个题用到map作为预备大二）还没有完全学懂stl但是大体内容学的差不多。用到图论的知识以及set的自动排序和去重以及双指针就可以做。大家要是像我一样水平可以先去看看这几个知识图论看怎么构建set了解一下就行双指针最好去......
Endless Wander（漫无止境）手游攻略个人总结记录（有空更新）
"AmysteriousPortalsealedforyearsreopens,offeringachanceforNovutosavehissistertrappedinsideandtorebuildtheWanderer'sGuild."EndlessWanderisanofflineroguelikeRPGinapixelartstyle.Itfeaturessatisfyingandch......
torch._dynamo 理解(1)——Frontend
0概述TorchDynamo是一个Python级别的即时(JIT)编译器，旨在让未修改的PyTorch程序运行得更快。它通过PythonFrameEvaluationHooks（Python框架评估钩子）来实现这一目标，以便在运行时动态地生成和优化代码。这使得TorchDynamo可以有效地处理各种Python代码，包括包......
Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph
这篇文章是2023年AAAI会议上的一篇论文，主要是利用分子图和DDI图嵌入来提供上下文感知信息，从而进行安全药物推荐。链接Context-AwareSafeMedicationRecommendationswithMolecularGraphandDDIGraphEmbedding|ProceedingsoftheAAAIConferenceonArtificialInt......
题解：CF1537E2 Erase and Extend (Hard Version)
CF1537E2EraseandExtend题解分析通过观察题目，可以证明结果一定是由多次前缀复制得来的。题目要求你进行删和复制的操作，与其交替着操作，不如直接先删到最优的前缀再进行复制。现在就是要找最优的前缀。从头一位一位往后遍历。用\(l\)来存储目前最优前缀的长度，第\(i\)位......