首页 > 其他分享 >[Paper Reading] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

[Paper Reading] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

时间：2024-04-28 14:11:06浏览次数：28

标签：Multi DETR3D Object 2D Images 3D view

名称

DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
时间：21.10
机构：mit/CMU/Stanford

TL;DR

一种利用Transformer做E2E的3D目标检测方法，在nuScenes自动驾驶数据集上取得很好效果。

Method

主要创新点在于2D-to-3D Feature Transforms模块，细节如图描述，整个过程多层迭代Refine结果，并且每层输出的box都有Loss监督：

Q: 如果只有2D-to-3D过程从image feature的稀疏sample与concat预测3D监督，那么应该无法使稠密的image feature学出有利于目标检测的2D视觉特征，文章中没有说明这里的细节。猜测：1) 实际训练过程也使用了focal loss之类的特征监督2D feature每个位置点的类别信息。2) 文章说到DETR3D是使用DD3D作为预训练模型的，这时2D特征可能已经具有2D目标检测的表征能力，不需要再专门学习2D特征了。
Code链接：https://github.com/WangYueFt/detr3d
基于mmdetection3d构建

Experiment

总结与发散

无

相关链接

DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
https://github.com/WangYueFt/detr3d

标签：Multi,DETR3D,Object,2D,Images,3D,view
From： https://www.cnblogs.com/fariver/p/18153527

相关文章

3D打印机箱（冲浪的羊）
有两款机箱，4盘和6盘机箱外观尺寸223*227*215mm材料PETG优点：外观迷你使用戴尔的硬盘架，插入非常顺滑，质感很好。服务器的做工真的很好，手感有分量。另外这块硬盘架还支持2.5英寸硬盘安装。上面的主板最大支持19*19cm可以扩展两个PCIE半高设备，对于一些老主板特别有帮助，可以安装......
Godot中设置Sprite2D节点透明度
Godot中设置Sprite2D节点透明度该方法可以用于所有CanvasItem类及其子类···#假设在`CancasItem`节点自身脚本中执行#设置范围0～1##设置自己及子节点modulate.a=0.5##仅设置自己节点的透明度self_modulate.a=0.5#设置范围（0～255）8bit##设置自己及子节点mod......
Godot中设置Sprite2D节点透明度
Godot中设置Sprite2D节点透明度该方法可以用于所有CanvasItem类及其子类···#假设在`CancasItem`节点自身脚本中执行#设置范围0～1##设置自己及子节点modulate.a=0.5##仅设置自己节点的透明度self_modulate.a=0.5#设置范围（0～255）8bit##设置自己及子节点mod......
【刚度矩阵推导】2d frame 单元
2dframe单元是x-y平面上的单元,每个节点上有2个平移自由度的和一个转动自由度.局部坐标系下,单元位移向量为:\(u=[u_1,u_2,u_3,u_4,u_5,u_6]^{T}\)其局部坐标系下的刚度矩阵可以由2dtruss单元和2dbornoulli-beam单元的刚度矩阵组合而成.使用matlab进行推导:%!b......
3d软件哪个适合新手学？3D动画渲染怎么好
在不同的行业领域，3D建模和动画的需求各异，因此所需的3D软件工具也会有所不同。对于刚开始接触3D设计的新手来说，软件的易操作性、丰富的学习资源以及与自己专业领域相关的功能是选择时的重要考虑因素。以下是几款适合初学者入门的3D软件推荐。工业设计师：犀牛、Alias犀牛和Alias......
探索飞行奥秘：3D模型带你走进飞机涡轮发动机的世界
在浩瀚的蓝天下，飞机如同矫健的雄鹰，展翅翱翔。而支撑起这雄鹰的力量之源，便是其心脏——涡轮发动机。今天，我们将通过山海鲸可视化搭建的逼真的飞机涡轮3D模型，揭开航空工业的神秘面纱。飞机涡轮发动机3D模型不仅是对真实发动机的精准复制，更是科技与艺术的完美结合。每一个细......
【CC2DX随笔】多个精灵播放同一个动画时的问题（只播放最后一个动画）
多个精灵播放同一个动画时的问题代码摘要//pSpReinit在2次循环里代表2个精灵.for(shortj=0;j<2;j++){for(shorti=0;i<THMAX_ANI_COUNT;i++){if(0==strcmp(m_arrpAniGroup[i]->szarrDesc,"batMove")){pAniMoveTo=m_arrpAni......
开源相机管理库Aravis例程学习（四）——multiple-acquisition-signal
目录简介例程代码函数说明g_main_loop_newg_main_loop_rung_main_loop_quitg_signal_connectarv_stream_set_emit_signalsQ&A回调函数的同步调用与异步调用帧丢失问题简介本文针对官方例程中的：02-multiple-acquisition-signal做简单的讲解。并简单介绍其中调用的g_main_loop_new......
Converge: QoE-driven Multipath Video Conferencing over WebRTC 概略
这是一片2023sigcomm的文章。论文指出多摄像头（multiplecamera)和高分辨率（highresolution）场景下，视频会议的QoE还有提升空间，而作者将提升QoE的目光转到多路传输（multipath）上。所以总体来看这是一篇利用多路传输来优化视频会议体验的文章。常用的多路协议包括MPTCP，MPQUIC，MPRTP经过......
利用speckle引擎里的speckleviewer加载渲染3d模型
1、bim引擎speckle简介Speckle是一个开源的数据平台，专为建筑、工程和建造行业设计。它旨在通过提供一个共享和协作的环境来解决数据互操作性问题。Speckle允许用户在不同的软件应用程序之间实时共享、管理和流式传输3D模型和设计数据。这个平台支持多种流行的设计软件，如Autodesk......

赞助商

阅读排行