首页 > 其他分享 >github疯狂涨星-基于Transformer的端到端3D目标检测

github疯狂涨星-基于Transformer的端到端3D目标检测

时间:2022-09-29 16:03:30浏览次数:55  
标签:编码器 github 涨星 特征 Transformer 3DETR 解码器 3D

github疯狂涨星-基于Transformer的端到端3D目标检测_点云

我们训练了一个端到端Transformer模型,用于点云上的三维目标检测。我们的模型有一个用于特征编码的Transformer编码器和一个用于预测盒子的Transformer解码器。对于一个看不见的输入,我们计算从参考点(蓝点)到场景中所有点的自我注意力,并以红色显示注意值最高的点。解码器将注意力集中在一个实例中,这使预测边界框变得更容易。

摘要:我们提出了3DETR模型,一个端到端的Transformer为基础的三维点云对象检测模型。与现有的检测方法相比,3DETR应用了一些3D特定感知的偏差,只需对普通Transformer块进行简单修改。具体而言,我们发现具有非参数查询和傅里叶位置嵌入的标准Transformer与使用具有手动调整超参数的三维特定运算符库的专用体系结构具有竞争力。尽管如此,3DETR在概念上简单且易于实现,通过结合3D领域知识实现了进一步的改进。通过大量的实验,我们发现3DETR的性能优于成熟且高度稳定的算法。在具有挑战性的ScanNetV2数据集上优化VoteNet基线9.5%。此外,我们还表明3DETR适用于检测不到的3D任务,可以作为未来研究的基础。

github疯狂涨星-基于Transformer的端到端3D目标检测_编码器_02

(左)3DETR是一种端到端可训练的Transformer,它将一组3D点(点云)作为输入并输出一组3D边界框。Transformer编码器使用多层自我注意力产生一组逐点特征。点特征和一组“查询”嵌入被输入到Transformer解码器,该解码器生成一组方框。我们将预测框与地面真相相匹配,并优化一组损失。我们的模型不使用颜色信息(仅用于可视化)。(右)我们是随机的采样一组嵌入的“查询”点,然后由解码器将其转换为边界框预测。

github疯狂涨星-基于Transformer的端到端3D目标检测_编码器_03

编码器和解码器的体系结构。我们提出了3DETR编码器和解码器的一层结构。编码器层将N点的N×d特征作为输入,并输出N×d特征。它执行自我注意力,然后执行MLP。解码器将编码器的N×d点特征作为输入B×d特征(查询嵌入或先前的解码器层),输出B盒的B×d特征。解码器在B查询/框特征之间执行自我注意力,并在B查询/框特征和N点特征之间执行交叉注意。我们使用傅里叶位置编码,其中所有3DETR模型均使用d=256。

实验结果:

github疯狂涨星-基于Transformer的端到端3D目标检测_点云_04

微信公众号:

github疯狂涨星-基于Transformer的端到端3D目标检测_编码器_05

下载对应的论文,在公众号中回复:3DETR


标签:编码器,github,涨星,特征,Transformer,3DETR,解码器,3D
From: https://blog.51cto.com/u_15717531/5723112

相关文章

  • github非常张星-Real-ESRGAN盲超分
    如上图所示对比双三次上采样、ESRGAN、RealSR以及Real-ESRGAN方法,本论文提出的方法可以获得较好的结果。使用纯合成数据训练的Real-ESRGAN模型能够增强细节,同时消除常见真实......
  • SVN、Git、Github、Gitee、Gitlab 之间的关系
    SVN是一个集中式版本控制系统。仓库:中央服务器(远程仓库)。Git是一个分布式版本控制系统。仓库:中央服务器(远程仓库),个人电脑(本地仓库)。GithubGithub是基于git的代......
  • transformers的近期工作成果综述
    基于transformer的双向编码器表示(BERT)和微软的图灵自然语言生成(T-NLG)等模型已经在机器学习世界中广泛的用于自然语言处理(NLP)任务,如机器翻译、文本摘要、问题回答、......
  • 同一台电脑,如何使用不同的github账号?
    不同的项目,可能将会面对不同的账号,如何实现同一台电脑使用不同的sshkey来访问不同的github账号呢解决思路如下:生产新的SSH密钥对,并且把它加到公司的邮箱中$ssh-keyge......
  • Gitee And GitHub优秀开源资料记录
    分类链接描述数据库:SqlSugarhttps://gitee.com/dotnetchina/SqlSugar开源ORM框架源码(数据库操作)数据库:SqlSugar 从零开始-项目安装-《SqlSugar5.0文......
  • 说说人脉的力量!网易手游出重大bug,杀谁祭天?github也可以打赏了
    文/北妈阅读本文需要 2.5分钟一先喊口号,周五不加班!不加班!今天说3件事+有趣的新闻,注意高能预警1、网易游戏要有人祭天了,看图根据线报,网易一款手游游戏 率土之滨,正式线居然......
  • Swin Transformer 论文精读笔记
    参考https://www.bilibili.com/video/BV13L4y1475U/?spm_id_from=333.788&vd_source=920f8a63e92d345556c1e229d6ce363fICCV最佳论文:SwinTransformer  Swin,其实就......
  • 转:transformer综述汇总与变形分析
    transformer综述汇总与变形分析 (这个汇总记录了多篇transformer综述,写的很好,推荐) 下面的一个relatedwork总结也写的很好,摘自:PVTv2:ImprovedBaselineswithPyramid......
  • Git:Github-SSH 配置(加密方式 Ecdsa)
    鼠标右键菜单>>GitBashHere配置用户名gitconfig–globaluser.name"用户名"配置电子邮箱gitconfig–globaluser.email"电子邮箱"以Ecdsa的方式生成SSH......
  • GitHub 如何帮助您构建项目
    GitHub如何帮助您构建项目当我开始开发Nawat应用程序时,我使用笔记来跟进开发任务。工作量越快增长,我就需要另一个开发人员来帮助我完成不同的任务。聘请了一名自由职......