首页 > 其他分享 >[Paper Reading]

[Paper Reading]

时间:2024-05-14 14:20:34浏览次数:12  
标签:增强 NMS 数据 空间 Paper BEVDet Reading BEV

BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View

BEVDet
时间:21/12
机构:PhiGo(鉴智机器人)

TL;DR

一种BEV空间做detection的方法,构建了新颖的数据增强方法以及更新了nms策略,精度与FCOS3D comparable,计算量Flops仅为其11%。

Method


模型架构图整体来看也LSS等差别不大,关键创新点在于 定制化的数据增强 以及 Scale-NMS。

定制化的数据增强

传统的数据增强方法通过在2D图像空间进行,为了保持结果与GT的一致性,通过在ViewTransform过程需要相应的逆变换,这使得数据增强的好处不能作用于后续Layer,而BEV空间下的instance数少于Image空间(比如,nuScences 6个图像空间才对应一个BEV空间),本身就更容易过拟合。BEVDet直接在ViewTransform之后的特征上进行数据增强,相应处理相应的3D targets使两者保持一致性。

Scale-NMS


传统图像上NMS不适合BEV系列方法,原因是像交通椎、行人之类的目标尺寸已经小到低于BEV网格最小尺度(比如CenterPoint的是0.8m),所以计算出的3d iou数值会不太合理。作者针对每个类别设计设置一个scale超参数进行放大,如上图所示。

Experiment

表4可看出BDA(BEV data augmentation对于精度有明显提升)

表5可看出使用scale-NMS之后交通锥精度提升比较明显。

总结与发散

论文称作BEVDet,实际上主要是在BEV框架上增加了一些trick(BDA与scaleNMS)。

资料查询

折叠Title FromChatGPT(提示词:XXX)

标签:增强,NMS,数据,空间,Paper,BEVDet,Reading,BEV
From: https://www.cnblogs.com/fariver/p/18190096

相关文章

  • threading:Python线程锁与释放锁
    控制资源访问前文提到threading库在多线程时,对同一资源的访问容易导致破坏与丢失数据。为了保证安全的访问一个资源对象,我们需要创建锁。示例如下:importthreadingimporttimeclassAddThread():def__init__(self,start=0):self.lock=threading.Lock()......
  • [Paper Reading] OFT Orthographic Feature Transform for Monocular 3D Object Detec
    OFTOrthographicFeatureTransformforMonocular3DObjectDetectionOFTOrthographicFeatureTransformforMonocular3DObjectDetection时间:18.11机构:UniversityofCambridgeTL;DR当时纯视觉自动驾驶方案效果上仅达到Lidar方案有10%的水平,本文claim部分差距源于pe......
  • [Paper Reading] LSS: Lift, Splat, Shoot: Encoding Images from Arbitrary Camera R
    名称Lift,Splat,Shoot:EncodingImagesfromArbitraryCameraRigsbyImplicitlyUnprojectingto3D时间:20.08机构:NVIDIATL;DR后融合方法将每一目感知结果通过相机参数转换到BEV空间再后融合,LSS开启前融合的先河,将特征通过先lift再splat到BEV空间,通过BEV空间特征直接预......
  • Paper Reading: Tri-objective optimization-based cascade ensemble pruning for dee
    目录研究动机文章贡献本文方法染色体编码适应度函数评估进化过程最终解选择级联剪枝框架实验结果数据集和实验设置三目标优化的效果不同集成规模的算法比较算法在不同数据集上的比较优点和创新点PaperReading是从个人角度进行的一些总结分享,受到个人关注点的侧重和实力所限,可能......
  • TypeError: Cannot read properties of undefined (reading 'trim')
     运行时提示:TypeError:Cannotreadpropertiesofundefined(reading'trim')问题排查:1、确认trim()属性是否存在,这个是js去除字符串左右空格,属性是存在的2、确认this.form.proxy_url是否存在3、确认确认this.form.proxy_url的值是否为undefined和null通过排查和打印,con......
  • 如何阅读 Paper
    前言论文(Paper)通常是新技术、算法、编程方法或软件工具的首次公布。通过阅读论文,我们可以了解最新的技术进展,保持自己的技能和知识是最新的。同时,论文提供了对特定主题深入理解的机会。它们通常包含详细的理论分析和实验结果,这有助于深入理解某个概念或技术。但是,如何高效地阅读......
  • ' for reading (没有那个文件或目录)en file `
     001、奇怪的报错:'forreading(没有那个文件或目录)enfile`[sy20223040796@admin1test]$ls##测试文件及命令test.bedtest.sh[sy20223040796@admin1test]$cattest.bed##测试文件1540000154000021542500154250021......
  • [Paper Reading] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D
    名称DETR3D:3DObjectDetectionfromMulti-viewImagesvia3D-to-2DQueries时间:21.10机构:mit/CMU/StanfordTL;DR一种利用Transformer做E2E的3D目标检测方法,在nuScenes自动驾驶数据集上取得很好效果。Method主要创新点在于2D-to-3DFeatureTransforms模块,细节如图描......
  • Paper——可容错的虚拟机实践系统设计.18162229
    目标:通过主备复制手段设计一个可容错的VM,用于用户运行企业级程序。primary日常工作,一旦它宕机,和它保持lock-step的backup会立刻顶上,外界观察不到这些操作,我们制造了只有一台VM永远在正常运行的假象。要考虑的点:使用什么手段保持primary和backup严格同步在虚拟化单核CPU时和多......
  • paper list(JS变量名恢复)
    PapersListAGeneralPath-BasedRepresentationforPredictingProgramProperties.[pdf]UriAlon,MeitalZilberstein,OmerLevy,EranYahav.PLDI,2018.CharacterizingtheNaturalLanguageDescriptionsinSoftwareLoggingStatements.[pdf][code]Pinji......