首页 > 其他分享 >BEV detection(自底向上)小结

BEV detection(自底向上)小结

时间:2024-06-18 11:12:06浏览次数:12  
标签:transformer 底向上 BEV detection https zhihu com view

LLS

https://zhuanlan.zhihu.com/p/589146284

BEVDet

提出一种优雅可行可扩展的范式,包含4个部分:image-view encoder, view transformer from image view to BEV, bev encoder, head.

pipeline

module


Augmentation

防止过拟合,不光对图片做增强,还对bev feature做flipping, scaling, rotating(同时作用view transformer 和 3d targets)。

ablation

IDA 图像增强
BDA bev特征增强
BE BEV encoder

BEVDet4D

bevdet4d 将bevdet从只有空间信息的3d工作空间提高到时空的4d工作空间。

pipeline

以bevdet为基础进行扩展,将前一帧特征和当前帧特征进行融合,融合前需要进行时空对齐和concate

spatial alignmnet

ablation

BEVDepth

https://zhuanlan.zhihu.com/p/547509776

module

1.Explicit Depth Supervision。显式深度监督。利用点云做监督训练深度预测模块。

2.Camera-aware Depth Prediction。相机级别深度预测。考虑不同相机可能fov不同,将相机的内参和外参加入网络。
将内参MLP操作后,类似SE机制加入网络,起到reweight的作用。

3.Depth Refinement Module。

BEVPoolV2

在工程上优化view transformer 视锥特征

BEVFusion

https://www.bilibili.com/video/BV1ix4y1f7mX/?vd_source=ce2a79a81ce4664d23986d5dd13fe96e
有两篇北大阿里和MIT(https://zhuanlan.zhihu.com/p/654781992 https://github.com/mit-han-lab/bevfusion)
大差不差MITstar最多

标签:transformer,底向上,BEV,detection,https,zhihu,com,view
From: https://www.cnblogs.com/dingz/p/18253923

相关文章

  • monocular 3D detection小结
    smoke参考https://zhuanlan.zhihu.com/p/452676265monodle通过大量密集实验(逐步用gt替换预测值测试),localizationerror是3d检测的关键。提出三点策略:1.重新思考了2d中心和3d中心的不对齐影响(用3dcenter替换2dcenter能提高性能,且2d检测能作为辅助任务帮助3d检测)2.去除较远......
  • BEV感知算法---BevFusion
    前言转载自https://blog.csdn.net/qq_40672115/article/details/134891133这是一篇LiDAR和Camera融合的BEV感知算法,从算法动机&开创性思路、主体结构、损失函数以及性能对比四个方面展开。BEVFusion有两篇文章,本次课程主要讲解的是阿里和北大的:https://arxiv.org/pdf/2205.1......
  • Anomaly Detection on Attributed Networks via Contrastive Self-Supervised Learnin
    PaperAnomalyDetectiononAttributedNetworksviaContrastiveSelf-SupervisedLearnin代码实现异常注入inject_anomaly.pyinject_anomaly.py注入异常过程,处理原始数据集,并添加结构和属性扰动,注入结构属性异常。importnumpyasnpimportscipy.sparseasspim......
  • mmdetection使用未定义backbone训练
    首先找到你需要用到的backbone,一般有名的backbone都会在github有相应的代码开源和预训练权重提供本文以mobilenetv3+fastercnn作为举例,在mmdetection中并未提供mobilenetv3,提供的仅有mobilenetv2;在github上找到mobilenetv3实现和权重,下载到本地;本文使用参考为:https://g......
  • 【python】OpenCV—Blob Detection(11)
    学习来自OpenCV基础(10)使用OpenCV进行Blob检测文章目录1、cv2.SimpleBlobDetector_create中文文档2、默认parameters3、配置parameters附录——cv2.drawKeypoints1、cv2.SimpleBlobDetector_create中文文档cv2.SimpleBlobDetector_create是OpenCV库中用于创......
  • 深度学习论文翻译解析(二十二):Uniformed Students Student-Teacher Anomaly Detection W
    论文标题:UniformedStudentsStudent-TeacherAnomalyDetectionWithDiscriminativeLatentEmbbeddings论文作者: PaulBergmann MichaelFauser DavidSattlegger CarstenSteger论文地址:https://openaccess.thecvf.com/content_CVPR_2020/papers/Bergmann_Uninformed......
  • End-to-End Object Detection with Transformers
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!Europeanconferenceoncomputervision,2020 Abstract. 我们提出了一种新的方法,将目标检测视为一个直接集预测问题。我们的方法简化了检测流程,有效地消除了对许多手工设计的组件的需求,如非最大值抑制程序或锚生成,这些......
  • BEV与Occupancy怎样助力自动驾驶落地?
    自动驾驶领域中,什么是BEV?什么是Occupancy?BEV是Bird'sEyeView的缩写,意为鸟瞰视图。在自动驾驶领域,BEV是指从车辆上方俯瞰的场景视图。BEV图像可以提供车辆周围环境的完整视图,包括车辆前方、后方、两侧和顶部。BEV图像可以通过多种方式生成,包括:使用激光雷达:激光雷达可......
  • A Simple Framework for Open-Vocabulary Segmentation and Detection
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!ProceedingsoftheIEEE/CVFInternationalConferenceonComputerVision.2023. Abstract  1.Introduction 2.RelatedWork 3.Method3.1.BasicLossFormulation 3.2.BridgeTaskGap:Decou......
  • Mask DINO: Towards A Unified Transformer-based Framework for Object Detection an
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.2023. Abstract在本文中,我们提出了一个统一的对象检测和分割框架MaskDINO。MaskDINO通过添加一个支持所有图像分割任务(例如......