首页 > 编程语言 >汇总|3D点云目标检测算法

汇总|3D点云目标检测算法

时间:2022-10-06 13:03:44浏览次数:78  
标签:提出 检测 Object 汇总 三维 点云 3D


前言

前面总结了几种基于激光雷达点云数据的3D目标检测算法,还有一些算法不再单独列出,这里做个简单总结来分享下!

基于激光雷达点云的3D目标检测算法

1、End-to-End Multi-View Fusion for 3D Object Detection in Lidar Point Clouds(Waymo和Google联合提出)

主要提出了一种新的端到端多视图融合(MVF)算法,该算法能有效地学习利用透视图和点云信息。具体地说,论文介绍了动态体素化,它与现有的体素化方法相比有四个优点:

  • 消除了预先分配具有固定大小的张量需要;
  • 克服了由于随机点/体素丢失引起的信息损失;
  • 产生确定的体素嵌入和更稳定的检测结果;
  • 建立点和体素之间的双向关系,这为跨视点特征融合奠定了基础;

通过采用动态体素化,提出的特征融合体系结构可以使每个点学习融合来自不同视图的信息。MVF对点进行操作,可以自然地从激光雷达点云扩展到其他方法。在最新发布的Waymo开放数据集和KITTI数据集上广泛评估了MVF模型,并证明它比可比较的单视图点柱baseline显著提高了检测精度。

汇总|3D点云目标检测算法_目标检测

汇总|3D点云目标检测算法_目标检测_02

汇总|3D点云目标检测算法_目标检测_03

2、LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving(Uber提出, CVPR2019)

本文提出了一种基于激光雷达数据的自动驾驶三维目标检测算法LaserNet。这项工作提出了一种有效的方法来学习一个端到端的概率三维目标检测器。当有足够的训练数据时,通过使用一个小而密集的范围图像,而不是一个大而稀疏的鸟瞰图像,可以在显著降低运行时间的情况下获得最新的检测性能。该方法不仅为每个检测产生一个类概率,而且在检测边界盒上产生一个概率分布。本文提出的方法是第一个通过模拟包围盒角点的分布来捕捉检测的不确定性。通过估计检测的精度,该方法可以使全自动驾驶系统中的下游部件在具有不同不确定性的物体周围表现出不同的行为。

汇总|3D点云目标检测算法_点云_04

汇总|3D点云目标检测算法_3d_05

3、BirdNet: a 3D Object Detection Framework from LiDAR information

本文针对3D检测任务,提出了一种面向激光雷达数据的新的网络框架BirdNet。首先,将激光雷达数据投影到一种新的用于鸟瞰投影的cell编码中。然后,通过一个最初设计用于图像处理的卷积神经网络来估计目标在平面上的位置和方向。最后,在后处理阶段计算面向3D的检测任务。

汇总|3D点云目标检测算法_目标检测_06

汇总|3D点云目标检测算法_点云_07

4、LMNet: Real-time Multiclass Object Detection on CPU using 3D LiDAR(英特尔提出)

本文描述了一种优化的单级深层卷积神经网络LMNet,它只使用点云数据来检测城市环境中的目标。此功能使该方法能够在一天中的任何时间和照明条件下工作。提出的网络结构采用扩展卷积,随着深度的增加,感知场逐渐增大,计算时间减少约30%。网络输入包括无组织点云数据的五种透视表示,网络为每个点输出对象贴图和边界框偏移值。实验表明,使用反射、范围和三个轴上的每个轴上的位置有助于改善输出边界框的位置和方向。在KITTI数据集评估服务器的帮助下进行了定量评估,获得了最快的处理速度,使其适合实时应用。本文在一辆装有Velodyne HDL-64的实车上实现并测试了网络。基于桌面GPU实现了高达50 FPS的执行速度,在单个Intel Core i5 CPU上实现了高达10 FPS的执行速度。

汇总|3D点云目标检测算法_点云_08

汇总|3D点云目标检测算法_目标检测_09

5、PIXOR: Real-time 3D Object Detection from Point Clouds(Uber和多伦多大学提出)

本文在自主驾驶环境下,研究了基于点云的实时三维目标检测问题。计算速度至关重要,因为检测是安全的必要组成部分。然而,由于点云的高维性,现有的方法在计算上是昂贵的。论文通过从鸟瞰图(BEV)中表示场景来更有效地利用3D数据,并提出了PIXOR,一种proposal-free的单级检测器,它输出从像素级神经网络预测解码的定向3D对象估计。网络特别设计了输入表示、网络结构和模型优化,以平衡高精度和实时性。论文在两个数据集上验证了PIXOR:KITTI-BEV目标检测数据集和large-scale 3D车辆检测基准。两个数据集表明,所提出的检测器在平均精度(AP)方面明显优于其他最先进的方法,而且速度上仍高于28fps。

汇总|3D点云目标检测算法_目标检测_10

汇总|3D点云目标检测算法_3d_11

汇总|3D点云目标检测算法_点云_12

6、PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud(香港大学提出,CVPR2019)

本文提出了一种基于点云的三维目标检测方法。整个框架由两个阶段组成:第一阶段用于自下而上的3D region proposal,第二阶段用于在标准坐标系中细化proposal以获得最终的检测结果。第一阶段子网络没有像以前的方法那样从RGB图像或投影点云到鸟瞰图或体素中生成建议,而是通过将整个场景的点云分割成前景点和背景,以自下而上的方式直接从点云生成少量高质量的3D建议。第二阶段子网络将每个方案的集合点转换为规范坐标,以学习更好的局部空间特征,并结合第一阶段学习到的每个点的全局语义特征,进行精确的box细化和置信度预测。在KITTI数据集的三维检测基准上进行的大量实验表明,本文提出的架构仅使用点云作为输入,其性能优于最新的方法,并且具有显著的边缘。

汇总|3D点云目标检测算法_点云_13

汇总|3D点云目标检测算法_目标检测_14

汇总|3D点云目标检测算法_3d_15

7、YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud

基于YOLOv2进行改进的文章,主要将3D点云在二维透视图像空间进行映射,并在在二维透视图像空间的一次回归元结构成功的基础上,对其进行扩展,从LiDAR点云生成面向三维对象的bounding box。本文的主要贡献是将YOLO v2的损失函数扩展为包含偏航角、笛卡尔坐标系中的3D box中心和box高度的直接回归问题。文章创新度不大,但是效果和速度值得借鉴:Titan X GPU上实现了实时性能(40 fps)。

汇总|3D点云目标检测算法_3d_16

汇总|3D点云目标检测算法_目标检测_17

8、FVNet: 3D Front-View Proposal Generation for Real-Time Object Detection from Point Clouds(上海交大&腾讯优图)

与二维点云相比,原始点云和稀疏点云的三维目标检测得到的处理要少得多。

本文提出了一种新的基于点云的三维前视图生成和目标检测框架FVNet。它包括两个阶段:前视图proposal的生成和三维bounding box参数的估计。本文没有从相机图像或鸟瞰图中生成proposal,而是先将点云投影到柱面上,生成保留丰富信息的前视特征图。然后引入一个region proposal网络,从生成的地图中预测三维区域proposal,并进一步从整个点云中提取出感兴趣的对象。最后,论文提出了另一个网络,从提取出的目标点中提取点特征,并在标准坐标系下回归最终的三维bounding box参数。FVNet以每个点云样本12毫秒的速度实现实时性能。在三维检测基准KITTI上进行的大量实验表明,所提出的结构在精度上和速度上优于以相机图像或点云为输入的最新技术。


汇总|3D点云目标检测算法_目标检测_18

汇总|3D点云目标检测算法_点云_19

 上述内容,如有侵犯版权,请联系作者,会自行删文。





汇总|3D点云目标检测算法_3d_20




标签:提出,检测,Object,汇总,三维,点云,3D
From: https://blog.51cto.com/u_14439393/5733547

相关文章

  • FusionNet:基于稀疏雷达点云和RGB图像的深度图补全
    原文链接:http://arxiv.org/abs/1902.05356v1代码链接:https://github.com/wvangansbeke/Sparse-Depth-Completion主要思想本文提出了一种新的基于RGB图像的稀疏LiDAR点云深度......
  • 大盘点|6D姿态估计算法汇总(上)
    1、DenseFusion:6DObjectPoseEstimationbyIterativeDenseFusion(CVPR2019)原文链接:https://arxiv.org/abs/1901.04780代码链接:https://github.com/j96w/DenseFusio......
  • 汇总|3D人脸重建算法
    1、Nonlinear3DFaceMorphableModel(2018)论文链接:https://arxiv.org/abs/1804.03786项目链接:​​http://cvlab.cse.msu.edu/project-nonlinear-3dmm.html​​主要思想:三维......
  • 3D人脸重建和人脸分析常用的数据集汇总
    1、AFLWdatabase数据下载链接:​​http://lrs.icg.tugraz.at/research/aflw/​​AFLW人脸数据库是一个包括多姿态、多视角的大规模人脸数据库,而且每个人脸都被标注了21个特......
  • 汇总|医学图像数据集
    一、胰腺分割数据集数据下载链接:​​http://academictorrents.com/details/80ecfefcabede760cdbdf63e38986501f7becd49​​数据介绍:包含82个病例的胰腺数据集。二、MICCAI胰......
  • SLAM代码问题汇总
    对‘cv::String::deallocate()’未定义的引用检查CMakeLists.txt路径拼写错误:target_link_libraries(gaussNewton${OpenCV_INCLUDE_LIBS})正确:target_link_libraries(g......
  • ImGui渲染3d元素的方法
    目前主要有2种方法:一是简单场景,可以自己处理3维坐标向屏幕坐标的转换,然后调用ImGui的二维绘制函数进行渲染;二是复杂场景,首先在3d引擎侧渲染到bufferframe,然后调用ImGui的......
  • 汇总|缺陷检测数据集
    一、弱监督学习下的工业光学检测(DAGM2007)数据下载链接:​​https://hci.iwr.uni-heidelberg.de/node/3616​​数据集介绍:主要针对纹理背景上的杂项缺陷。较弱监督的训练数据......
  • React-hooks面试考察知识点汇总
    Hook简介Hook出世之前React存在的问题在组件之间复用状态逻辑很难React没有提供将可复用性行为“附加”到组件的途径(例如,把组件连接到store)。有一些解决此类问题的......
  • 【题解】「AGC013D」Piling Up
    传送门题目大意:开始有\(n\)个黑白球在袋子中,但是不知道具体多少黑球白球,有\(m\)次操作,每次从袋子中先拿一个球,再放入一个黑球一个白球,再拿走一个球,求所有初始情况下......