首页 > 其他分享 >VoxelNet阅读笔记

VoxelNet阅读笔记

时间:2022-10-06 13:03:25浏览次数:57  
标签:卷积 三维 笔记 特征 VoxelNet 阅读 点云 体素



主要思想和创新点

三维点云中目标的精确检测是许多应用中的核心问题,如自主导航、管家机器人和增强/虚拟现实等。为了将高度稀疏的激光雷达点云与区域建议网络(RPN)连接,大多数现有的工作都集中在手工制作的特征表示上,例如,鸟瞰图投影。这项工作消除了人工特征工程对三维点云的需求,提出了VoxelNet,一种将特征提取和box预测统一为一个单阶段、端到端可训练的深度通用三维检测网络。具体来说:

  • 提出了VoxelNet,一种通用的三维检测框架,它可以从点云中同时学习区分特征表示,并以端到端的方式预测精确的三维边界框。
  • 设计了一种新的体素特征编码(VFE)层,通过将点特征与局部聚集特征相结合,实现了体素内部的点间交互,通过叠加多个VFE层可以学习复杂特征来表征局部3D形状信息。
  • VoxelNet将点云划分为等间距的三维体素,通过叠加的VFE层对每个体素进行编码,然后三维卷积进一步聚集局部体素特征,将点云转化为高维体素表示。
  • RPN使用体积表示并产生检测结果。这种有效的算法既有稀疏点结构的优点,又有体素网格上高效并行处理的优点。
  • 本网络主要面向RPN+点云操作,并没有建立类别级的分类,作为一个通用的面向激光雷达点云操作的RPN框架使用。

 

在KITTI汽车检测基准上的实验表明,VoxelNet在很大程度上优于最新的基于激光雷达的三维检测方法。此外,网络能够学习到各种几何体的物体的有效区分表示,从而在仅基于激光雷达的行人和骑自行车者的三维检测中取得令人鼓舞的结果。

网络结构

如下图所示,网络主要包括三个模块:Feature Learning Network、Convolutional Middle Layers和Region ProposalNetwork。

VoxelNet阅读笔记_点云

针对Feature Learning Network:首先对3D点云进行体积划分,然后进行特征提取,特征提取部分主要包括一系列的VFE模块进行处理,最终输出一个4D的tensor供下ConvolutionalMiddle Layers进行处理。

其中VFE特征编码网络结构:

VoxelNet阅读笔记_3d_02


针对Convolutional Middle Layers:

每个卷积中间层依次应用3D卷积、BN层和ReLU层。卷积中间层在逐渐扩展的感受野中聚集体素特征,为形状描述添加更多的信息。

针对Region Proposal Network:RPN的输入是由卷积中间层提供的特征映射。这个网络的架构如下图所示。该网络有三个完全卷积层块,每个块的第一层通过步长为2的卷积将特征映射进行下采样,紧接着是步长为1的卷积操作。每个卷积层之后,应用BN和ReLU操作。然后,将每个块的输出数据提升到一个固定的大小并进行concatanate,以构建高分辨率的特征映射,最后的RPN在该特征图上进行操作,输出概率得分图和回归图。

 VoxelNet阅读笔记_3d_03


损失函数:由于VoxelNet主要针对region proposal任务,并不做类别判断。Loss部分主要由3D box参数和前景背景判断组成如下所示:


VoxelNet阅读笔记_点云_04

box参数的定义,包括长宽高、角度以及中心坐标:


VoxelNet阅读笔记_3d_05

实验结果

主要针对KITTI数据集中的Car、Pedestrian和Cyclist进行测试,多模型效果对比如下所示:

VoxelNet阅读笔记_点云_06

将检测效果映射到RGB图像:

VoxelNet阅读笔记_3d_07

原文链接:https://arxiv.org/abs/1711.06396





VoxelNet阅读笔记_卷积_08





标签:卷积,三维,笔记,特征,VoxelNet,阅读,点云,体素
From: https://blog.51cto.com/u_14439393/5733548

相关文章

  • Linux笔记丨文件管理类常用命令学习笔记
    今天的笔记内容是:linux常用文件管理类基础命令file、cut、in、more、less、mktemp、mv、paste、split、read的学习笔记。Linux文件管理file命令识别文件的编码方式和......
  • 前端程序员学习 Golang gin 框架实战笔记之二分析 context
    上一节:前端程序员学习Golanggin框架实战笔记之一开始玩gin之前讲到了如何使用gin,这一节我们来分析和调试一下它的代码。New()第一行的gin.New(),其实还有一种......
  • SQL语句笔记
    SQL语句自用笔记,记录自原视频bilibili:BV1634y1R77q创建部门表deptnodnamelocation1技术部一楼A区createtabledept(--dept部门deptnointp......
  • 新概念第一册51~60单元学习笔记
    Chapterfifty-one:ApleasantclimateDialogueWheredoucomefrom?#相似句whereareyoufromIcomefromGreece#what'ssb/sthlike句式What'stheclimatelikein......
  • 阅读为什么是一座随身携带的避难所
    阅读为什么是一座随身携带的避难所我喜欢看书,闲暇时光基本上就在看闲书中度过和打发了。看书时遇到这么一句话,叫做阅读是一座随身携带的避难所,第一次看到这句话直觉觉得......
  • 5-互评-OO之接口-DAO模式代码阅读及应用
    DAO模式是接口的一个典型应用。阅读附件中的参考代码,并回答以下问题:StudenDaoListImpl.java与StudentDaoArrayImpl.java有何不同?StudenDaoListImpl.java采用List存......
  • 胡言 | 我的笔记本电脑
    自从换用Fedora36之后,个人感觉使用体验飙升,截了两个图分享一下!......
  • 如何阅读一本书
    习惯一:针对不同的阅读层次投入相对的精力基础阅读检视阅读分析阅读主题阅读习惯二:提高阅读速度用手指着书,让手挪动的速度带领阅读速度看到不懂的跳过用不同的......
  • 9/30课堂笔记及动手动脑
    类的定义:1、定义了一组大体上相似的对象。一个类所包含的方法和数据描述一组对象的共同行为和属性。2、对象则是类的具体化,是类的实例。3、类通过派生可以有子类,同样也......
  • 【学习笔记】JDBC
    JDBC 什么是数据库驱动数据库驱动就是连接应用程序与数据库的如果没有数据库驱动,应用程序是无法直接到达数据库的,数据库驱动是由数据库厂商来做的 什么是JDBCSU......