首页 > 其他分享 >基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)

时间:2022-10-06 13:03:07浏览次数:46  
标签:diffusion 深度图 补全 法向 稀疏 深度


原文链接:https://arxiv.org/pdf/1910.06727v1.pdf

主要思想

深度补全任务旨在从稀疏的深度图中恢复较为密集的深度图。这项任务对自动驾驶领域越来越重要,受到CV界的广泛关注。大多数现有方法通过直接训练网络从稀疏深度图中学习密集深度图的映射参数,然而这种方式在利用3D几何约束和处理实际传感器噪声方面有困难。

本文提出了一个统一的CNN框架,用以规范深度补全任务并提高针对噪声的鲁棒性,主要思路:

1) 在diffusion module中对深度图和其表面法向建立几何约束

2) 预测稀疏激光雷达的置信度以减轻noise的影响。

具体来说,本文的编码解码backbone同时预测表面法线、粗略深度和激光雷达输入的confidence,然后输入到diffusion refinement module模块中,以获得最终的深度图补全结果。

本文提出的网络在KITTI深度补全数据集和NYU-depth-V2数据集上的实验表明,达到了SOTA。

创新点

1、假设三维场景由分段平面构成,从2D空间到3D空间完成深度图补全。具体来说,在平面原点距离空间中将深度和其曲面法向进行共轭,并通过一个递归diffusion module对其进行细化,该模块在深度补全过程中强制执行深度和曲面法向之间的约束。

2、基于这一观点,本文提出了一个统一的两级CNN框架,以实现从非常稀疏的输入(如激光雷达点云图)补全深度。为了提高实际传感器对噪声的鲁棒性,进一步引入了一个置信度预测(Confidence)分支来阻止噪声相关信息的传播。

3、本文提出的框架可以完成端到端的训练,大量的实验结果表明,模型在保持良好的泛化能力的同时达到了最新的性能。

网络结构

如下图所示,网络主要两个部分:预测网络和细化网络。其中又包括三个子模块:Prediction Network、Plane-origin Distance Transformation和Refinement Network。

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)_补全

针对Prediction Network:

1、输入为稀疏点云和对应的彩色图像

2、网络基于U-Net结构,利用共享的八位编码器和独立的解码器分别估计深度法线图、粗略深度图和稀疏深度置信度图

3、通过channel-wise concatention方式对Normal Prediction和Coarse Depth模块中的feature map进行操作,得到Guidance Feature G。

针对Plane-origin Distance Transformation:

平面原点距离转换,利用法线估计将稀疏输入和粗略深度映射转化为平面原点距离子空间。

针对Refinement Network:

细化网络主要对Coarse Depth进行优化,使用diffusion model重复地改进平面原点距离,强制执行分段平面约束并规范深度补全。该方法利用了深度与曲面法向之间的几何约束,在缺失区域表现得更好、更稳定。最后,通过反变换求出细化后的深度图,细化完成后并没有精度上的损失。

其中diffusion model结构如下所示:

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)_深度图_02

通过循环迭代更新的方式精化plane-origin距离p,后期对p和Normal prediction进行反变换,即可完成深度图的补全任务。

实验结果

基于KITTI depth prediction dataset和NYU-Depth-v2 dataset下进行评估。

几种网络下深度补全对比实验:

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)_补全_03

KITTI数据集下的实验结果:

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)_3d_04

NYU-Depth-v2数据下的实验结果:

基于深度法向约束的稀疏雷达数据深度补全(商汤科技和香港大学联合提出)_补全_05

上述内容,如有侵犯版权,请联系作者,会自行删文。

标签:diffusion,深度图,补全,法向,稀疏,深度
From: https://blog.51cto.com/u_14439393/5733550

相关文章

  • FusionNet:基于稀疏雷达点云和RGB图像的深度图补全
    原文链接:http://arxiv.org/abs/1902.05356v1代码链接:https://github.com/wvangansbeke/Sparse-Depth-Completion主要思想本文提出了一种新的基于RGB图像的稀疏LiDAR点云深度......
  • 混合深度卷积,更少参数下的轻量级网络
    原文链接:https://arxiv.org/pdf/1907.09595.pdf代码链接:​​https://github.com/tensorflow/tpu/tree/master/models/official/mnasnet/mixnet​​ 1、主要思想和创新点Dep......
  • 二叉树的最小深度
    二叉树的最小深度一、题目描述给定一个二叉树,找出其最小深度。最小深度是从根节点到最近的叶子节点的最短路径上的节点数量。实例输入:root=[3,9,20,null,null,15,7]......
  • 学习+科研+做项目 深度学习最全详细资料
    ​​李宏毅2020机器学习深度学习(完整版)国语​​​​[双语字幕]吴恩达深度学习deeplearning.ai​​​​深度学习(卷积网络、循环神经网络、对抗神经网络、Tensorflow实战)​......
  • Codeforces Beta Round #87 (Div. 1 Only) A. Party(树的深度+dfs)
    https://codeforces.com/contest/115/problem/A题目大意:给定n个节点,每个节点都有一个不同于自己的数值,表示自己的老板,-1表示自己就是老板。现在玩游戏需要组队,一组队......
  • 深度学习常用数据集介绍与下载(附网盘链接)
    摘要:这篇博文总结了博主收集的深度学习常用的数据集,包含常用的分类、目标检测及人脸识别任务,对每个数据集给出了简要介绍、官网下载网站以及公众号获取的关键字。因为有的......
  • 深度学习pytorch之线性回归实现
    importtorchfrommatplotlibimportpyplotasplt#损失率:learn_rate=0.1#训练数据x=torch.rand([500,1])y=3*x+0.8#参数w=torch.rand([1,1],req......
  • 基于深度学习的语义分割综述
    ImageSegmentationUsingDeepLearning:ASurveyPaper链接:https://arxiv.org/abs/2001.05566摘要图像分割是图像处理和计算机视觉领域的一个重要课题,在场景理解、医学......
  • 3D目标检测深度学习方法数据预处理综述
    前言​这一篇的内容主要要讲一点在深度学习的3D目标检测网络中,我们都采用了哪些数据预处理的方法,主要讲两个方面的知识,第一个是representation,第二个数据预处理内容是数据......
  • 3D目标检测深度学习方法之voxel-represetnation内容综述(一)
    前言​笔者上一篇文章有介绍了3D目标检测中比较重要的数据预处理的两个方面的内容,其一是几种representation的介绍,分别是point、voxel和grap三种主要的representation,具体......