UltimateDO_ An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Cha

时间：2024-11-15 18:07:15浏览次数：1

标签：Cha via 训练 Efficient 检测 occ detection UltimateDO 3D

UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height

Abstract

Occupancy and 3D object detection are characterized as two standard tasks in modern autonomous driving system. In order to deploy them on a series of edge chips with better precision and time-consuming trade-off, contemporary approaches either deploy standalone models for individual tasks, or design a multi-task paradigm with separate heads. However, they might suffer from deployment difficulties (i.e., 3D convolution, transformer and so on) or deficiencies in task coordination. Instead, we argue that a favorable framework should be devised in pursuit of ease deployment on diverse chips and high precision with little time-consuming. Oriented at this, we revisit the paradigm for interaction between 3D object detection and occupancy prediction, reformulate the model with 2D convolution and prioritize the tasks such that each contributes to other. Thus, we propose a method to achieve fast 3D object detection and occupancy prediction (UltimateDO), wherein the light occupancy prediction head in FlashOcc is married to 3D object detection network, with negligible additional timeconsuming of only 1.1ms while facilitating each other. We instantiate UltimateDO on the challenging nuScenes-series benchmarks.

Comments

FlashOcc 结合 object detection 一起做

初版论文，很多地方有待完善

Q&A

1. 检测任务和占据任务是如何一起做的？互相有什么影响？

1.1 联合方法比较

file-20241114162207323|627
occ 和检测一起做有上图所示的几种思路

使用两个独立的模型分别实现 occ 和检测
共享 3D 体素特征，使用两个 head 实现 occ 和检测
将一个轻量的 occ 模块嫁接在检测上

1.2 具体做法

file-20241114160937742
在得到BEV 特征图后，将全尺寸的特征图输入 center-head 做 3D 检测，在全尺寸的特征图中 crop 出一块输入 occ-head 做 occupancy 的预测。

由于加入了 occ 联合训练，对于 BEV 特征图的数据增强，只使用了翻转，没有旋转和缩放。

可以考虑两阶段训练，旋转缩放对于检测模型还是很有帮助的
第一阶段只训练检测头
第二阶段联合训练
需要做实验测试

不过论文中不加这些数据增强，指标还算可以，加上之后，指标都下降了

论文中也给出了一个训练策略的对比结果表格：
file-20241114174838132
结论：
使用检测模型的预训练模型来做 occ 任务，比从头训练一个 occ 任务效果要好
occ 和 det 联合训练比用预训练的 occ 以及单独的 det 结果要好。
所以直接联合训练就可以了。

1.3 Occ 模块嫁接位置

Occ分支在网络中的嫁接位置至关重要，会影响到：

总计算时间
检测和占用分支之间错综复杂的相互依赖和纠缠
由浅到深有三种不同的结合方式：

不同方式的实验对比：

初步结论是：
算力充足的条件下，在 backbone 的位置嫁接，会获得最佳性能
否则在 neck 的位置嫁接，计算时间最短

1.4 联合训练的好处

file-20241114171049752|595
结果表明，细粒度的占用知识有助于在模型内构建 3D 语义理解。同时，实例级 3D 边界框有助于调节对象所在的前景空间。

occ-loss 的权重设计对最终的结果影响也比较大：
file-20241114171621894|596
保持检测的损失权重 1.0 不变，调整 occ-loss 的权重，从上表可以看出，随着 $\lambda_{occ}$ 的增加，occ 的指标不断提升，相对的检测指标不断下降，为了保持多任务之间的平衡，最后取 $\lambda_{occ}=5.0$

或许和训练epochs有关，增加epoch,occ和detection就可以到达最佳性能

2. crop 操作影响梯度传播吗？会影响部署吗？

目前来看不会影响梯度
是否好部署需要测试

Pipeline

file-20241114175249405

Performance

标签：Cha,via,训练,Efficient,检测,occ,detection,UltimateDO,3D
From： https://www.cnblogs.com/swc-blog/p/18548442

GoFurther - Chapter 5: Database Setup and Configuration
zzh@ZZHPC:/zdata/Github/greenlight$dockerpullpostgreszzh@ZZHPC:/zdata/Github/greenlight$dockerrun--namepostgres17-p5432:5432-ePOSTGRES_USER=root-ePOSTGRES_PASSWORD=root-dpostgres:latest zzh@ZZHPC:~$dockerexec-itpostgres17psql......
神奇的getchar()
C语言中的getchar()文章目录前言一、getchar是什么？二、使用步骤总结前言getchar()是C语言标准库中的一个函数，它用于从标准输入流（通常是键盘）读取下一个可用的字符。提示：以下是本篇文章正文内容，下面案例仅供参考一、getchar()是什么？getchar()是一个非常基础的......
echarts 画一个南丁格尔玫瑰饼图
constdatas=[{name:'无信号',value:5,label:{color:'#06B7FFFF'}},{name:'正常',value:8,label:{color:'#69D85DFF'}},{name:......
注意力机制（Attention Mechanism）是什么？详细解度
###注意力机制（AttentionMechanism）注意力机制（AttentionMechanism）是深度学习中一种关键的思想，最早在自然语言处理（NLP）任务中被提出，用于提高模型处理长序列和复杂数据的能力。它的核心思想是让模型能够根据输入数据的不同部分动态地分配注意力权重，从而更好地捕捉重要信息。---......
Windows系统日志报错：生成了一个严重警告并将其发送到远程终结点。这会导致连接终止。T
当我们检查Windows系统日志发现有一个报错：生成了一个严重警告并将其发送到远程终结点。这会导致连接终止。TLS协议所定义的严重错误代码是10。WindowsSChannel错误状态是1203。导致报错的原因是什么？该如何处理？驰网飞飞和你分享其实这个报错和“生成以下严重警告:10。内部错误......
echart 环图
option={tooltip:{trigger:'item'},legend:{type:'scroll',icon:'circle',orient:'vertical',left:'42%',itemGap:8,top:'middle',itemHeight:20,tooltip:{show:true},formatter......
Python开发环境搭建（PyCharm+Anaconda+Git+Gitee）
一、Anaconda介绍1.1为什么选择Anaconda？Anaconda是一个开源的Python发行版本，主要用于数据科学和机器学习，它包含了Python、conda以及众多工具和库，让我们可以轻松的构建和管理python虚拟环境，方便的进行python项目开发。下面是选择Anaconda的理由：安装简单方便便捷的Python虚拟......
【Chapter 4】Machine Learning Regression Case_Second hand Car Price Prediction-X
文章目录一、XGBoostAlgorithm二、ComparisonofalgorithmimplementationbetweenPythoncodeandSentosa_DSMLcommunityedition(1)Datareadingandstatisticalanalysis(2)dataprocessing(三)Featureselectionandcorrelationanalysis(4)Samplepartit......
前端抓包神器Charles
Q:Charles是什么A:Charles是一个抓包工具，类似工具还有Fiddler。Charles相当于一个插在服务器和客户端之间的“过滤器”；当客户端向服务器发起请求的时候，先到Charles进行过滤，然后Charles在把最终的数据发送给服务器；Q:Charles能干什么A:常做以下这些事：抓取Http和......
Exchange 2016部署实施案例篇-04.Ex基础配置篇（下）
上二篇我们对全新部署完成的ExchangeServer做了基础的一些配置，今天继续基础配置这个话题。DAG配置先决条件首先在配置DGA之前我们需要确保DAG成员服务器上磁盘的盘符都是一样的，大小建议最好也相同。其次我们需要确保有一块网卡用于数据复制使用（PS：单块网卡也可以......