首页 > 其他分享 >[Paper Reading] FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugi

[Paper Reading] FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugi

时间:2024-05-29 21:14:27浏览次数:29  
标签:via Plugin Efficient Occupancy FlashOcc 特征 Height BEV Channel

FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin

link
时间:23.11
机构:houmo.ai 后摩智能

TL;DR

当时比较流行的OCC方案内存与计算复杂度较高,本文提出一种称为FlashOcc的方法,仅使用2D卷积将特征由二维空间lift到3D空间。

Method


Image Encoder, View Transform, BEV特征构建(LSS) 等处理都比较常规,时序特征融合是在BEV特征下利用车身位姿来对齐特征。唯一不同的是Occupancy Head预测不使用3D Conv比较轻量级,具体细节如下。

Occupancy Head

使用Channel-to-Height的方案预测Occupancy,具体通过几层Conv处理BEV特征为(B×C×W×H),经过Reshape将该特征变为Occupancy特征(\(B×C^{*}×Z×W×H\)),其中\(C = C^{*}×Z\),也就是将BEV每个位置特征的channel维度split成包含高度的特征向量。

Experiment


内存相对于其它occ方法从398MB -> 124MB,推理速度从7.5ms -> 3.1ms。

总结与发散

模型架构比较容易理解,整体是在走降低内存与计算开销的卖点。
channel-to-height的思想比较有意思,其实重要的不是中间特征的shape,而是你使用什么样GT来监督,把occ的GT reshape成2D来监督2D feature其实也是同样效果。

相关链接

https://github.com/Yzichen/FlashOCC/tree/master

资料查询

折叠Title FromChatGPT(提示词:XXX)

标签:via,Plugin,Efficient,Occupancy,FlashOcc,特征,Height,BEV,Channel
From: https://www.cnblogs.com/fariver/p/18221068

相关文章

  • HarmonyOS实战开发:@ohos.pluginComponent (插件组件管理器)
    用于给插件组件的使用者请求组件与数据,使用者发送组件模板和数据。如需实现插件模板的显示,请参考PluginComponent。说明:本模块首批接口从APIVersion8开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。导入模块importpluginComponentManagerfrom......
  • WPF Image enlarge via MouseWheel, selected image center does not shift
    //xaml<Windowx:Class="WpfApp123.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d="http://schemas.mi......
  • Python轻量级的插件框架库之pluginbase使用详解
    概要在软件开发中,插件系统是一个常见的需求。插件系统允许开发者动态加载和卸载功能模块,从而提高应用程序的灵活性和可扩展性。Python的pluginbase库是一个轻量级的插件框架,旨在简化插件系统的构建过程。pluginbase库提供了一套简单易用的API,使开发者能够快速集成插件功能。......
  • 顶刊IJCV 2024 | EfficientSCI++:高效的视频单曝光压缩成像重建框架
    前言 来自浙江大学和西湖大学的研究人员提出了一种基于CNN-Transformer架构的高效、大尺度视频单曝光压缩成像重建算法EfficientSCI++。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自PaperWeekly仅用于学术分......
  • Typora Plugin
    目前支持的功能:序号插件功能1window_tab标签页管理2search_multi全局多关键字搜索3multi_highlighter多关键字高亮4collapse_paragraph章节折叠5collapse_list列表折叠6collapse_table表格折叠7md_padding中英文混排优化8slash......
  • Typora Plugin
    目前支持的功能:序号插件功能1window_tab标签页管理2search_multi全局多关键字搜索3multi_highlighter多关键字高亮4collapse_paragraph章节折叠5collapse_list列表折叠6collapse_table表格折叠7md_padding中英文混排优化8slash......
  • 论文笔记:Inf-DiT: Upsampling Any-Resolution Image with Memory-Efficient Diffusion
    论文链接:[2405.04312]Inf-DiT:UpsamplingAny-ResolutionImagewithMemory-EfficientDiffusionTransformer(arxiv.org)论文代码:THUDM/Inf-DiT:OfficialimplementationofInf-DiT:UpsamplingAny-ResolutionImagewithMemory-EfficientDiffusionTransformer(gi......
  • jmeter警告:WARN StatusConsoleListener The use of package scanning to locate plugi
    运行jmeter,出现警告信息 警告信息:WARNStatusConsoleListenerTheuseofpackagescanningtolocatepluginsisdeprecatedandwillberemovedinafuturerelease意思是,JMeter在将来的版本中将移除使用包扫描来定位插件的功能 如果想不显示警告信息,可以修改JMeter......
  • 说说Loader和Plugin的区别?编写Loader,Plugin的思路?
    一、区别前面两节我们有提到Loader与Plugin对应的概念,先来回顾下loader是文件加载器,能够加载资源文件,并对这些文件进行一些处理,诸如编译、压缩等,最终一起打包到指定的文件中plugin赋予了webpack各种灵活的功能,例如打包优化、资源管理、环境变量注入等,目的是解决loader......
  • Restormer Efficient Transformer for High-Resolution Image Restoration——2022CVP
    大佬链接:Restormer:EfficientTransformerforHigh-ResolutionImageRestoration-知乎(zhihu.com)一.Motivation1.CNN感受野有限,因此无法对长距离像素相关性进行建模;卷积滤波器在推理时具有静态权重,因此不能灵活地适应输入内容2.Transformer模型缓解了CNN的缺点(有限的感......