首页 > 其他分享 >用BEVformer来卷自动驾驶-2

用BEVformer来卷自动驾驶-2

时间:2024-01-21 11:31:46浏览次数:32  
标签:200 特征 驾驶 BEVformer 空间 来卷 BEV 摄像头

回顾上一期:用BEVformer来卷自动驾驶-1 (qq.com)

用BEVformer来卷自动驾驶-2_特征空间

      

      上一期我们讲到了从3D到4D(加了时间概念)以后使得BEV能变得更厉害,具体这种厉害其实是可以解决纯视觉解决方案里面最难解决的问题,就是基于恶劣天气,或者拍的不清楚的时候,或者突然有遮挡的时候,融入时间的概念,可以很大一定程度上提升解决方案的准确度

       总结一下上一期我们介绍的

  • 2D:一个摄像头2维平面特征
  • 3D:多摄像头特征融合的BEV高维空间
  • 4D:  加了时间序列的BEV更高维空间

       

        我们继续

        思考一下在特征融合的时候我们可能会遇到哪些问题?

  1. 自动驾驶它不是静态画面对吧?那必然涉及到不同时刻的特征,这部分差异要对齐
  2. 不同传感器的时间绝对相同么?不一定,那时间差异要对齐
  3. 把多个特征最后都要映射到同一个坐标系里面,空间位置也要对齐
  4. 谁来对齐?


还是拿图来举例说明

用BEVformer来卷自动驾驶-2_特征空间_02

       比如上图看2维空间的一个自西向东行驶的汽车,它的座舱位置在T-1时刻和T1时刻是覆盖在不同的像素点之下的,T-1时刻座舱玻璃是绿色的像素点,T时刻是粉丝的像素点,我们要开启BEV上帝视角,就自然要设定一个偏移量,比如T-1到T时刻,座舱的像素点取数据要在X轴上加a。

       那么这个a偏移量假设世界上真的有足够聪明的人,或者足够有经验的人可以定义,但是还要考虑定义此时Y轴上的偏移;还要定义可能和这个车存在同一个摄像头画面里的其他的对象的偏移定义,所以用人是不现实的,这块我们交给模型做预测就可以了。

      另外空间上的补偿也用一个图来说明,这个相对简单点

用BEVformer来卷自动驾驶-2_像素点_03

       比如针对左上角视角的摄像头a。正常它负责的区域,就是左上角扇形区域的视野,但是你保证摄像头的内外参的映射和校对一定是完美的吗?包括由于日常行驶的时候的一些突然发生的问题,所谓是未必的。这个空间上的差异也需要通过模型去矫正,进而在2D转3D的时候映射到相对准确的特征空间

      当校对并且融合完毕后,我们可以近似理解为我们得出了BEV,就是上帝视角下的被重构的一个特征空间,当然在这个特征空间的大小我们可以自己定义

      BEV可以想象成一个Tensor

      假设我画的下面这个图是200*200的矩阵(实在画不下).....

用BEVformer来卷自动驾驶-2_像素点_04

       这个每一个对应的小方块(在现实世界一般是米为单位的,1米或0.5米完全取决于你要求的细致程度),每一个方块我们其实可以把它理解为一个向量,那么我们形成的BEV可以干什么呢?

       特征空间你可以给它想象成一个网络,特征空间的大小,也就是网格的间隔决定了你的精度,你可以弄200*200,那是不是得到了4万个向量组成的在高维空间上融合的tensor呢?

       你甚至可以做400*400那就是16万了,做多大都可以,看你显存的实力了。特征空间稀疏的,那计算肯定就快,如果你是个密集的特征空间,那肯定速度上要牺牲一些。

       在特征空间里,我们可以以全局视角来进行预测,整个空间的长和宽(比如200*200)都给出来了,只需要来计算每个方块的具体特征是啥就可以了。

       如果在任务中把每个点的特征都做出来了,你在高维空间中做物体检测啥的,这就是已经现成了(传统比如Yolo,DETR,还得先构建特征空间和向量)

        又或者你拿着这些做分割或者其他的下游任务,那也是手到擒来了,现在的主流本来就是同一个共享的特征空间,不同的下游任务,愿意做啥做啥,打个比方就好像打游戏时候别人还在新手村探索地图,而你已经开挂了,知道所有藏宝的位置

        我们继续以一个图来讨论可能会发生的问题

用BEVformer来卷自动驾驶-2_3D_05

      当特征空间确认了下来,比如200*200,那它需要和我的6个摄像头来计算特征吧?

      比如每一个摄像头是100*100,那4万个点中的每一个点要和6个摄像头都算一遍,我就需要进行6万次计算

     200*200的特征空间每一个点去和6个100*100摄像头计算就要24亿次...

     我相信这个时候会有读者想到,要不做空间压缩,把200*200变为20*20,那这种以牺牲细节为代价的想法,可能又没法真正商用,我们还是要考虑现实世界的最起码精度要求...

     那我想又当又立怎么办?可以实现吗?

     答案是可以的,这个时候BEVformer就出来了

     今天就讲到这,后面讲BEVformer, 铺垫了2天,才讲完BEV还没说BEVformer是啥...

用BEVformer来卷自动驾驶-2_特征空间_06

    

标签:200,特征,驾驶,BEVformer,空间,来卷,BEV,摄像头
From: https://blog.51cto.com/u_16432251/9355220

相关文章

  • 深度学习的未来:如何应对自主学习和无人驾驶
    1.背景介绍深度学习是一种人工智能技术,它通过模拟人类大脑中的神经网络结构和学习过程,来解决复杂的问题。在过去的几年里,深度学习已经取得了显著的进展,并在图像识别、自然语言处理、语音识别等领域取得了显著的成功。然而,随着技术的不断发展,深度学习也面临着新的挑战和机遇。在本文......
  • VMware vRealize Operations 8.6 下载 - 自动驾驶式 IT 运维管理
    VMwarevRealizeOperations8.6|12OCT2021|Build18741589VMwarevRealizeOperations8.5|2021年|内部版本18255622VMwarevRealizeOperations8.4|2021年|内部版本17863947VMwarevRealizeOperationsManager8.3|2021年|内部版本17501340VMware......
  • VMware vRealize Operations 8.4 发布 - 自动驾驶式 IT 运维管理
    概述VMwarevRealizeOperations可提供从应用到基础架构的自动驾驶式IT运维管理,以优化、规划及扩展SDDC和VMwareCloud部署,同时提供对多个公有云的可见性。在AI和预测性分析的支持下,它可帮助IT部门在一个统一的运维平台上轻松且不受干扰地进行生产运维。无论本地部署还......
  • VMware Aria Operations 8.12 - 自动驾驶式 IT 运维管理
    VMwareAriaOperations8.12-自动驾驶式IT运维管理作者主页:sysin.org自动驾驶式IT运维管理VMwareAriaOperations(以前称为vRealizeOperations)借助统一运维平台,跨私有云、混合云和多云环境实现自动驾驶式IT运维管理,该平台通过AI/ML和预测性分析提供持续的性能、容量和......
  • 【python机器学习课程设计】驾驶员睡意检测——机器模型训练
    一.选题背景  驾驶员的疲劳和睡意是道路交通安全的重要隐患之一。据统计,疲劳驾驶导致的交通事故占比较高,甚至可能造成生命和财产的巨大损失。因此,开发一种有效的驾驶员睡意检测系统对于提高交通安全具有重要意义。  通过监测驾驶员的眼部数据等,可以建立一个机器学习模型来......
  • 上海普陀区政府大力支持北汇信息自动驾驶智能测试系统项目
    北汇信息自主研发的“自动驾驶智能测试系统”项目获得上海普陀区政府的强力支持。此项目符合普陀区政府为加速推动智能软件产业发展而制定的战略规划,旨在进一步落实《上海市推进新型基础设施建设行动方案》和《上海市促进在线新经济发展行动方案》等一系列创新措施。 上海普陀......
  • 人工智能大模型原理与应用实战:利用大模型进行自动驾驶研究
    1.背景介绍自动驾驶技术是人工智能领域的一个重要研究方向,它旨在通过集成计算机视觉、机器学习、路径规划和控制等技术,实现无人驾驶汽车的智能化和自主化。在过去的几年里,自动驾驶技术取得了显著的进展,尤其是在深度学习和大模型方面的研究。这篇文章将介绍如何利用大模型进行自动驾......
  • 深度学习原理与实战:深度学习在无人驾驶中的应用
    1.背景介绍无人驾驶技术是当今最热门的研究领域之一,它涉及到多个技术领域,包括计算机视觉、机器学习、人工智能等。深度学习是机器学习的一个分支,它主要基于神经网络的结构和算法,具有很强的表示和学习能力。因此,深度学习在无人驾驶技术中发挥着重要作用。在这篇文章中,我们将从以下几......
  • m基于Yolov2深度学习网络的驾驶员打电话行为预警系统matlab仿真,带GUI界面
    1.算法仿真效果matlab2022a仿真结果如下:2.算法涉及理论知识概要随着汽车数量的不断增加,交通安全问题日益突出。其中,驾驶员手持电话行为是导致交通事故的一个重要原因。为了降低这类事故的发生率,本文提出了一种基于Yolov2深度学习网络的驾驶员手持电话行为预警系统。该系统能够......
  • m基于Yolov2深度学习网络的驾驶员打电话行为预警系统matlab仿真,带GUI界面
    1.算法仿真效果matlab2022a仿真结果如下: 2.算法涉及理论知识概要       随着汽车数量的不断增加,交通安全问题日益突出。其中,驾驶员手持电话行为是导致交通事故的一个重要原因。为了降低这类事故的发生率,本文提出了一种基于Yolov2深度学习网络的驾驶员手持电话行......