首页 > 其他分享 >AVP-SLAM:自动泊车系统中的语义SLAM

AVP-SLAM:自动泊车系统中的语义SLAM

时间:2024-03-19 14:59:00浏览次数:32  
标签:定位 地图 特征 AVP 语义 停车场 SLAM 泊车

AVP-SLAM:自动泊车系统中的语义SLAM

附赠最强自动驾驶学习资料:直达链接

论文摘要

image

在自动代客泊车系统中车辆在狭窄且拥挤且没有GPS信号的停车场中进行导航,具备准确的定位能力是至关重要的。传统的基于视觉的方法由于在停车场中由于缺少纹理,以及重复的结构和场景的变化导致跟踪容易丢失,在这篇文章中,使用了鲁棒的语义特征来建立停车场的地图并在泊车时用语义信息来定位车辆。其中语义的特征包含了地面上的指路标志,停车线,以及减速带等,这些特征通常出来在停车场中。这些语义的特征与传统的特征相比,对视角和光照变化具有一定的稳定性。这里采用了四个全景的摄像头来增加感知范围,以惯导和轮速里程计作为辅助信息,生成了全局的视觉语义地图,这张地图用来定位可以达到厘米级别,文章中分析了该系统的准确性和召回率,并且与实际实验中的其他方法进行了比较,来证明该系统的实用性。

主要贡献

image

文章在介绍中分析了自动驾驶需求量越来越大,但是由于,视觉跟踪上的挑战,定位精度上的要求以及各种传感器的成本等限制,以及针对停车场这种场景的特殊限制,文章提出了这种基于语义特征的定位方法,这种定位方法不仅能够针对停车场这种场景有很好的适配,并且语义特征是对视角和光照不敏感的等优势提出了基于语义特征的地图定位系统,这能够使得车辆在停车场中自动的导航。文章的贡献主要有:

(1)提出了一种在视觉slam框架中使用的新型语义特征。

(2)提出了一个完整的停车场内自动驾驶地图构建和定位系统。

(3)基于所提出的系统进行真实的自动泊车应用程序。

论文图集

image

总体流程图:该系统从四个全方位车载摄像头、一个IMU和车轮编码器作为输入。在SLAM过程中,构建了具有语义特征的环境地图。基于此先验地图,可以达到厘米级的定位精度。

image

image

 AVP中常见的环视系统

image

image

根据SLAM的两个模块,建图与定位,建图模块根据环视系统的四个相机生成IPM俯视图,再根据四个相机的相互之间的关系拼接成(a)图,利用深度学习将包括车道,停车线引导线以及减速带等信息分割出来,再根据里程计的信息,将这些语义特征映射到全局的坐标系下,由于里程计的累计误差,这里使用了回环检测通过局部地图的匹配减少累计误差。第二部分是定位。与建图部分一样,从鸟瞰图像中提取语义特征。通过将语义特征与先前的构建出来的地图进行匹配来对车辆进行定位。最后,采用扩展卡尔曼滤波器(EKF)将视觉定位结果与里程计融合,保证了能够正在无纹理的停车场环境中,系统能够输出稳定的定位结果。

内容简介

文章内容对该系统使用到的知识点都有一一的说明:

A 首先是IPM( Inverse Perspective Mapping )逆透视变换

image

B 语义特征提取:使用了CNN网络进行了语义特征的检测[1], U-Net [2]进行分割。

C 局部地图的构建:根据之前图像IPM的变换关系,可以将这些语义信息映射到三维空间中,并且根据里程计信息,将这些语义特征不断的变换到全局坐标下。

D 回环检测为了解决里程计的漂移的问题,这里使用了语义特征的局部地图不断的ICP全局地图,不断的局部优化。

E:全局优化,优化的残差为:

image

F 定位:语义地图中的定位。如下图白色、红色和蓝色的圆点是地图上的停车线、减速带、指路标志。绿点是当前的特征。橙色线是估计的轨迹。通过将当前特征与地图匹配来定位车辆。停车位由停车位的角点和停车线拟合自动生成。

image

G 停车位的检测:由于停车线和停车位角点是从IPM图像中检测出来的,因此很容易自动检测停车位。角点用于预测停车点的位置。如果停车线与预测的停车位匹配良好,则该预测被认为是正确的。

实验对比

image

image

image

image

image

在停车场中使用AVP-SLAM系统建立一张地图。然后利用该地图对到达目标停车点的车辆进行定位和导航。

总结

论文提出了一个基于视觉的定位解决方案,利用强健的语义特征来辅助车辆在停车场中导航。车辆周围使用了四个摄像头。通过IPM(逆透视变换)将图像变换成鸟瞰图。然后神经网络检测语义视觉特征,包括车道、停车线、路标和减速带。基于这些特征构建了语义视觉地图。通过厘米级的语义特征匹配,可以在地图上对车辆进行定位。通过实验和实际的自主停车应用验证了该系统的有效性。AVP-SLAM实现了1.33%的定位误差和厘米级定位精度。由于所使用的语义特征的特殊性,提出的系统目前只适用于停车场。未来,我们将致力于开发一般语义特征,并将所提出的系统推广到更多的场景中。

参考文献

[1] J. Long, E. Shelhamer, and T. Darrell, “Fully convolutional networks for semantic segmentation,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2015, pp. 3431–3440.

[2] O. Ronneberger, P. Fischer, and T. Brox, “U-net: Convolutional networks for biomedical image segmentation,” in International Conference on Medical image computing and computer-assisted intervention. Springer, 2015, pp. 234–241

附赠最强自动驾驶学习资料:直达链接

标签:定位,地图,特征,AVP,语义,停车场,SLAM,泊车
From: https://www.cnblogs.com/autodriver/p/18082817

相关文章

  • 视觉slam十四讲CH5 ---相机与图像
    视觉slam十四讲---CH5相机与图像视觉slam中,作为主要传感器的相机自然起到着重要的作用,而相机拍摄的图像及其处理也是我们要做的工作之一。1.相机模型单目相机的针孔模型上图中的模型即为常见的单目相机的针孔模型示意。从5-1的左边我们可以看到有很多坐标系交杂在一......
  • 视觉slam十四讲 ---CH5 相机与图像
    视觉slam十四讲---CH5相机与图像视觉slam中,作为主要传感器的相机自然起到着重要的作用,而相机拍摄的图像及其处理也是我们要做的工作之一。1.相机模型单目相机的针孔模型上图中的模型即为常见的单目相机的针孔模型示意。从5-1的左边我们可以看到有很多坐标系交杂在一......
  • 【SLAM】Soomthing And Mapping技术参考
    TectonicSAM笔记SAM(SmoothingAndMapping)是SLAM简化而提升效率的概念。SAM也是SFM(StructureFromMotion)的关键技术。TectonicSAM,采用因子图模型,优化方法估计状态(地图与位姿参数),本文将submap类比于大陆板块(Tectonic),对submap内部节点改变不明显,submap之间可大幅度调......
  • vslam算法
    vslam算法VSLAM(VisualSimultaneousLocalizationandMapping)算法是一种用于机器人自主导航的技术,它允许机器人通过视觉传感器获取环境信息,以估计自己的位姿和周围环境的的三维重建。VSLAM算法可以分为以下几类:1特征法。这种方法通过提取图像中......
  • slam算法
    slam算法SLAM(SimultaneousLocalizationandMapping,同时定位与地图构建)算法是一种集成了传感器测量和计算机视觉技术的自主导航技术,它允许机器人或无人机在未知环境中实时构建地图,并估计自己的位置和方向。SLAM算法可以分为基于视觉的SLAM和基于激光雷达或......
  • 视觉slam十四讲CH4 ---李群与李代数求导
    视觉slam十四讲---CH4李群与李代数求导李群与李代数相较于CH3是比较的抽象的数学知识,这个工具的提出目的是解决一些旋转位姿描述的优化问题。本讲最终的目的是解决如何描述对旋转求导的问题。1.什么是群群是一种集合加上一种运算的代数结构记集合为A,运算为\(\cdot\q......
  • 视觉SLAM
    目录视觉SLAM特征点法2D-2D对极几何3D-2DPnP3D-3DICP光流法说明直接法理论模型(最小化光度误差)一些细节问题工程问题安装sophus视觉SLAM特征点法特征点提取+匹配ORB=Fast+ORientedBrief特征点:Fast10(9/11),即如果周围连续10个点都亮/暗于中心参考点,则该点为特征角点。O......
  • 视觉slam十四讲 ch3 三维刚体运动
    视觉slam十四讲---CH3三维刚体运动三维刚体运动,即三维空间下的刚体的运动。刚体,是指在运动中和受力作用后,形状和大小不变,而且内部各点的相对位置不变的物体。在运动过程中,机器人或者飞机和汽车的形变很小,可以近似看作刚体。三维刚体运动就是研究如何描述和表示一个刚体在......
  • flutter ios swift avplayer 播放器自动播放下一集
    使用监听监听结束事件importFoundationimportAVKitimportMediaPlayerimportFlutterclassFlutterAVPlayerView:NSObject,FlutterPlatformView{privatevar_flutterAVPlayerViewController:AVPlayerViewControllerprivatevarurlArray:[URL]=[]......
  • SLAM中的李群李代数
    SLAM的李群和李代数的应用体现在旋转矩阵和旋转向量上:旋转矩阵对应李群,旋转向量对应李代数。在现代微分几何中李群一种流形(Manifold),单位元处的正切空间代表了这个李群的李代数空间。旋转本身有3个自由度。旋转向量就可以完整表示。然而旋转矩阵是3x3的,有9个变量,变量之间是有约束......