论文全称:Parallel Tracking and Mapping for Small AR Workspaces
PTAM的重要意义是以下两点:
PTAM提出并实现了跟踪与建图过程的并行化。跟踪部分需要实时响应图像数据,而对于地图的优化则没必要实时计算。后端优化可以在后端慢慢进行,在必要时进行线程同步即可。这是视觉slam中首次区分前后端的概念,引领了后来许多slam系统的设计。
PTAM是第一个使用非线性优化,而不是使用传统的滤波器作为后端的方案。它引入了关键帧机制:我们不必精细的处理每一幅图像,而是把几幅关键的图像串起来,然后优化其轨迹和地图。早期的slam大多数使用EKF滤波器或其变种,以及粒子滤波器等;在PTAM之后,视觉slam研究逐渐转向了以非线性优化为主导的后端,
PTAM同时是一个增强现实的软件,演示了酷炫的AR效果。
存在的明显缺陷是:场景小,跟踪容易丢失。
相关概念
相机位姿估计就是通过几个已知坐标的特征点,以及他们在相机照片中的成像,求解出相机位于坐标系内的坐标与旋转角度。
AR:增强现实技术,将虚拟信息与真实世界巧妙融合的技术。增强现实看作是现实- 虚拟的连续统一,意指在AE( 真实世界) 和VE( 虚拟世界) 之间存在混合现实,靠近虚拟世界的是AV,靠近真实世界的是AR。增强现实是通过电脑技术,将虚拟的信息应用到真实世界,真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。增强现实提供了在一般情况下,不同于人类可以感知的信息。它不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。(B站看效果更佳)
fast特征点:FAST 特征点概述_木独的博客-CSDN博客_fast特征点
SSD:误差平方和算法(Sum of Squared Differences,简称SSD算法),也叫差方和算法。即计算子图与模板图的L2距离。
8bpp:256色图,也叫8位图。
Shi-Tomasi score :shi-Tomasi角点检测是在harris上稍作修改,修改了评分计算:
R=min(λ1,λ2),若分数R大于某一阈值,则认为该窗口中存在角点。
三角测量:什么是三角测量法? - 乐少行的回答 - 知乎 https://www.zhihu.com/question/27719009/answer/94892764
Bundle adjustment:中文翻译为光束法平差。本质是一个优化模型,目的是最小化重投影误差,用于最后 一步优化,优化相机位姿和世界点,分为局部BA和全局BA,是PTAM中比较耗时的操作。
M-estimator:M估计,对于含有外点的数据,如果对所有样本点使用一样的权重,在拟合模型时外点对模型会有较大的干扰,由此为出发点想到,如果降低外点的权重,则可以降低外点对模型的影响,这也就是M估计的一个思想。但问题是我们怎么知道哪些是外点呢,M估计中将与所估计模型偏差大的点视为外点,降低与模型偏差越大的点的权重。
Tukey estimator:图基(Tukey)检验被广泛用于验证质量改进的有效性。Tukey检验的一个重要的优点是非常简单,而且所需实验样本相对较少。其检验结果的可信度达到95%的置信水平时,最少的情况下只需6个样本进行验证(改善前3个样本、改善后3个样本)。运用Tukey检验无需掌握复杂的统计学知识,因此,生产一线的操作工也容易掌握。
关键帧:关键帧目前是一种非常常用的方法,可以减少待优化的帧数,并且可以代表其附近的帧。可以理解为一个学校里有100个班级,每个班的班长就是一个关键帧,他可以代表他班里的人。关键帧相当于slam的骨架,是在局部一系列普通帧中选出一帧作为局部帧的代表,记录局部信息。举例来说,摄像头放在原处不动,普通帧还是要记录的,但关键帧因为总看到原场景,所以不会增加。