首页 > 其他分享 >PTAM-论文阅读

PTAM-论文阅读

时间:2023-08-29 16:35:20浏览次数:43  
标签:关键帧 论文 PTAM slam 真实世界 阅读 外点 优化

论文全称:Parallel Tracking and Mapping for Small AR Workspaces

PTAM的重要意义是以下两点:

PTAM提出并实现了跟踪与建图过程的并行化。跟踪部分需要实时响应图像数据,而对于地图的优化则没必要实时计算。后端优化可以在后端慢慢进行,在必要时进行线程同步即可。这是视觉slam中首次区分前后端的概念,引领了后来许多slam系统的设计。

PTAM是第一个使用非线性优化,而不是使用传统的滤波器作为后端的方案。它引入了关键帧机制:我们不必精细的处理每一幅图像,而是把几幅关键的图像串起来,然后优化其轨迹和地图。早期的slam大多数使用EKF滤波器或其变种,以及粒子滤波器等;在PTAM之后,视觉slam研究逐渐转向了以非线性优化为主导的后端,

PTAM同时是一个增强现实的软件,演示了酷炫的AR效果。

存在的明显缺陷是:场景小,跟踪容易丢失。

相关概念

相机位姿估计就是通过几个已知坐标的特征点,以及他们在相机照片中的成像,求解出相机位于坐标系内的坐标与旋转角度。

AR:增强现实技术,将虚拟信息与真实世界巧妙融合的技术。增强现实看作是现实- 虚拟的连续统一,意指在AE( 真实世界) 和VE( 虚拟世界) 之间存在混合现实,靠近虚拟世界的是AV,靠近真实世界的是AR。增强现实是通过电脑技术,将虚拟的信息应用到真实世界,真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。增强现实提供了在一般情况下,不同于人类可以感知的信息。它不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。(B站看效果更佳)

fast特征点FAST 特征点概述_木独的博客-CSDN博客_fast特征点

SSD:误差平方和算法(Sum of Squared Differences,简称SSD算法),也叫差方和算法。即计算子图与模板图的L2距离。

PTAM-论文阅读_PTAM

8bpp:256色图,也叫8位图。

Shi-Tomasi score :shi-Tomasi角点检测是在harris上稍作修改,修改了评分计算:

R=min(λ1,λ2),若分数R大于某一阈值,则认为该窗口中存在角点。

三角测量:什么是三角测量法? - 乐少行的回答 - 知乎 https://www.zhihu.com/question/27719009/answer/94892764

Bundle adjustment:中文翻译为光束法平差。本质是一个优化模型,目的是最小化重投影误差,用于最后 一步优化,优化相机位姿和世界点,分为局部BA和全局BA,是PTAM中比较耗时的操作。

M-estimator:M估计,对于含有外点的数据,如果对所有样本点使用一样的权重,在拟合模型时外点对模型会有较大的干扰,由此为出发点想到,如果降低外点的权重,则可以降低外点对模型的影响,这也就是M估计的一个思想。但问题是我们怎么知道哪些是外点呢,M估计中将与所估计模型偏差大的点视为外点,降低与模型偏差越大的点的权重。

Tukey estimator:图基(Tukey)检验被广泛用于验证质量改进的有效性。Tukey检验的一个重要的优点是非常简单,而且所需实验样本相对较少。其检验结果的可信度达到95%的置信水平时,最少的情况下只需6个样本进行验证(改善前3个样本、改善后3个样本)。运用Tukey检验无需掌握复杂的统计学知识,因此,生产一线的操作工也容易掌握。

关键帧:关键帧目前是一种非常常用的方法,可以减少待优化的帧数,并且可以代表其附近的帧。可以理解为一个学校里有100个班级,每个班的班长就是一个关键帧,他可以代表他班里的人。关键帧相当于slam的骨架,是在局部一系列普通帧中选出一帧作为局部帧的代表,记录局部信息。举例来说,摄像头放在原处不动,普通帧还是要记录的,但关键帧因为总看到原场景,所以不会增加。

思维导图

PTAM-论文阅读_关键帧_02


标签:关键帧,论文,PTAM,slam,真实世界,阅读,外点,优化
From: https://blog.51cto.com/u_16240579/7277660

相关文章

  • ArrayList源码阅读之EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA区别
    /***Sharedemptyarrayinstanceusedforemptyinstances.*/privatestaticfinalObject[]EMPTY_ELEMENTDATA={};/***Sharedemptyarrayinstanceusedfordefaultsizedemptyinstances.We*distinguishthisfromEMPTY_ELEMENTDATAtoknowhowmuchtoi......
  • 你是如何阅读jdk源码的?
    阅读别人的代码作为开发人员是一件经常要做的事情。一个是学习新的编程语言的时候通过阅读别人的代码是一个最好的学习方法,另外是积累编程经验。如果你有机会阅读一些操作系统的代码会帮助你理解一些基本的原理。还有就是在你作为一个质量保证人员或一个小领导的时候如果你要做白盒......
  • Linux高性能服务器编程阅读1:
    Linux:所有东西都是文件。socket也是可读,可写,可控制,可编程的文件描述符。I/O高级函数:1.pipe()和dup()/dup2()pipe()函数创建的两个文件描述符fd[0]和fd[1]分别构成管道的两端,往fd[1]中写入的数据可以从fd[0]中读出。且,fd[1]只能写入数据,fd[0]只能读出数据,不能颠倒。dup和dup2......
  • 论文阅读 《Pingmesh: A Large-Scale System for Data Center Network Latency Measur
    背景在我们内部产品中,一直有关于网络性能数据监控需求,我们之前是直接使用ping命令收集结果,每台服务器去ping(N-1)台,也就是N^2的复杂度,稳定性和性能都存在一些问题,最近打算对这部分进行重写,在重新调研期间看到了Pingmesh这篇论文,Pingmesh是微软用来监控数据中心网络情况......
  • 【论文翻译】线图、着色与色数近似
    前言在港中文的暑研快结束的时候,由于大家快没事干了,一个本地的同学就给我分享了一个简单但不失趣味的图论定理,于是记在这里。记号与约定除特殊约定外,下文中所有变量均取正整数。对于图\(G\),称\(V_G,E_G\)为其点集和边集。在上下文明了的情况下,下标\(G\)会被忽略。为了......
  • 《水浒传》阅读录
    《水浒传》阅读录版本:人文社容与堂百回本。 第三回镇关西郑大guān人过分了!赚了人家身子,还强迫人家倒贴“典身钱”!这妥妥的恶劣暴发户行径!“买楼烂尾还得月月还钱”可与之较高下,且两者guān老爷都不管。 “天色微明”鲁提辖就来处理金氏父女之事,端的是有心人。(23.7.27) ......
  • Programming abstractions in C阅读笔记:p132-p137
    《ProgrammingAbstractionsInC》学习第53天,p132-p137,3.2小节“strings”总结如下:一、技术总结3.2小节介绍了字符串的用法:1.C语言是没有字符串(string)这种数据类型的,但是实际的场景中又很需要这种数据类型,那怎么表示字符串呢?有两种方法:1.用字符数组表示。2.用字符指针表示。......
  • 《Self-Alignment with Instruction Backtranslation》论文学习
    一、Introduction将大型语言模型(LLMs)对齐以执行指令遵循,通常需要在大量人工注释的指令样本或偏好样本上进行微调,或从更强大的模型中提炼输出。之前的研究都强调了人工注释数据质量的重要性。然而,使用具有这类质量的注释指令数据很难扩展,每种指令结构和风格的指令数据,往往只能用于......
  • How Can Recommender Systems Benefit from Large Language Models: A Survey 阅读笔
    论文主要从LLM应用在推荐系统哪些部分以及LLM如何应用在推荐系统中,还讨论了目前LLM应用在RS中的一些问题。Where?推荐系统哪些部分哪里可以应用到大模型?文章中提到了特征工程、特征编码、评分/排序函数、推荐流程控制。LLMforFeatureEngineering用大模型做特征工程:利用......
  • 论文解读 | OmniObject3D:用于逼真感知、重建和生成的大词汇量3D对象数据集
    原创|文BFT机器人这篇论文的主要目标是介绍和探索OmniObject3D数据集,该数据集包含大量真实扫描的3D物体,涵盖了190个类别,提供了多种丰富的注释,包括纹理3D网格、采样点云、多视图图像等。作者将OmniObject3D应用于多个3D视觉任务,包括交叉场景的新视角合成、神经表面重建和3D物体生......