视觉定位领域专栏（一）领域介绍、应用场景和研究难点

标签：难点场景定位领域专栏图像视觉数据 CV

前言上一篇介绍了什么是视觉定位，以及视觉定位在各行各业的应用点和目前的研究难点在哪。本篇主要介绍视觉定位领域常用的一些数据集，分为室内定位数据集和室外定位数据集，每个数据集附有数据集获取地址和数据集样例。

本教程禁止转载。同时，本教程来自知识星球【CV技术指南】更多技术教程，可加入星球学习。

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线!!

常用数据集

早期视觉定位数据集相对较少，随着研究的人越来越多，出现了很多公开的数据集，下面根据室外环境和室内环境介绍一些应用比较广泛的数据集。

室内数据集

7 Scenes数据集

由RGB-D图像、真实相机位姿和七个室内房间的3D模型组成（共约125平方米），这些图像包含无纹理表面、运动模糊和重复结构等。

数据集相关论文：

Carlevaris-Bianco N, Ushani A K, Eustice R M. University of michigan north campus long-term vision and lidar dataset [J]. The International Journal of Robotics Research, 2016, 35(9): 1023-1035.

Inloc数据集

InLoc数据集是为大规模室内定位而设计的，由于大的视点变化、移动的家具、遮挡、照明变换，待定位的查询图像和数据库图像之间存在显著的外观变化，数据集由RGB-D图像数据库组成，并添加了一组由手持设备拍摄的RGB查询图像，使其适用于室内定位任务。

数据集获取地址：

http://www.ok.sc.e.titech.ac.jp/INLOC/

Gangnam Station and Hyundai Department Store：

数据集是NAVER实验室定位数据集的一部分，由5个室内数据集组成，用于在具有挑战性的现实环境中进行视觉定位，数据集是在韩国首尔的一个大型购物中心和一个大型地铁站拍摄的，使用的是由10个摄像头和2个激光扫描仪组成的专用测绘平台，为了获得准确的地面真实相机姿态，使用激光雷达SLAM提供初始姿态，然后使用SFM优化初始姿态。数据集包含约130k张图像以及用于训练和验证的6DoF相机姿势。此外还为训练图像提供了基于稀疏激光雷达的深度图。

数据集获取地址：

https://github.com/naver/kapture/blob/main/doc/tutorial.adoc#download-a-dataset

LaMAR数据集：

这是一个专门针对AR/VR应用的数据集，数据集的采集是使用带有定制的原始传感器记录应用程序的Microsoft HoloLens 2和Apple iPad Pro设备收集数据，10名参与者每人获得一台设备，并被要求在一个共同的指定区域行走，即在环境中自由行走、参观、检查和四处寻找，由此产生了不同的相机高度和运动模式，他们的轨迹没有任何计划或限制，在长达一年的时间里，参与者在白天和晚上的不同时间点访问每个地点。总的来说，每个地点都有超过100个5分钟的视频序列，在录制之前不需要以任何方式准备拍摄现场，使得可以收集众包数据，每个位置也被NavVis M6手推车或VLX背包测绘平台捕获两到三次，这些平台使用激光扫描仪和全景相机生成环境密集纹理3D模型。

数据集获取地址：

https://lamar.ethz.ch/

室外数据集

Cambridge：

包含5个场景，此数据集常用于在大规模室外城市环境中训练和测试姿态回归算法

数据集获取地址：

http://mi.eng.cam.ac.uk/projects/relocalisation/

数据集样例：

Aachen Day-Night：

基于原始亚琛数据集，其描绘了德国亚琛的旧内城，数据库图像都是在大约两年的时间里用手持相机在白天拍摄的，提供了在白天和夜间拍摄的查询图像，所有查询图像均使用手机摄像头拍摄，即 Aachen Day-Night数据集考虑了使用移动设备进行定位的场景，例如增强现实或混合现实。夜间查询图像是使用手机HDR 拍摄的，以创建（相对）照明良好的高质量图像。

数据集下载地址：

https://data.ciirc.cvut.cz/public/projects/2020VisualLocalization/Aachen-Day-Night/

RobotCar Seasons

基于RobotCar数据集的子集，描绘了英国牛津室外场景，参考图像和查询图像由安装在汽车上的三个同步摄像头捕获，分别指向左后、后和右后。这些图像是通过在 12 个月内驾驶相同的路线记录下来的。一次遍历用于定义参考条件和参考场景表示。其他遍历涵盖不同的季节和光照条件用于查询。所有图像均按顺序记录。RobotCar Seasons 数据集代表了自动驾驶场景

数据集获取地址：

https://data.ciirc.cvut.cz/public/projects/2020VisualLocalization/RobotCar-Seasons/

CMU Seasons：

描绘了美国匹兹堡地区的城市、郊区和公园场景。参考和查询图像由安装在汽车上的两个前置摄像头捕获，以大约 45 度角指向车辆的左、右。这些图像是在 1 年的时间里记录的。其中一次遍历用于定义参考条件和参考场景表示，其他遍历捕获不同的季节性条件用于查询。所有图像均按顺序记录。CMU Seasons 数据集代表自动驾驶场景

数据集获取地址：