KITTI数据集介绍
monodepth2采用KITTI数据集进行训练,KITTI数据集主要是针对自动驾驶领域的图形处理技术,主要应用在评测立体图像(stereo)、光流(optical flow)、3D物体检查等计算机视觉领域。KITTI数据集采用配备有两个灰度摄像头,两个彩色摄像头和一个Velodye 64激光雷达,4个光学镜头和一个GPS导航系统,具体的参数如下:
- 2 × PointGray Flea2 grayscale cameras (FL2-14S3M-C), 1.4 Megapixels, 1/2” Sony ICX267 CCD, global shutter
- 2 × PointGray Flea2 color cameras (FL2-14S3C-C), 1.4 Megapixels, 1/2” Sony ICX267 CCD, global shutter
- 4 × Edmund Optics lenses, 4mm, opening angle ∼ 90◦, vertical opening angle of region of interest (ROI) ∼ 35◦
- 1 × Velodyne HDL-64E rotating 3D laser scanner, 10 Hz, 64 beams, 0.09 degree angular resolution, 2 cm distance accuracy, collecting ∼ 1.3 million points/second, field of view: 360◦ horizontal, 26.8◦ vertical, range: 120 m
- 1 × OXTS RT3003 inertial and GPS navigation system, 6 axis, 100 Hz, L1/L2 RTK, resolution: 0.02m / 0.1◦
monodepth2 在readme中提供了下载命令,整个数据集大概150G,具体命令如下:
当然也可以自己去KITTI官网下载raw KITTI进行校准后的数据集,下载需要注册,并且下载速度很慢,推荐下载部分就好了。
数据集:
这里对各个文件内容进行介绍:
- image_00:灰度左摄像头图片
- image_01:灰度右摄像头图片
- image_03:彩色左摄像头图片
- image_04:彩色右摄像头图片
- velodyne_points: 都是bin文件,保存的是每个像素的实际坐标(x,y,z,r)。由于激光雷达x轴向前,所以x表示深度
- xots:导航设备获取数据集,具体内容查看dataformat.txt
- calib_cam_to_cam.txt:它分别描述了4个摄像头的内参以及0和1,2和3之间的外参。
- calib_imu_to_velo.txt:这个描述了导航坐标系到雷达坐标系的旋转和平移矩阵
- calib_velo_to_cam.txt:描述了雷达坐标系转换到摄像头坐标系。其实也只有R和T有用