首页 > 编程语言 >手把手教你利用算法工具链训练、量化、编译、可视化征程 6 参考算法 BEVFormer

手把手教你利用算法工具链训练、量化、编译、可视化征程 6 参考算法 BEVFormer

时间:2024-08-17 22:49:34浏览次数:11  
标签:mini -- 手把手 py nuscenes v1.0 算法 BEVFormer data

写在前面:

关于OE包内参考算法的使用,地平线已经释放了大量文档指导用户完成各类模型的训练、校准、量化、定点过程,但其中有些细节可能会对不是特别熟悉算法工具链的客户造成困扰,本文档致力于消除参考算法使用过程中所有可能存在的模糊操作,引导初学者快速上手参考算法,在实操中树立信心、激发学习兴趣。

1 环境部署

1.1 开发机准备
为了顺利地使用工具链,地平线建议您选择的开发机应满足以下要求:

硬件/操作系统要求CPUCPU I3以上或者同级别E3/E5的处理器内存16G或以上级别GPUCUDA11.8、驱动版本Linux:>= 510.39.01*

(推荐驱动版本Linux:520.61.05)

适配显卡包括但不限于:

  1. GeForce RTX 3090

  2. GeForce RTX 2080 Ti

  3. NVIDIA TITAN V

  4. Tesla V100S-PCIE-32GB

  5. A100系统原生Ubuntu 22.04

1.2 Docker容器部署
地平线要求的Docker基础环境如下,请提前在您的宿主机上完成安装:

Docker(20.10.10或更高版本,建议安装20.10.10版本),详见 Docker安装手册
NVIDIA Container Toolkit(1.13.5或更高版本,建议安装1.15.0),详见 NVIDIA Container Toolkit安装手册
完成Docker基础环境安装后,还需要将无root权限的用户添加到Docker用户组中。参考命令如下:

sudo groupadd docker
sudo gpasswd -a ${USER} docker
sudo service docker restart

拉取docker镜像,并下载OE开发包,将OE开发包和Nuscenes数据集挂载到docker容器中。参考命令如下:

# GPU Docker
docker pull openexplorer/ai_toolchain_ubuntu_20_j6_gpu:{version}
# 手动启动 GPU Docker 镜像
docker run -it --rm
  --network host \ # 调整网络模式为host
  --gpus all \ # 在启动容器时,添加标记以启用GPU资源的访问
  --shm-size=15g \ # 修改共享内存大小,切记修改不然默认64MB
  -v {OE 包路径}:/open_explorer \ # 挂载 OE 包
  -v {数据集路径}:/data/horizon_j6/data \ # 挂载数据集
  openexplorer/ai_toolchain_ubuntu_20_j6_gpu:{version}

注意,“--gpus”参数一定要设置为all,代表着在容器内能使用开发机所有的GPU,“--shm-size”一定要修改,不然默认共享内存仅为64MB。

2 数据集准备

2.1 数据集下载
进入nuscenes官网,根据提示完成账户的注册,下载Full dataset(v1.0)、CAN bus expansion和Map expansion(v1.3)、nuScenes-lidarseg这四个项目下的文件。下载后的压缩文件为:

|-- nuScenes-map-expansion-v1.3.zip
|-- nuScenes-lidarseg-all-v1.0.tar.bz2
|-- can_bus.zip
|-- v1.0-mini.tar
|-- v1.0-trainval01_blobs.tar
|-- ...
|-- v1.0-trainval10_blobs.tar
`-- v1.0-trainval_meta.tar

Full dataset(v1.0)包含多个子数据集,如果不需要进行v1.0-trainval数据集的浮点训练和精度验证,可以只下载v1.0-mini数据集进行小场景的训练和验证。

2.2 Full dataset版本数据集打包和meta文件夹构建
2.2.1 数据集打包
将下载完成的v1.0-trainval01_blobs.tar~v1.0-trainval10_blobs.tar、nuScenes-lidarseg-all-v1.0.tar.bz2、v1.0-trainval_meta.tar、nuScenes-map-expansion-v1.3.zip和can_bus.zip进行解压,解压后的目录如下所示:

|--nuscenes
    |-- can_bus #can_bus.zip解压后的目录
    |-- lidarseg #nuScenes-lidarseg-all-v1.0.tar.bz2解压后的目录
    |-- maps #nuScenes-map-expansion-v1.3.zip解压后的数据
    |-- samples #v1.0-trainvalXX_blobs.tar解压后的目录
    |   |-- CAM_BACK
    |   |-- ...
    |   |-- CAM_FRONT_RIGHT
    |   |--  ...
    |   `-- RADAR_FRONT_RIGHT
    |-- sweeps
    |   |-- CAM_BACK
    |   |-- ...
    |   |-- CAM_FRONT_RIGHT
    |   |--  ...
    |   `-- RADAR_FRONT_RIGHT
    |-- v1.0-trainval #v1.0-trainval_meta.tar解压后的数据
        |-- attribute.json
        |    ...
        `-- visibility.json

进入 horizon_model_train_sample/scripts 目录,使用以下命令将训练数据集和验证数据集打包,格式为lmdb。如果将上述nuscenes文件夹放到上述目录内,下面WORKSPACE可替换为pwd

#pack train_Set
python3 tools/datasets/nuscenes_packer.py --src-data-dir /WORKSPACE/nuscenes/ --pack-type lmdb --target-data-dir /WORKSPACE/tmp_data/nuscenes/v1.0-trainval --version v1.0-trainval --split-name train
#pack val_Set
python3 tools/datasets/nuscenes_packer.py --src-data-dir /WORKSPACE/nuscenes/ --pack-type lmdb --target-data-dir /WORKSPACE/tmp_data/nuscenes/v1.0-trainval --version v1.0-trainval --split-name val

打包结束生成目录如下所示。

|--scripts
    |-- tmp_data
        |-- nuscenes  
            |-- v1.0-trainval 
                |-- train_lmdb
                |   |--data.mdb
                |   |--lock.mdb    
                `-- train_lmdb
                    |--data.mdb
                    `--lock.mdb    

--src-data-dir为解压后的nuscenes数据集目录;
--target-data-dir为打包后数据集的存储目录;
--version 选项为["v1.0-trainval", "v1.0-test", "v1.0-mini"],如果进行全量训练和验证设置为v1.0-trainval,如果仅想了解模型的训练和验证过程,则可以使用v1.0-mini数据集;v1.0-test数据集仅为测试场景,未提供注释。
全量的nuscenes数据集较大,打包时间巨长,如果仅仅作为学习使用mini版就好。

2.2.2 meta文件夹构建
在tmp_data/nuscenes 下创建meta文件夹,如果使用--version = "v1.0-mini",将解压后的v1.0-mini文件夹拷贝到tmp_data/nuscenes/meta 文件夹内,如果使用--version = "v1.0-trainval",将解压后的v1.0-trainval文件夹拷贝到tmp_data/nuscenes/meta 文件夹内;
将解压后的maps文件夹拷贝到tmp_data/nuscenes/meta 文件夹内;
将解压后的lidarseg文件夹拷贝到tmp_data/nuscenes/meta 文件夹内。
如果使用--version = "v1.0-trainval",此时tmp_data的目录结构为:

|-- tmp_data 
|   |-- nuscenes 
|   |   |-- meta
|   |   |   |-- maps        
|   |   |   |   |-- 36092f0b03a857c6a3403e25b4b7aab3.png
|   |   |   |   |-- ...
|   |   |   |   |-- 93406b464a165eaba6d9de76ca09f5da.png
|   |   |   |   |-- prediction
|   |   |   |   |-- basemap
|   |   |   |   |-- expansion
|   |   |   |-- lidarseg     
|   |   |   |   |-- v1.0-mini
|   |   |   |   |-- v1.0-test
|   |   |   |   |-- v1.0-trainval
|   |   |   |-- v1.0-trainval  
|   |   |       |-- attribute.json
|   |   |           ...
|   |   |       |-- visibility.json
|   |   `-- v1.0-trainval 
|   |   |   |-- train_lmdb  
|   |   |   `-- val_lmdb   

2.3 Mini dataset版本数据集打包和meta文件夹构建
如果需要使用mini数据集,在BEVFormer对应的config文件"bevformer_tiny_resnet50_detection_nuscenes"中,需要更改以下配置:

float_trainer/predictor、calibration_trainer/predictor、qat_trainer/predictor、int_infer_predictor/int_infer_trainer的version:数据集的版本,选项为["v1.0-trainval", "v1.0-test", "v1.0-mini"],选择"v1.0-mini"。

2.3.1 数据集打包
如果下载的是Full dataset(v1.0)中的Mini、CAN bus expansion和Map expansion(v1.3)、nuScenes-lidarseg这四个项目下的文件,将下载完成的v1.0-mini.tgz、nuScenes-lidarseg-all-v1.0.tar.bz2、nuScenes-map-expansion-v1.3.zip和can_bus.zip进行解压,解压后的目录如下所示:

|--nuscenes
    |-- can_bus #can_bus.zip解压后的目录
    |-- lidarseg #nuScenes-lidarseg-all-v1.0.tar.bz2解压后的目录
    |-- maps #nuScenes-map-expansion-v1.3.zip解压后的数据
    |-- samples #v1.0-mini.tar解压后的目录
    |   |-- CAM_BACK
    |   |-- ...
    |   |-- CAM_FRONT_RIGHT
    |   |--  ...
    |   `-- RADAR_FRONT_RIGHT
    |-- sweeps #v1.0-mini.tar解压后的目录
    |   |-- CAM_BACK
    |   |-- ...
    |   |-- CAM_FRONT_RIGHT
    |   |--  ...
    |   `-- RADAR_FRONT_RIGHT
    |-- v1.0-mini #v1.0-mini.tar解压后的目录
        |-- attribute.json
        |
        `-- visibility.json

进入 horizon_model_train_sample/scripts 目录,使用以下命令将训练数据集和验证数据集打包,格式为lmdb。如果将上述nuscenes文件夹放到上述目录内,下面WORKSPACE可替换为pwd

#pack train_Set
python3 tools/datasets/nuscenes_packer.py --src-data-dir /WORKSPACE/nuscenes/ --pack-type lmdb --target-data-dir /WORKSPACE/tmp_data/nuscenes/v1.0-trainval --version v1.0-mini --split-name train
#pack val_Set
python3 tools/datasets/nuscenes_packer.py --src-data-dir /WORKSPACE/nuscenes/ --pack-type lmdb --target-data-dir /WORKSPACE/tmp_data/nuscenes/v1.0-trainval --version v1.0-mini --split-name val

打包结束生成目录如下所示。

|--scripts
    |-- tmp_data
        |-- nuscenes  
            |-- v1.0-trainval 
                |-- train_lmdb
                |   |--data.mdb
                |   |--lock.mdb    
                `-- train_lmdb
                    |--data.mdb
                    `--lock.mdb    

--src-data-dir为解压后的nuscenes数据集目录;
--target-data-dir为打包后数据集的存储目录;
--version 选项为["v1.0-trainval", "v1.0-test", "v1.0-mini"],如果进行全量训练和验证设置为v1.0-trainval,如果仅想了解模型的训练和验证过程,则可以使用v1.0-mini数据集;v1.0-test数据集仅为测试场景,未提供注释。
全量的nuscenes数据集较大,打包时间巨长,如果仅仅作为学习使用mini版就好。

2.3.2 meta文件夹构建
在tmp_data/nuscenes 下创建meta文件夹,如果使用--version = "v1.0-mini",将解压后的v1.0-mini文件夹拷贝到tmp_data/nuscenes/meta 文件夹内,如果使用--version = "v1.0-trainval",将解压后的v1.0-trainval文件夹拷贝到tmp_data/nuscenes/meta 文件夹内;
将解压后的maps文件夹拷贝到tmp_data/nuscenes/meta 文件夹内;
将解压后的lidarseg文件夹拷贝到tmp_data/nuscenes/meta 文件夹内。
如果使用--version = "v1.0-mini",此时tmp_data的目录结构为:

|-- tmp_data 
|   |-- nuscenes 
|   |   |-- meta
|   |   |   |-- maps        
|   |   |   |   |-- 36092f0b03a857c6a3403e25b4b7aab3.png
|   |   |   |   |-- ...
|   |   |   |   |-- 93406b464a165eaba6d9de76ca09f5da.png
|   |   |   |   |-- prediction
|   |   |   |   |-- basemap
|   |   |   |   |-- expansion
|   |   |   |-- lidarseg     
|   |   |   |   |-- v1.0-mini
|   |   |   |   |-- v1.0-test
|   |   |   |   |-- v1.0-trainval
|   |   |   |-- v1.0-mini  
|   |   |       |-- attribute.json
|   |   |           ...
|   |   |       |-- visibility.json
|   |   `-- v1.0-trainval 
|   |   |   |-- train_lmdb  ls
cd 
|   |   |   `-- val_lmdb   ls

3 权重文件准备

如果不想重复BEVFormer模型的训练、校准、量化、定点过程,可从scripts/configs/bev/README.md内下载BEVFormer的权重文件,用于浮点模型精度验证、Calibration模型精度验证、量化模型精度验证、定点模型精度验证、仿真上板精度验证,或可视化定点模型对于单帧的检测效果,权重文件的下载命令参考:

wget -c ftp://[email protected]/horizon_torch_samples/3.0.15/py310/modelzoo/qat_origin_modelzoo/bevformer_tiny_resnet50_detection_nuscenes/* --ftp-password='c5R,2!pG'
将权重文件拷贝到scripts/tmp_models/文件夹内,此时tmp_models的目录结构为:

|-- tmp_data 
|   |-- float-checkpoint-best.pth.tar
|   |-- calibration-checkpoint-best.pth.tar
|   |-- qat-checkpoint-best.pth.tar
|   |-- qat.bc
|   |-- quantized.bc

如果想完整复现BEVFormer模型的训练、校准、量化、定点过程,可在数据集和Config文件配置完成后,按照第4、5、6部分的指导进行。

4 Config文件配置

config内容较多,对于用户来说,需要关注的主要有以下参数:

device_ids:配置为本机支持的GPU,根据开发环境进行配置;
ckpt_dir:权重路径配置;
data_rootdir:打包数据集路径配置;
meta_rootdir:meta文件所在的路径;
float_trainer/predictor、calibration_trainer/predictor、qat_trainer/predictor、int_infer_trainer/int_infer_predictor的checkpoint_path:权重路径配置;
float_trainer/predictor、calibration_trainer/predictor、qat_trainer/predictor、int_infer_predictor/int_infer_trainer的version:数据集的版本,选项为["v1.0-trainval", "v1.0-test", "v1.0-mini"]。

上述checkpoint_path和version需要根据数据集的版本和使用需求修改。

5 浮点模型训练和精度验证

5.1 浮点模型训练
config文件中的参数配置完成后,使用以下命令训练浮点模型(如果训练浮点模型,需要使用完整数据集而非mini):

python3 tools/train.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage float

float训练后模型ckpt的保存路径为config配置的ckpt_callback中save_dir的值,默认为ckpt_dir。

5.2 浮点模型精度验证
浮点模型训练完成以后,可以使用以下命令验证已经训练好的浮点模型精度:

python3 tools/predict.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage float
验证完成后,会在终端打印浮点模型在验证集上检测精度,如下所示:

Per-class results:
Object Class    AP      ATE     ASE     AOE     AVE     AAE
car     0.517   0.665   0.169   0.230   0.144   0.091
truck   0.366   0.542   0.215   0.260   0.075   0.000
bus     0.325   0.795   0.176   0.229   1.488   0.017
trailer 0.000   1.000   1.000   1.000   1.000   1.000
construction_vehicle    0.000   1.000   1.000   1.000   1.000   1.000
pedestrian      0.432   0.818   0.278   0.889   0.615   0.286
motorcycle      0.360   0.887   0.313   1.799   0.078   0.002
bicycle 0.071   0.815   0.248   0.523   0.922   0.024
traffic_cone    0.400   0.631   0.389   nan     nan     nan
barrier 0.000   1.000   1.000   1.000   nan     nan
2024-07-18 08:09:25,945 INFO [nuscenes_metric.py:378] Node[0] NDS: 0.3204, mAP:0.2472
...
2023-06-06 18:24:10,513 INFO [mean_iou.py:170] Node[0] ~~~~ MeanIOU Summary metrics ~~~~
car_AP: [0.5]:0.1182  [1.0]:0.3794  [2.0]:0.6097  [4.0]:0.7232
...
2023-12-19 17:47:03,046 INFO [metric_updater.py:360] Node[0] Epoch[0] Validation bev_cft_efficientnetb3_nuscenes: NDS[0.3280] 
2023-12-19 17:47:03,058 INFO [logger.py:176] Node[0] ==================================================END PREDICT==================================================
2023-12-19 17:47:03,058 INFO [logger.py:176] Node[0] =============================
=====================END FLOAT PREDICT=============================================

Loaded ground truth annotations for 81 samples.
Filtering predictions
=> Original number of boxes: 24300
=> After distance based filtering: 20631
=> After LIDAR and RADAR points based filtering: 20631
=> After bike rack filtering: 20584
Filtering ground truth annotations
=> Original number of boxes: 4441
=> After distance based filtering: 3785
=> After LIDAR and RADAR points based filtering: 3393
=> After bike rack filtering: 3393
Accumulating metric data...
Calculating metrics...
Saving metrics to: ./WORKSPACE/resultsbevformer_tiny_resnet50_detection_nuscenes
mAP: 0.2472
mATE: 0.8153
mASE: 0.4789
mAOE: 0.7699
mAVE: 0.6651
mAAE: 0.3024
NDS: 0.3204
Eval time: 5.5s

6 模型量化和编译
完成浮点训练后,还需要进行量化训练和编译,才能将定点模型部署到板端。地平线对该模型的量化采用horizon_plugin框架,经过Calibration+QAT量化训练后,使用compile的工具将量化模型编译成可以上板运行的hbm文件。

6.1 Calibration
模型完成浮点训练后,便可进行 Calibration。calibration在forward过程中通过统计各处的数据分布情况,从而计算出合理的量化参数。 通过运行下面的脚本就可以开启模型的Calibration过程:

python3 tools/train.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage calibration

6.2 Calibration 模型精度验证
Calibration完成以后,可以使用以下命令验证经过calib后模型的精度:

python3 tools/predict.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage calibration
验证完成后,会在终端输出calib模型在验证集上检测精度。

6.3 量化模型训练
Calibration完成后,就可以加载calib权重开启模型的量化训练。 量化训练其实是在浮点训练基础上的finetue,具体配置信息在config的qat_trainer中定义。量化训练的时候,初始学习率设置为浮点训练的十分之一,训练的epoch次数也大大减少。和浮点训练的方式一样,将checkpoint_path指定为训好的calibration权重路径。

通过运行下面的脚本就可以开启模型的qat训练:

python3 tools/train.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage qat

6.4 量化模型精度验证
Calibration完成以后,可以使用以下命令验证经过calib后模型的精度:

#qat模型精度验证
python3 tools/predict.py --stage qat --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py

验证完成后,会在终端输出calib模型在验证集上检测精度,格式见2.3。

6.5 导出定点模型
完成量化训练后,便可以开始导出定点模型。可以通过下面命令来导出:

python3 tools/export_hbir.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py

6.6 定点模型精度验证
指定calibration-checkpoint后,通过运行以下命令进行量化模型的精度验证:

python3 tools/predict.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --stage int_infer

qat模型的精度验证对象为插入伪量化节点后的模型(float32);quantize模型的精度验证对象为定点模型(int8),验证的精度是最终的int8模型的真正精度,这两个精度应该是十分接近的。

6.7 量化模型编译
在量化训练完成之后,可以使用compile_perf.py脚本将量化模型编译成可以板端运行的hbm模型,同时该工具也能预估在BPU上的运行性能,compile_perf脚本使用方式如下:

python3 tools/compile_perf_hbir.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --out-dir ./ --opt 3

opt为优化等级,取值范围为0~3,数字越大优化等级越高,编译时间更长,但部署性能更好。
compile_perf脚本将生成.html文件和.hbm文件(compile文件目录下),.html文件为BPU上的运行性能,.hbm文件为上板实测文件。
运行后,ckpt_dir的compile目录下会产出以下文件:

|-- compile
|   |-- .html #模型在bpu上的静态性能数据
|   |-- .json 
|   |-- model.hbm  #板端部署的模型
|   |-- model.hbir #编译过程的中间文件
    `-- model.pt   #模型的pt文件

7 模型推理效果可视化

如果你希望可以看到训练出来的模型对于单帧的检测效果,我们的tools文件夹下面同样提供了预测及可视化的脚本,你只需要运行以下脚本即可,可视化结果将会在save-path路径下输出。

python3 tools/infer_hbir.py --config configs/bev/bevformer_tiny_resnet50_detection_nuscenes.py --save-path ./
但在此之前你需要在/script中组织你的tmp_orig_data文件夹,文件夹目录为:

scripts/bev_infer_sample/
└── multi_frames
    ├── homo
    │   ├── cam_intrinsic.npy
    │   ├── ego2global.npy
    │   ├── ego2img.npy
    │   ├── rotation.npy
    │   └── translation.npy
    └── imgs
        ├── n008-2018-08-01-15-16-36-0400__CAM_BACK_LEFT__1533151603547405.jpg
        ├── n008-2018-08-01-15-16-36-0400__CAM_BACK_RIGHT__1533151603528113.jpg
        ├── n008-2018-08-01-15-16-36-0400__CAM_BACK__1533151603537558.jpg
        ├── n008-2018-08-01-15-16-36-0400__CAM_FRONT_LEFT__1533151603504799.jpg
        ├── n008-2018-08-01-15-16-36-0400__CAM_FRONT_RIGHT__1533151603520482.jpg
        └── n008-2018-08-01-15-16-36-0400__CAM_FRONT__1533151603512404.jpg

imgs为同一时刻下6个相机输出的图片;

其中homo文件夹内的ego2global.npy、ego2img.npy分别是上述图像对应的自车坐标系到世界坐标系、自车坐标系到像素坐标系的homo矩阵,尺寸分别为(4,4)和(6,4,4)。

上述信息可通过一下脚本生成:

# tools/gen_infer_data.py
# Usage: python3 tools/gen_infer_data.py
import os
import shutil
from nuscenes.nuscenes import NuScenes 
import numpy as np
from pyquaternion import Quaternion
from PIL import Image

# 注意 >>>>> :执行前先配置mini_data的位置
mini_data = "/data_set0/v1.0-mini"

def get_folder_from_filename(filename):
    if 'FRONT_LEFT' in filename:
        return 'CAM_FRONT_LEFT'
    elif 'FRONT_RIGHT' in filename:
        return 'CAM_FRONT_RIGHT'
    elif 'FRONT' in filename:
        return 'CAM_FRONT'
    elif 'BACK_LEFT' in filename:
        return 'CAM_BACK_LEFT'
    elif 'BACK_RIGHT' in filename:
        return 'CAM_BACK_RIGHT'
    elif 'BACK' in filename:
        return 'CAM_BACK'
    else:
        raise ValueError(f"Unknown camera type in filename: {filename}")

def get_homography_by_cam(sensor2ego_translation, sensor2ego_rotation, camera_intrinsic):
    #将旋转矩阵转为四元数
    rotation = Quaternion(sensor2ego_rotation).rotation_matrix
    ego2sensor_r = np.linalg.inv(rotation)
    ego2sensor_t = sensor2ego_translation @ ego2sensor_r.T
    ego2sensor = np.eye(4)
    ego2sensor[:3, :3] = ego2sensor_r.T
    ego2sensor[3, :3] = -np.array(ego2sensor_t)
    camera_intrinsic = np.array(camera_intrinsic)
    viewpad = np.eye(4)
    viewpad[
            : camera_intrinsic.shape[0], : camera_intrinsic.shape[1]
        ] = camera_intrinsic
    ego2img = viewpad @ ego2sensor.T
    return ego2img

def save_image(nusc, image_filename, output_folder):
    # 获取图像的绝对路径
    image_path = os.path.join(nusc.dataroot+'/samples',image_filename)
    # 打开并保存图像
    image = Image.open(image_path)
    image.save(os.path.join(output_folder, os.path.basename(image_filename)))

def find_ego2global_from_image(nusc, image_filename):
    # 遍历所有sample_data,找到对应的条目
    for sample_data in nusc.sample_data:
        if image_filename in sample_data["filename"]:
            # 获取对应的ego_pose_token
            ego_pose_token = sample_data['ego_pose_token']
            # 获取ego_pose条目
            ego_pose = nusc.get('ego_pose', ego_pose_token)
            # 提取translation和rotation
            translation = np.array(ego_pose['translation'])
            rotation = np.array(ego_pose['rotation'])
            # 生成ego2global矩阵
            ego2global = get_ego2global_matrix(translation, rotation)
            return ego2global
    return None

def get_ego2global_matrix(translation, rotation):
    """
    从translation和rotation生成ego2global矩阵。
    """
    ego2global = np.eye(4)
    # 设置旋转矩阵
    ego2global[:3, :3] = Quaternion(rotation).rotation_matrix
    # 设置平移矩阵
    ego2global[:3, 3] = translation
    return ego2global

if __name__ == "__main__":
    # 环境初始化
    output_folder = "./bev_infer_sample/multi_frames"
    if os.path.isdir(output_folder):
        shutil.rmtree(output_folder)
    image_output = f"{output_folder}/imgs"
    os.makedirs(image_output, exist_ok=True)
    homo_output = f"{output_folder}/homo"
    os.makedirs(homo_output, exist_ok=True)

    #初始化,这里以v1.0-mini数据集为例
    nusc = NuScenes(version='v1.0-mini', dataroot=mini_data, verbose=True)
    #6张图像的文件名
    #要注意这里的输入顺序必须遵循:
    #FRONT_LEFT,FRONT,FRONT_RIGHT,BACK_LEFT,BACK,BACK_RIGHT
    image_list=[
    'n008-2018-08-01-15-16-36-0400__CAM_FRONT_LEFT__1533151603504799.jpg',
    'n008-2018-08-01-15-16-36-0400__CAM_FRONT__1533151603512404.jpg',
    'n008-2018-08-01-15-16-36-0400__CAM_FRONT_RIGHT__1533151603520482.jpg',
    'n008-2018-08-01-15-16-36-0400__CAM_BACK_LEFT__1533151603547405.jpg',
    'n008-2018-08-01-15-16-36-0400__CAM_BACK__1533151603537558.jpg',
    'n008-2018-08-01-15-16-36-0400__CAM_BACK_RIGHT__1533151603528113.jpg'
    ]
    # 获取数据集中所有的sample
    # 包含'token','calibrated_sensor_token','filename','channel'等信息
    sample_data=nusc.sample_data 
    ego_poses = nusc.ego_pose
    # 获取传感器定义:
    # 包含'token','sensor_toker','translation','rotation','camera_intrinsic'等信息
    cali_sensor=nusc.calibrated_sensor
    translation=[]
    rotation=[]
    cam_intrinsic=[]
    ego2imgs=[]
    for i,img in enumerate(image_list):
        print(img) 
        for sample in sample_data:
            if img in sample["filename"]:
                folder = get_folder_from_filename(img)
                save_image(nusc, os.path.join(folder, img), image_output)
                #1. 选择输入图片的name来获取捕获该图片的"calibrated_sensor_token"
                calibrated_sensor_token=(sample["calibrated_sensor_token"])
                print("calibrated_sensor_token:",calibrated_sensor_token)
                #2.根据"calibrated_sensor_token"获取传感器的"translation"、
                # "rotation"、和"camera_intrinsic"等参数
                for sensor in cali_sensor:
                    if sensor["token"]==calibrated_sensor_token: 
                        #获取translation矩阵
                        sensor2ego_translation=np.array(sensor["translation"])
                        # print("sensor2ego_translation:",sensor2ego_translation)
                        translation.append(sensor2ego_translation)
                        #获取rotation矩阵
                        sensor2ego_rotation=np.array(sensor["rotation"])
                        # print("sensor2ego_rotation:",sensor2ego_rotation)
                        rotation.append(sensor2ego_rotation)
                        #获取相机内参矩阵
                        camera_intrinsic=np.array(sensor["camera_intrinsic"])
                        # print("camera_intrinsic:",camera_intrinsic)
                        cam_intrinsic.append(camera_intrinsic)
                        #计算homography矩阵
                        ego2img=get_homography_by_cam(
                        sensor2ego_translation,
                        sensor2ego_rotation, 
                        camera_intrinsic
                        )
                        ego2imgs.append(ego2img)
    
    #导出translation矩阵,旋转矩阵、相机内参矩阵、homo矩阵
    translation=np.array(translation)
    np.save(f"{homo_output}/translation",translation)
    rotation=np.array(rotation)
    np.save(f"{homo_output}/rotation",rotation)
    cam_intrinsic=np.array(cam_intrinsic)
    np.save(f"{homo_output}/cam_intrinsic",cam_intrinsic)
    ego2imgs=np.array(ego2imgs)
    print('ego2imgs',ego2imgs.shape)
    np.save(f"{homo_output}/ego2img",ego2imgs)
    ego2global = find_ego2global_from_image(nusc, image_list[0])
    print('ego2global',ego2global.shape)
    np.save(f"{homo_output}/ego2global",ego2global)

可视化示例如下:

标签:mini,--,手把手,py,nuscenes,v1.0,算法,BEVFormer,data
From: https://www.cnblogs.com/horizondeveloper/p/18365123

相关文章

  • C++做算法题,容器知识看这一篇就够啦!
    C++常用容器分享(算法题,掌握这些就够了)vector是什么连续的顺序存储结构,其实就是一个可变数组想使用的话记得#include<vector>怎么用初始化语法vector<类型>名字(长度,初始值)演示一下//一维的vectorvector<int>arr;//不指定里面有多少个元素vector<int>a......
  • 使用贝叶斯优化CDENCLUE聚类算法参数
    目录1.贝叶斯优化的基本原理原理和实现步骤:2.轮廓系数的原理公式:3.贝叶斯优化的实现流程(伪代码)1.贝叶斯优化的基本原理贝叶斯优化是一种基于概率模型的优化方法,主要用于优化计算代价高昂的黑盒函数。它结合了先验知识和观察到的数据来更新后验知识,并用一个易......
  • 二分查找不理解?一篇弄懂!--基础二分查找算法详细解释(带简单例题的详细解法)
    本文参考:灵茶山艾府分享丨【题单】二分算法(二分答案/最小化最大值/最大化最小值/第K小)-力扣(LeetCode)二分查找红蓝染色法_哔哩哔哩_bilibili本文主要详细讲解基础的二分算法中的查找,包括原理和模板,并用leetcode和洛谷的一些例题来进行实际题目讲解,如果觉得有帮助或者写......
  • 以node / link文件表征的道路网络-----dijkstra算法yyds-----基于南京公路公开数据做
    前文已经基于公开数据,获得了南京的全域高速公路的路网数据,这些以node/link文件表征的道路网络不仅延续了osm地图中所包含的经纬度、名称、容量等信息,还包含了一个重要的道路等级字段“link_type_name”。交通部门一般以高速公路、国省干道、城市道路、乡道农路作为区分......
  • 二分查找(算法详解+模板+例题)
    一.二分的定义二分法(Bisectionmethod)即一分为二的方法.设[a,b]为R的闭区间.逐次二分法就是造出如下的区间序列([an,bn]):a0=a,b0=b,且对任一自然数n,[an+1,bn+1]或者等于[an,cn],或者等于[cn,bn],其中cn表示[an,bn]的中点。二.基本思路1.将数组排序。2.一直将数组除以二,直到找到那......
  • 数据结构与算法——BFS(广度优先搜索)
    算法介绍:广度优先搜索(Breadth-FirstSearch,简称BFS)是一种遍历或搜索树和图的算法,也称为宽度优先搜索,BFS算法从图的某个节点开始,依次对其所有相邻节点进行探索和遍历,然后再对这些相邻节点的相邻节点进行探索,直到遍历完所有的节点。BFS算法使用队列来辅助实现,将起始节点放入队列......
  • 算法学习笔记之树链剖分
    算法学习笔记之(熟练跑分)树链剖分PART1首先是第一部份,也就是熟练跑分最最最基础的用法——求\(LCA\)首先是树链剖分//图片出自董晓算法大概就是这样本质就是根据子树大小将一颗树剖分成若干条链然后更加方便地处理/加速处理信息所以直接上代码?不,还要证明树链剖......
  • 力扣面试经典算法150题:删除有序数组中的重复项 II
    删除有序数组中的重复项II今天的题目是力扣面试经典150题中的数组的中等难度题:删除有序数组中的重复项II题目链接:https://leetcode.cn/problems/remove-duplicates-from-sorted-array-ii/description/?envType=study-plan-v2&envId=top-interview-150题目描述给定一......
  • 力扣面试经典算法150题:最后一个单词的长度
    最后一个单词的长度今天的题目是力扣面试经典150题中的数组的简单题:最后一个单词的长度题目链接:https://leetcode.cn/problems/length-of-last-word/description/?envType=study-plan-v2&envId=top-interview-150题目描述给定一个仅包含大小写字母和空格’’的字符......
  • 模拟退火算法
    模拟退火算法1.模拟退火算法概述1.1算法起源与发展模拟退火算法(SimulatedAnnealing,SA)最早由N.Metropolis等人于1953年提出。该算法的思想来源于固体物理中的退火过程,1983年,S.Kirkpatrick等人将其引入到组合优化问题中。模拟退火算法是一种基于概率的启发式搜索算法,......