该课程详细讲解如何使用TensorRT来优化Tensorflow训练的深度学习模型。我们选择了LeNet模型和YOLOv3模型作为例子,与原始模型相比,优化后的模型速度分别提高了3.7倍和1.5倍。有关详细信息以及如何运行代码,请参阅具体课程视频。
文末附课程全套视频下载地址。
课程目录
1、将Tensorflow模型优化为TensorRT
2、在TensorRT优化之前和之后可视化
3、优化Keras模型到TensorRT
4、使用您自己的数据集训练Keras模型
5、恢复并使用存储的Keras模型执行推理
6、使用TensorRT优化YOLOv3
7、另一个YOLOv3检测结果(原生Tensorflow与TensorRT优化)
代码及实验数据下载地址:
https://github.com/ardianumam/Tensorflow-TensorRT
课程使用运行库及版本:
1、Tensorflow 1.12 (Dekstop) and Tensorflow 1.11 (Jetson TX2)
2、OpenCV 3.4.5
3、Pillow 5.2.0
4、Numpy 1.15.2
5、Matplotlib 3.0.0
课程中使用的运行环境:
Dekstop PC
1、OS: Ubuntu 16.04 - 64bit
2、GPU: GeForce 1060 6Gb
3、Driver version: 384.130
4、RAM: 16Gb
5、CUDA: 9.0
6、CuDNN: 7
7、TensorRT: 4.1.2
8、Python: 64-bit, version 3.5
Jetson TX2
1、OS: Ubuntu 16.04 - 64bit
2、GPU (with RAM shared): 8Gb
3、Driver version: Given along flashing with Jetpack 3.3
4、CUDA: 9.0
5、CuDNN: 7
6、TensorRT: 4.1.3
7、Python: 64-bit, version 3.5