在Ubuntu上用Docker轻松实现GPU加速的TensorFlow

时间：2024-07-03 20:57:06浏览次数：22

标签：容器 nvidia Ubuntu 上用 GPU NVIDIA TensorFlow Docker

前言

在深度学习和机器学习的世界中，GPU的使用可以显著加速模型训练和推理的速度。NVIDIA Container Toolkit允许我们在Docker容器中使用NVIDIA GPU，从而简化了在GPU上运行TensorFlow等深度学习框架的过程。本文将详细介绍如何在Ubuntu上配置NVIDIA Container Toolkit并运行GPU加速的TensorFlow容器。

为什么选择Docker？

Docker 是在 Linux 上启用 TensorFlow GPU 支持的最简单方法之一，因为只需在主机上安装 NVIDIA® GPU 驱动程序，而不必安装 NVIDIA® CUDA® 工具包。使用Docker，可以轻松地在隔离环境中运行TensorFlow，并且管理和分发依赖关系变得更加方便。

配置步骤

1. 配置生产存储库

首先，我们需要配置NVIDIA Container Toolkit的生产存储库。打开终端并执行以下命令：

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

该命令将NVIDIA的GPG密钥添加到系统，并配置APT源以包含NVIDIA的容器工具包存储库。

2. 更新包列表

接下来，更新包列表以确保我们获取到最新的包信息：

sudo apt-get update

3. 安装NVIDIA Container Toolkit软件包

现在可以安装NVIDIA Container Toolkit：

sudo apt-get install -y nvidia-container-toolkit

4. 配置Docker以使用NVIDIA Container Toolkit

使用以下命令配置Docker容器运行时：

sudo nvidia-ctk runtime configure --runtime=docker

该命令会修改主机上的/etc/docker/daemon.json文件，使Docker可以使用NVIDIA容器运行时。

5. 重新启动Docker守护进程

要使更改生效，重新启动Docker守护进程：

sudo systemctl restart docker

6. 运行GPU加速的TensorFlow容器

现在，我们可以运行一个使用GPU加速的TensorFlow容器。执行以下命令：

sudo docker run --gpus all --restart=always -d -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter

该命令将拉取最新的TensorFlow GPU Jupyter镜像，并在后台运行一个Jupyter Notebook服务器，端口为8888。--gpus all选项确保Docker容器能够访问所有可用的GPU。

总结

通过上述步骤，我们成功地在Ubuntu上配置了NVIDIA Container Toolkit，并运行了一个GPU加速的TensorFlow容器。使用Docker是在Linux上启用TensorFlow GPU支持的最简单方法之一，因为它只需要在主机上安装NVIDIA® GPU驱动程序，而不必安装NVIDIA® CUDA®工具包。这一配置大大简化了在容器中使用GPU的过程，使得深度学习工作更加高效。希望本文对你有所帮助，并祝你在深度学习之路上一帆风顺。

标签：容器,nvidia,Ubuntu,上用,GPU,NVIDIA,TensorFlow,Docker
From： https://blog.csdn.net/bhgulang/article/details/140159743

装了一次没成功的前提下，ubuntu18.04+ros(melodic)安装 cartographer源码安装及测试---
因为项目需要所以要安装cartographer，最开始也没仔细研究一下，随便找了一个csdn教程就跟着安装了，装了一下午，总是在最后编译的时候出错，晚上的时候心态崩了，咸鱼上找了个远程安装的，他好像是用小鱼的那个脚本安装，装了一个小时也没安装好。不死心的我又去咸鱼上找人，然后开口要两千块，两......
适用于PyTorch 2.0.0的Ubuntu 22.04上CUDA v11.8和cuDNN 8.7安装指南
将下面内容保存为install.bash，直接用shell执行一把梭解决#!/bin/bash###steps#####verifythesystemhasacuda-capablegpu#downloadandinstallthenvidiacudatoolkitandcudnn#setupenvironmentalvariables#verifytheinstallation######toverify......
Ubuntu-Shell图形化工具-zenity
Ubuntu-Shell图形化工具脚本中加入更多的图形元素。KDE和GNOME桌面环境都扩展了dialog命令，包含了可以在各自环境下生成XWindow图形化部件的命令。kdialog和zenity包，它们各自为KDE和GNOME桌面提供了图形化窗口部件1.查看内核版本命令：cat/proc/version uname......
ubuntu上安装oracle11g的错误解决
环境:OS:16.04DB:11.2.0.4单机发现在ubuntu上安装oracle，按照文档都已经安装了想要的包，但是检查还是无法通过，忽略后可以进行安装，但是需要修改很多地方1.安装的依赖包aptupdateapt-getinstallbinutilsapt-getinstalllibcap-devapt-getinstalllibstdc++5apt-get......
Tensorflow模型转换onnx模型
1.查看pb文件的输入输出一般cv相关的输入只有一个输入，即图片，但输出却可能有多个，可以查看训练模型等确定输出。importtensorflow.compat.v1astfPATH_TO_CKPT="/xxx/yyyy/resnet.pb"defcreate_graph():withtf.gfile.FastGFile(PATH_TO_CKPT,'rb')asf:......
Ubuntu24.04配置支持asp.net framework 4.0的apache服务器
参考《在Linux（Ubuntu/openSUSE/CentOS）下配置ASP.NET（Apache+Mono）》，但由于操作系统版本不一样，部分命令要修改1、安装apachesudoapt-getinstallapache22、安装mono及apache支持模块，这里安装很正常，并没有文中提到的卡死情况，应该是已经修复这个bug了。sudoaptinstallmon......
ubuntu中gstreamer缺少rtspserversink插件怎么安装这个插件？
在Ubuntu中，如果GStreamer缺少rtspserversink插件，这通常意味着gst-rtsp-server模块没有正确安装或配置。rtspserversink是gst-rtsp-server库的一部分，它用于构建RTSP服务器，支持媒体流的发送。以下是详细的安装步骤，这些步骤将帮助你安装gst-rtsp-server及其相关插件：首先，你需要安......
Python TensorFlow双向Bi-LSTM长短期记忆神经网络深度学习可视化用户传感器活动数据
全文链接：https://tecdat.cn/?p=36613原文出处：拓端数据部落公众号在本文中，我们旨在利用深度学习技术，特别是TensorFlow框架下的Keras库，对WISDM（无线传感器数据挖掘）数据集进行活动识别。WISDM数据集包含了从用户身上佩戴的加速度传感器收集的三轴加速度数据，这些数据被用于识别用户的......
Ubuntu20.04无法安装也无法卸载显卡驱动
起因是发现nvidia-smi报错：NVIDIA-SMIhasfailedbecauseitcouldn'tcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriverisinstalledandrunning.然后以为把驱动卸载掉重新装一下就行了。sudoapt-getremove--purgenvidia*//卸载原有......
windows10用conda搭建tensorflow的gpu环境
在tensorflow官方网址上也列举了很多方法，但都很麻烦，包括docker也没有办法在win10下应用gpu来计算。记录我的检查过程。在官网搜集有用的资料。“在Windows环境中从源代码构建”中提到了经过测试后，可用的配套版本，找到一个最新的是：|版本|Python版......