首页 > 系统相关 >ubuntu2004 上安装与使用NVIDIA GPU A100

ubuntu2004 上安装与使用NVIDIA GPU A100

时间:2024-11-19 19:19:02浏览次数:1  
标签:容器 run ubuntu2004 A100 -- NVIDIA nvidia docker

ubuntu2004 上安装与使用NVIDIA GPU A100

  1. 先安装显卡驱动
    https://blog.csdn.net/qq_36999834/article/details/107589779

  2. 用容器的方式安装cuda

  ## 创建并启动容器,启动gpu docker要加上 --gpus all 选项, -i表示交互,-t表示分配一个伪终端,
  ## --rm自动删除停止运行的容器,如果exit,则会删掉这个容器,如果后面想继续使用这个容器,不需要添加这个选项
  docker run -it --gpus all nvidia/cuda:11.0-base
  1. 用容器的方式安装tensorrt
  # 安装TensorRt镜像
  docker pull nvcr.io/nvidia/tensorrt:21.11-py3
   
  # 使用TensorTt镜像创建一个容器,其中local_dir是共享到容器的目录
  docker run --gpus all -it -v local_dir:container_dir nvcr.io/nvidia/tensorrt:21.11-py3
  docker run --gpus all --name cjl -it -v /home/cj/ResNet:/home/ResNet nvcr.io/nvidia/tensorrt:21.11-py3
   
  1. NVIDIA 查看版本
  nvcc --version
  nvidia-smi
  1. 容器中安装使用torch
  pip3 install torch==1.11.0+cu115 torchvision==0.12.0+cu115 torchaudio==0.11.0+cu115 -f https://download.pytorch.org/whl/cu115/torch_stable.html
   

nvidia镜像资源:Data Science, Machine Learning, AI, HPC Containers | NVIDIA NGC

TensorRT使用参考链接:Speeding Up Deep Learning Inference Using TensorRT | NVIDIA Developer Blog

Nvidia-docker参考链接:NVIDIA Docker: GPU Server Application Deployment Made Easy | NVIDIA Developer Blog

Docker参考链接:https://yeasy.gitbook.io/docker_practice/image/pull

nvidia-docker安装参考:Installation Guide — NVIDIA Cloud Native Technologies documentation

https://blog.csdn.net/m0_46825740/article/details/121418113

使用sudo权限安装docker后,普通用户无法使用 docker run命令运行镜像的问题:docker: Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock

  # 直接执行下面这条命令即可
  sudo chmod 666 /var/run/docker.sock

https://yyixx.com/docs/op/docker/nvidia_docker/

标签:容器,run,ubuntu2004,A100,--,NVIDIA,nvidia,docker
From: https://www.cnblogs.com/sexintercourse/p/18555456

相关文章

  • NVIDIA(Hopper)H100 Tensor Core GPU 架构
    NVIDIA(Hopper)H100TensorCoreGPU架构AI赋能个体创业致力于降低直播成本服务于商家和个人​关注他  NVIDIAH100TensorCoreGPU是NVIDIA最新的(2022年发布)通用可编程流式GPU,适用于HPC、AI、科学模拟和数据分析。H100GPU主要用于执行A......
  • 配置NVIDIA Container Runtime和容器运行GPUStack教程
    GPUStack是一个设计用于运行大模型的开源GPU集群管理器,提供私有部署的大模型服务,支持大语言模型、Embedding文本嵌入模型、Reranker重排序模型、Vision多模态模型等各种模型。它可以聚合不同平台(如AppleMacbook、WindowsPC和Linux服务器)的GPU,构建一个统一的异构GPU......
  • 配置NVIDIA Container Runtime和容器运行GPUStack教程
    GPUStack是一个设计用于运行大模型的开源GPU集群管理器,提供私有部署的大模型服务,支持大语言模型、Embedding文本嵌入模型、Reranker重排序模型、Vision多模态模型等各种模型。它可以聚合不同平台(如AppleMacbook、WindowsPC和Linux服务器)的GPU,构建一个统一的异构GPU......
  • 关于NVIDIA Jetson AGX Xavier刷机过程记录
    刷机记录,再刷机忘记了回来看看~主机电脑安装ubuntu20.04虚拟机,NVIDIAsdkmanager,主机端连上路由器提供的wifi。再将Jetson接上电源,但不开机。拿出附带的typec——USB数据线,typec端连上图中的typec口,USB连上主机电脑。找出一根网线,一端连接Jetson,另一端连接步骤1中提到的......
  • ubuntu destop上安装 NVIDIA GeForce RTX 4090驱动(以这篇为主)
    背景通过上一篇文章的安装方式发现,开机直接卡死在ubuntu的logo界面,通过grub绕过logo,也没办法进去图形化界面。折腾了很久,之前安装驱动都是远程ssh过去的,装的也是官方下载的。换个思路,我就直接呆机房,通过图形化桌面去安装,通过ubuntu-drivers来安装,终于成了。梳理的安装步骤如下......
  • ubuntu上安装 NVIDIA GeForce RTX 4090驱动
    背景ai服务器上安装完ubuntu系统后,需要安装NVIDIA显卡驱动官网驱动下载https://www.nvidia.cn/drivers/details/235646/驱动安装1.卸载原有驱动sudoaptremove--purgenvidia*2.备份sudocp/etc/modprobe.d/blacklist.conf/etc/modprobe.d/blacklist.conf_bak3.......
  • NVIDIA研究团队推出MM-Embed
      每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://......
  • Ubuntu安装Nvidia驱动与Cuda Toolkit详细教程 | 步骤解析与环境配置 - 幽络源
    步骤概述步骤1:检查是否安装Nvidia驱动步骤2:查询显卡匹配的驱动版本步骤3:安装Nvidia驱动步骤4:检查Nvidia是否安装并加载步骤5:禁用nouveau步骤6:重新加载nvidia驱动并检查步骤7:下载cudatoolkit步骤8:安装cudatoolkit到指定目录步骤9:配置cudatoolkit环境变量步骤10:测试cudatool......
  • (一)安装 NVIDIA 显卡驱动、CUDA、CUDNN
    ......
  • nvidia机器人仿真控制平台公开课(笔记)
    NVIDIA提供foundationmodel,供客户调整,或许NVIDIA的这种数据、开发、场景、业务大规模集成的方法,而且再加上其硬件优势,或许这种能力才是NVIDIA的最大底气。公开课中获得一个信息:(重要信息说三遍!!!)GROOT项目明年开源!GROOT项目明年开源!GROOT项目......