首页 > 其他分享 >深度学习(判断cuda是否可用)

深度学习(判断cuda是否可用)

时间:2023-10-09 21:35:45浏览次数:33  
标签:可用 torch device cuda 深度 print 显卡 get

安装完pytorch、cuda和cudnn之后,可以先判断是否可用。

import torch
print('CUDA版本:',torch.version.cuda)
print('Pytorch版本:',torch.__version__)
print('显卡是否可用:','可用' if(torch.cuda.is_available()) else '不可用')
print('显卡数量:',torch.cuda.device_count())
print('是否支持BF16数字格式:','支持' if (torch.cuda.is_bf16_supported()) else '不支持')
print('当前显卡型号:',torch.cuda.get_device_name())
print('当前显卡的CUDA算力:',torch.cuda.get_device_capability())
print('当前显卡的总显存:',torch.cuda.get_device_properties(0).total_memory/1024/1024/1024,'GB')
print('是否支持TensorCore:','支持' if (torch.cuda.get_device_properties(0).major >= 7) else '不支持')
print('当前显卡的显存使用率:',torch.cuda.memory_allocated(0)/torch.cuda.get_device_properties(0).total_memory*100,'%')
print('cudnn是否可用:',torch.backends.cudnn.is_available())

标签:可用,torch,device,cuda,深度,print,显卡,get
From: https://www.cnblogs.com/tiandsp/p/17753095.html

相关文章

  • Go函数全景:从基础到高阶的深度探索
    在本篇文章中,我们深入探索了Go语言中的函数特性。从基础的函数定义到特殊函数类型,再到高阶函数的使用和函数调用的优化,每一个部分都揭示了Go的设计哲学和其对编程效率的追求。通过详细的代码示例和专业解析,读者不仅可以掌握函数的核心概念,还能了解如何在实践中有效利用这些特性来......
  • 阿里云ECS高可用应用架构部署方案
    高可用架构是指计算机系统能够保证无故障持续运行的概率,通常采用百分比的方式来表示系统的高可用性等级,我们在生活中采用高可用概率=可用时间/总时间*100%来计算实现的高可用性等级,要想实现较高的高可用性等级,需要引入系统冗余的理念。7x24 小时不间断的运行并对外提供正常的服务,......
  • 电脑输入密码后出现 目前没有可用的登录服务器处理登录请求
    电脑输入密码后出现目前没有可用的登录服务器处理登录请求   解决方案:登录时去掉Administrator前面的域名。 ......
  • 深度解析集成服务云的多重启动机制:数据集成更智能,业务流畅畅行无阻
    集成方案的“点火”时刻!花式启动数据集成在这篇文章中,我们将探讨轻易云集成服务云的集成方案启动机制,以助您在企业数据集成中灵活应对各种需求,确保数据自由流动。启动方案是什么启动方案是指集成方案启动执行的方式。轻易云集成服务云提供了四种启动方式,包括人工启动、定时启......
  • 《动手学深度学习 Pytorch版》 8.2 文本预处理
    importcollectionsimportrefromd2limporttorchasd2l解析文本的常见预处理步骤:将文本作为字符串加载到内存中。将字符串拆分为词元(如单词和字符)。建立一个词表,将拆分的词元映射到数字索引。将文本转换为数字索引序列,方便模型操作。8.2.1读取数据集本文......
  • 《动手学深度学习 Pytorch版》 8.1 序列模型
    到目前为止,我们遇到的数据主要是表格数据和图像数据,并且所有样本都是独立同分布的。然而,大多数的数据并非如此。比如语句中的单词、视频中的帧以及音频信号,都是有顺序的。简言之,如果说卷积神经网络可以有效地处理空间信息,那么本章的循环神经网络(recurrentneuralnetwork,RNN)则可......
  • ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线
    ControlNet-trt优化总结3:使用multi-stream和cuda-graph构建并行流水线上节谈到使用TRT-API来构建网络,在这一节中总结一些trick来提升模型的运行效率,这些trick在所有的trt优化中均可使用,主要有以下几点:使用cuda_graph减少kernel间的启动间隙使用Mutil-stream增加异步cuda_gra......
  • 深度学习算法原理实现——自写神经网络和训练模型
    代码来自:https://weread.qq.com/web/reader/33f32c90813ab71c6g018fffkd3d322001ad3d9446802347《python深度学习》fromtensorflow.keras.datasetsimportmnistfromtensorflow.kerasimportoptimizersimporttensorflowastfimportnumpyasnpclassNaiveDense:......
  • 深度学习---目标检测网络YoloX
    一、网络介绍YoloX由旷视科技开源,以YoloV3(Darknet53作为backbone)作为基线,最大的区别在于DecoupledHead,DataAug,AnchorFree和样本匹配(SimOTA)这几个方面,另外还提供了完善的代码,并很贴心的提供了部署脚本,真的很友好了。PDF:https://arxiv.org/pdf/2107.08430.pdfCode:http......
  • CUDA C编程权威指南:2.1-CUDA编程模型
      本文主要通过例子介绍了CUDA异构编程模型,需要说明的是Grid、Block和Thread都是逻辑结构,不是物理结构。实现例子代码参考文献[2],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。1.Grid、Block和Thread间的关系  GPU中最重要的2种内存是全局......