首页 > 其他分享 >torch.backends.cudnn.benchmark=True

torch.backends.cudnn.benchmark=True

时间:2022-09-22 17:59:32浏览次数:76  
标签:cuDNN 卷积 torch benchmark cudnn backends True

torch.backends.cudnn.benchmark (推荐,讲解的很详细)

cuDNN 是英伟达专门为深度神经网络所开发出来的 GPU 加速库,针对卷积、池化等等常见操作做了非常多的底层优化,比一般的 GPU 程序要快很多。大多数主流深度学习框架都支持 cuDNN,PyTorch 自然也不例外。在使用 GPU 的时候,PyTorch 会默认使用 cuDNN 加速。但是,在使用 cuDNN 的时候,torch.backends.cudnn.benchmark 模式是为 False。所以就意味着,我们的程序可能还可以继续提速!

设置 torch.backends.cudnn.benchmark=True 将会让程序在开始时花费一点额外时间,为整个网络的每个卷积层搜索最适合它的卷积实现算法,进而实现网络的加速。适用场景是网络结构固定(不是动态变化的),网络的输入形状(包括 batch size,图片大小,输入的通道)是不变的,其实也就是一般情况下都比较适用。反之,如果卷积层的设置一直变化,将会导致程序不停地做优化,反而会耗费更多的时间。

 

标签:cuDNN,卷积,torch,benchmark,cudnn,backends,True
From: https://www.cnblogs.com/picassooo/p/16720249.html

相关文章

  • 实践torch.fx第二篇-fx量化实操
    好久不见各位,哈哈,又鸽了好久。本文紧接上一篇《实践torch.fx第一篇——基于Pytorch的模型优化量化神器》继续说,主要讲如何利用FX进行模型量化。为什么这篇文章拖了这么久......
  • 第七章:PyTorch可视化
    1、可视化网络结构————以ResNet18的结构进行展示随着深度神经网络做的的发展,网络的结构越来越复杂,我们也很难确定每一层的输入结构,输出结构以及参数等信息,这样导致我......
  • 第五章:PyTorch模型定义
    1、PyTorch中模型定义的三种方式Pytorch构建模型,常用的方式有下面的三种:继承nn.Module基类构建自定义模型使用nn.Sequential按层顺序构建模型继承nn.Module基类构建......
  • 第二章:PyTorch基础知识
    1、张量(tensor)张量我们可以理解为三维及以上的数据。2、使用PyTorch创建张量通过torch.rand()的方法,构造一个随机初始化的矩阵:importtorchx=torch.rand(4,3......
  • torch中损失函数的记录
    1.F.binary_cross_entropy_with_logits在BCELoss前自动添加了sigmoid函数来归一化pred,简化结果2.F.cross_entropy是softmax+log+null_loss的集......
  • torch.nn.KLDivLoss
    KL散度KL散度,又叫相对熵,用于衡量两个分布之间的距离。设$p(x),q(x)$是关于随机变量$x$的两个分布,则$p$相对于$q$的KL散度为:信息论中,熵$H(P)$表示对来自$P$的随机变量进......
  • torch.max
    第一个版本:torch.max(input)→TensorReturnsthemaximumvalueofallelementsinthe input tensor.>>>a=torch.randn(1,3)>>>atensor([[0.6763,0......
  • 以TrueType为例谈字形描述
    以TrueType为例谈字形描述作者:哲思时间:2022.9.17邮箱:[email protected]:zhe-si(哲思)(github.com)一、前言在深入理解“字符编码模型”中,我们了解了字符完整......
  • torch.Tensor.index_fill_
    torch.Tensor.index_fill_(dim,index,value)→TensorFillstheelementsofthe self tensorwithvalue value byselectingtheindicesintheordergiven......
  • PyTorch 中的 CIFAR10 图像分类
    PyTorch中的CIFAR10图像分类如何为CIFAR10构建高精度CNNPhotoby伊戈尔·莱皮林on不飞溅在本文中,我们将深入探讨CIFAR10图像分类问题。为了解决这个问题,......