PyTorch中的model.zero_grad() 与 optimizer.zero_grad()的区别

时间：2022-10-06 15:33:37浏览次数：49

在PyTorch中，对模型参数的梯度置0时，通常使用两种方式：

model.zero_grad()
optimizer.zero_grad()。

二者在训练代码都很常见，那么二者的区别在哪里呢？

model.zero_grad()的作用是将所有模型参数的梯度置为0。其源码如下：

for p in self.parameters():
    if p.grad is not None:
        p.grad.detach_()
        p.grad.zero_()

optimizer.zero_grad()的作用是清除所有优化的torch.Tensor的梯度。其源码如下：

for group in self.param_groups:
    for p in group['params']:
        if p.grad is not None:
            p.grad.detach_()
            p.grad.zero_()

总结

当使用optimizer = optim.Optimizer(net.parameters())设置优化器时，此时优化器中的param_groups等于模型中的parameters()，此时，二者是等效的，从二者的源码中也可以看出来。
当多个模型使用同一个优化器时，二者是不同的，此时需要根据实际情况选择梯度的清除方式。
当一个模型使用多个优化器时，二者是不同的，此时需要根据实际情况选择梯度的清除方式。

标签：二者,optimizer,梯度,zero,model,grad
From： https://www.cnblogs.com/zjuhaohaoxuexi/p/16757726.html

[LeetCode] 1317. Convert Integer to the Sum of Two No-Zero Integers 将整数转换为
No-Zerointeger isapositiveintegerthat doesnotcontainany 0 initsdecimalrepresentation.Givenaninteger n,return alistoftwointegers [A,......
gradle安装、配置，使用命令构建spring boot项目
安装#下载到本地直接解压#配置环境变量GRADLE_HOMEGRADLE_USER_HOMEPATH#打开cmd：gradle-videa配置打包常用命令#cmd进入项目根路径gradlewbuildgradlewcleangradleb......
gradle总结
安装点击查看详情#下载到本地直接解压#配置环境变量GRADLE_HOMEGRADLE_USER_HOMEPATH#打开cmd：gradle-v修改maven下载源#在init.d文件夹创建init.gradle文件allprojec......
IntegratedGradients源码阅读---基于深度学习可解释性框架Captum
首先，来到captum的github源码仓库地址是：https://github.com/pytorch/captum captum是一个用pytorch写的，实现了很多深度学习可解释性方法的库。包括IntegratedGradie......
（问题）idea+gradle+jeesite+html 在开发调试中修改html文件后，出现更新失败，要重启才能生
使用IDEA开发调试Jeesite，修改了含有beetl脚本的HTML文件后，使用Build输出资源文件出现以下错误。Executionfailedfortask':processResources'.Failedtocleanupst......
zeroMemory 其作用是用0来填充一块内存区域
ZeroMemory是一个计算机函数，由美国微软公司的软件开发包SDK中的一个宏。其作用是用0来填充一块内存区域。声明voidZeroMemory(PVOIDDestination,SIZE_TLength);参数......
gradle构建spring boot项目
当前案例地址构建gradle项目配置字符集、注解生效激活、JavaCompiler使用IDE自带的gradle测试打包参考拉取依赖dependencies{testCompilegroup:'ju......
curl: (7)Failed connect to ip:port;Connection timed out returned a non-zero code
问题现象负责安全测试的同学需要部署洞态IAST，通过java探针的方式附加到应用服务上，在项目下添加了一个Dockerfile文件：FROMprasadlvi/openjdk-11-jreWORKDIR/home......
gradle sync failed 的解决办法
gradlesyncfailed的解决办法AndroidStudio安装后可能会出现gradle syncfailed错误首先打开设置界面（Ctrl+Alt+S）选择Build,Execution,Deployment选择G......
python -m pip install --upgrade pip报No module named pip解决方法
解决方法：1、 python-mensurepip2、 python-mpipinstall--upgradepip注意：添加pip环境变量在python安装目录下搜索pip3或者pip的文件所在目录，复制环境变量中......

PyTorch中的model.zero_grad() 与 optimizer.zero_grad()的区别

相关文章

赞助商

阅读排行