pytorch中保证代码复现的随机种子设置(Reproducibility)
关注B站可以观看更多实战教学视频:hallo128的个人空间
1. 代码复现的必要性
代码是用来设置整个笔记本的种子,以保证每次运行时得到相同的结果,实现结果的可重现性。首先,使用numpy和random库设置种子,然后使用torch库设置CPU和GPU的种子。接着,针对CuDNN后端,需要设置两个额外的选项。最后,通过设置环境变量PYTHONHASHSEED来固定哈希种子的数值。这种设置种子的操作对于深度学习等需要随机性的场景非常重要,能够确保实验结果的一致性。
2. 核心设置
- 使用numpy和random库设置种子
- 使用torch库设置CPU和GPU的种子
- 针对CuDNN后端,需要设置两个额外的选项
- 通过设置环境变量PYTHONHASHSEED来固定哈希种子的数值
3. 复现代码种子设置
import numpy as np
import random
import torch
import os
def set_seed(seed = 42):
# 1.使用numpy和random库设置种子
np.random.seed(seed)
random.seed(seed)
# 2.使用torch库设置CPU和GPU的种子
torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
# 3.针对CuDNN后端,需要设置两个额外的选项
# 确保每次运行相同的输入时,CuDNN卷积算法的【输出结果是确定的】,增强了结果的【可重现性】
torch.backends.cudnn.deterministic = True
# 禁用了CuDNN的自动寻找最适合当前配置和硬件的卷积算法的功能,这样能够保证每次运行的【速度稳定】,但可能会略微【减慢训练速度】
torch.backends.cudnn.benchmark = False
#禁用 cudnn 中的确定性算法,以避免计算结果的确定性对性能产生影响【提高训练模型的稳定性】
#torch.backends.cudnn.deterministic = False
#在每个卷积操作中自动寻找最适合当前配置的高效算法,从而提高计算速度【提高计算效率】
#torch.backends.cudnn.benchmark = True
# 4.通过设置环境变量PYTHONHASHSEED来固定哈希种子的数值
os.environ['PYTHONHASHSEED'] = str(seed)
print('> SEEDING DONE')
# 调用设置的随机种子
set_seed(CFG.seed) # 自己设置一个种子变量:CFG.seed=101
标签:random,Reproducibility,torch,cudnn,pytorch,seed,复现,设置,种子
From: https://blog.csdn.net/weixin_43633501/article/details/140765146