神经网络同时优化两个模型的参数/加载两个模型的参数

时间：2023-01-10 16:55:44浏览次数：44

框架：Pytorch 以Adam为例

一.传参和优化

1. 传入/优化一个模型的参数：

opt= torch.optim.Adam(model_1.parameters)

2. 同时传入/优化两个模型的参数：

opt = torch.optim.Adam([
	{'params': model_1.parameters(), 'lr': 0.001,}, 
	{'params': model_2.parameters()},
	])

3、形式2两个模型具有相同的其他参数（如 lr 等），若要设置不同的参数，可以分别在字典中给出

opt = torch.optim.Adam([
	{'params': model_1.parameters(), 'lr': 0.002}, 
	{'params': model_2.parameters(), 'lr': 0.003}
	])
	# 除lr以外的其他参数都可以采用同样方式给出

二.保存和加载

1、同一文件中保存多个模型的参数

1.1、保存单个模型

# 保存整个模型
save_name = 'models.pth'
torch.save(model_1, save_name)

# 仅保存参数
save_name = 'models.pt'
torch.save(model_1.state_dict(), save_name)

1.2、保存多个模型

# 整体保存
save_name = 'models.pth'
save_model = {
	'model_1': model_1,
	'model_2': model_2,
}
torch.save(save_model, save_name)

# 仅保存多个模型中的参数
save_name = 'models.pt'
save_model = {
	'model_1': model_1.state_dict(),
	'model_2': model_2.state_dict(),
}
torch.save(save_model, save_name)

2、从一个文件中加载多个模型的参数

2.1、加载单个模型（参数）

# 加载整个模型
save_name = 'models.pth'
model_1 = torch.load(save_name)

# 仅加载参数
save_name = 'models.pt'
model_1 = Net_1()	# 实例化模型
model_1.load_state_dict(torch.load(save_name))

2.2、加载多个模型（参数）

# 整体加载
save_name = 'models.pth'
load_models = torch.load(save_name)
model_1 = load_models['model_1']
model_2 = load_models['model_2']

# 仅加载多个模型中的参数
save_name = 'models.pt'
load_models = torch.load(save_name)
model_1 = Net_1()	# 实例化模型
model_2 = Net_2()	# 实例化模型
model_1.load_state_dict(load_models['model_1'])
model_2.load_state_dict(load_models['model_2'])

注：整个模型和仅参数的区别：
整个模型：是保存整个网络结构和参数，使用时会加载结构和其中的参数；
仅参数：仅保存网络模型中的参数，在使用时需要先用训练时的模型实例化，再往里面填入参数。
举个栗子：
加载整个模型就是边搭框架边填充参数；仅参数需要先搭好框架（先实例化）再往框架里填参数

标签：name,models,模型,神经网络,参数,model,save
From： https://www.cnblogs.com/jingweip/p/17040750.html

solidworks报错“模型不能被剖面线妥当分段”
报错的原因可能是是剖切面与零件（或装配体中的一个零件）的某个草图重合。解决方法：把剖切面稍微移动一段距离，或者换一个剖切面。 ......
时间序列分析 Tsfresh 基于统计学的时间序列分析方法 3、差分整合移动平均自回归模型（A
原文链接：点这里在了解了AR和MA模型后，我们将进一步学习结合了这两者的ARIMA模型，ARIMA在时间序列数据分析中有着非常重要的地位。但在这之前，让我们先来看ARIMA的简化版ARMA......
目标检测模型的基础
前言边界框：在⽬标检测领域⾥，我们通常使⽤边界框（boundingbox，缩写是bbox）来描述⽬标位置。边界框是⼀个矩形框，可以由矩形左上⻆的x和y轴坐标与右下⻆的x和y轴坐标确......
.Babylon格式的模型转化为glb模型，并使用ThreeJS加载显示
问题描述：手里有几个.babylon格式的三维模型，但是没用过babylon，只对ThreeJS熟悉；但是最新的ThreeJS里发现已经没有BabylonLoader的加载器，能查到的暮志未晚提供的例子，应该是因......
elementui表格中实现点击单个单元格和表头--带参数触发事件/跳转路由
对于element表格做点击跳转的功能有两大类：1，表头的点击跳转2，表格内容单元格进行点击跳转是因为该表格只有tabs标签也第二个选项被选中的时候才能让他起效果，所以先做判断，第......
url的path中传入id参数的用法
一.url"""定义learning_logs的URL模式"""urlpatterns=[#主页url(r'^$',views.index,name='index'),#显示所有的主题url(r'^topics/$',views.to......
Oracle sqlplus参数autocommit（自动提交）的设置
概述在数据库的插入、删除和修改操作时，只有当事务在提交到数据库时才算完成。在Oracle数据库中，在事务提交前，只有操作数据库的这个人才能有权看到所做的事情，别人只有在最后......
振弦采集模块参数配置工具的使用
振弦采集模块参数配置工具的使用通常情况下，在计算机端对模块进行测试、读写时，可使用一些通用的免费工具完成，如基于MODBUS通讯协议的调试工具MODSCAN、通用串口调试助手......
振弦采集模块参数配置工具的使用
河北稳控科技振弦采集模块参数配置工具的使用通常情况下，在计算机端对模块进行测试、读写时，可使用一些通用的免费工具完成，如基于MODBUS通讯协议的调试工具MODSCAN、......
用到的内核参数
net.ipv4.ip_forward=1经过forward配置为1net.ipv4.conf.all.arp_ignore=1 LVS的DR模型RS配置net.ipv4.conf.lo.arp_ignore=1 ......