pytorch中nn.Parameter()使用方法

时间：2023-01-17 11:38:27浏览次数：38

标签：__ nn parameters self torch pytorch Parameter

对于nn.Parameter()是pytorch中定义可学习参数的一种方法，因为我们在搭建网络时，网络中会存在一些矩阵，这些矩阵内部的参数是可学习的，也就是可梯度求导的。

对于一些常用的网络层，例如nn.Conv2d()卷积层、nn.LInear()线性层、nn.LSTM()循环网络层等，这些网络层在pytorch中的nn模块中已经定义好，所以我们搭建模型时可以直接使用，但是有些自定义网络在pytorch中是没有实现的，我们就需要自定义可学习参数，那就用到了nn.Parameter()这个函数。

该函数会为我们创建一个矩阵，该矩阵是默认可梯度求导的，之后我们就可以利用这个矩阵进行计算，该函数需要传入的参数是一个tensor，一般我们会传入一个初始化好的tensor。

下面我们将使用一个简单的线性层作为实例，来理解如何使用nn.Parameter()。

一、nn.Linear()定义参数

在类中我们定义了一个线性层，输入维度是10，输出维度是3，对于nn.Linear()层内部已经封装好了nn.Parameter()，所以不需要我们自定义，直接使用即可。

class Net1(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(10, 3)
    
    def forward(self, x):
        return F.sigmoid(self.linear(x))

二、nn.Parameter()定义参数

对于一个线性层，我们会需要两个矩阵，分别是权重W和偏置b，所以我们要用nn.Parameter()定义两个可学习参数，然后传入对应维度的tensor作为参数，之后就可以在forward中定义计算过程。

class Net2(nn.Module):
    def __init__(self):
        super().__init__()
        self.W = nn.Parameter(torch.randn(10, 3))
        self.b = nn.Parameter(torch.randn(3))
    
    def forward(self, x):
        return F.sigmoid(self.W @ x + self.b)

三、查看可学习参数

利用下面代码就可以看定义好的模型中的参数

model1 = Net1()
model2 = Net2()

for name, parameters in model1.named_parameters():
    print(name, ':', parameters.size())
    
for name, parameters in model2.named_parameters():
    print(name, ':', parameters.size())

linear.weight : torch.Size([3, 10])
linear.bias : torch.Size([3])
W : torch.Size([10, 3])
b : torch.Size([3])

标签：__,nn,parameters,self,torch,pytorch,Parameter
From： https://blog.51cto.com/u_15834745/6012002

图神经网络 —— GNN通用计算管道
前言大家好，我是阿光。本专栏整理了《图神经网络》，内包含了不同图神经网络的原理以及相关代码实现，详细讲解图神经网络，理论与实践相结合，如GCN、GraphSAGE、GAT等经典图网络，每......
图神经网络通用框架 —— MPNN消息传递神经网络
前言大家好，我是阿光。本专栏整理了《图神经网络》，内包含了不同图神经网络的原理以及相关代码实现，详细讲解图神经网络，理论与实践相结合，如GCN、GraphSAGE、GAT等经典图网络，每......
基于Pytorch实现GAT（图注意力网络）
前言大家好，我是阿光。本专栏整理了《图神经网络》，内包含了不同图神经网络的原理以及相关代码实现，详细讲解图神经网络，理论与实践相结合，如GCN、GraphSAGE、GAT等经典图网络，每......
【论文写作分析】之四《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》
论文名称：《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》发布期刊：《山东大学学报(理学版)》期刊信息：CSCD 论文写作分析摘要：本文非常简单。网络模型是直......
bat做网络驱动时报错Multiple connections to a server or shared resource by the sa
有时会报这样的错：Themappednetworkdrivecouldnotbecreatedbecausethefollowingerrorhasoccurred:Multipleconnectionstoaserverorsharedresourcebyt......
使用 Excel cdata addin 连接 SAP ABAP 系统时遇到错误消息 Unable to connect to SAP
错误消息：Detail:NilHSBufInit:alreadyinitializedRFC_COMMUNICATION_FAILUREcdata选项，没有填写SAProuter的地方，大概是哪里的问题？笔者在AG3做CRM开发时，并......
报错Error running 'Tomcat 9.0.68': Can't find catalina.jar【解决办法】
修改tomcat路径，肯定是你移动了jar包在硬盘的位置将路径改成当前所在的文件位置 ......
AtCoder Beginner Contest 282(G 填坑dp)
G-SimilarPermutation题目大意：如果两个排列A=(A\(_1\),A\(_2\),A\(_3\)....A\(_N\)),B=(B\(_1\),B\(_2\),B\(_3\)....B\(_N\))满足：(A\(_i\)-A\(_{i+1}\))(B\(_......
手写笔记6：谈谈Innodb和Myisam的区别？
......
【文本分类】《短文本分类的ResLCNN模型》
·阅读摘要：提出基于3层LSTM和CNN网络结构的ResLCNN深度学习模型。该模型使用了3层LSTM获取文本的长距离依赖，用CNN通过卷积获取句子局部特征，同时使用了残差模型，在第1层L......

pytorch中nn.Parameter()使用方法

一、nn.Linear()定义参数

二、nn.Parameter()定义参数

三、查看可学习参数

相关文章

赞助商

阅读排行