首页 > 其他分享 >5.1 层和块

5.1 层和块

时间:2023-07-24 11:33:15浏览次数:44  
标签:__ 5.1 Linear nn self Module Sequential

为了实现更加复杂的神经网络,我们引入的概念。可以描述单个层、由多个层组成的组件或整个网络本身。使用块进行抽象的一个好处是可以将一些块组合成更大的组件, 这一过程通常是递归的,如图所示。 通过定义代码来按需生成任意复杂度的块, 我们可以通过简洁的代码实现复杂的神经网络。

 从编程的角度来看,块由类(class)表示。它的任何字类都必须定义一个将其输入转换为输出的前向传播函数,并且必须存储任何必需的参数(注意有些层没有参数,这取决于我们对网络的定义)。

 回顾一下多层感知机的代码:

import torch
from torch import nn
from torch.nn import functional as F

net = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))

X = torch.rand(2, 20)
net(X)

在这个例子中,我们创建了nn.Sequential对象的一个实例--net,作为我们的一个Module。这里,net各层的执行顺序是根据传递参数的前后顺序决定的。nn.Sequential是nn.Module的一个子类,这里,nn.Sequential实际上就定义了一种特殊的Module。可以这样理解:Module是抽象的神经网络“块”的概念,而Sequential则是一个个不尽相同的,具体的“块”。nn.Sequential维护了一个由Module组成的有序列表。注意:两个全连接层都是Linear类的实例,Linear类本身就是Module的字类。另外,到目前为止,我们一直在通过net(X)调用我们的模型来获得模型的输出。 这实际上是net.__call__(X)的简写。 这个前向传播函数非常简单: 它将列表中的每个块连接在一起,将每个块的输出作为下一个块的输入。

注意:这里面有语句from torch.nn import functional as F, 这里面包含一些函数。比如F.relu,它是ReLU层的函数版本。

想要自己实现一个自定义块,自定义块必须具有以下几个功能:

  1. 将输入数据作为其前向传播函数的参数。

  2. 通过前向传播函数来生成输出。请注意,输出的形状可能与输入的形状不同。例如,我们上面模型中的第一个全连接的层接收一个20维的输入,但是返回一个维度为256的输出。

  3. 计算其输出关于输入的梯度,可通过其反向传播函数进行访问。通常这是自动发生的。

  4. 存储和访问前向传播计算所需的参数。

  5. 根据需要初始化模型参数。

class MLP(nn.Module):
    # 用模型参数声明层。这里,我们声明两个全连接的层
    def __init__(self):
        # 调用MLP的父类Module的构造函数来执行必要的初始化。
        # 这样,在类实例化时也可以指定其他函数参数,例如模型参数params(稍后将介绍)
        super().__init__()
        self.hidden = nn.Linear(20, 256)  # 隐藏层
        self.out = nn.Linear(256, 10)  # 输出层

    # 定义模型的前向传播,即如何根据输入X返回所需的模型输出
    def forward(self, X):
        # 注意,这里我们使用ReLU的函数版本,其在nn.functional模块中定义。
        return self.out(F.relu(self.hidden(X)))

以上代码片段实现了一个多层感知机。这里面定义的class MLP就是一个多层感知机,也是神经网络中的一个块。一般来说,自定义块需要在class中必须实现两个函数:__init__()以及forward()函数。注意:在python中,任意类中定义的方法都必须包含一个self作为参数。在本例中,如果我们需要两个MLP它们的结构相同但需要不同的参数时,就可以使用上面定义的MLP类来实例化两个不同的对象来用不同的数据进行训练。

现在我们自己实现一个Sequential类。

我们只需要定义两个关键函数:

  1. 一种将块逐个追加到列表中的函数;

  2. 一种前向传播函数,用于将输入按追加块的顺序传递给块组成的“链条”。

下面的MySequential类提供了与默认Sequential类相同的功能。

class MySequential(nn.Module):
    def __init__(self, *args):
        super().__init__()
        for idx, module in enumerate(args):
            # 这里,module是Module子类的一个实例。我们把它保存在'Module'类的成员
            # 变量_modules中。_module的类型是OrderedDict
            self._modules[str(idx)] = module

    def forward(self, X):
        # OrderedDict保证了按照成员添加的顺序遍历它们
        for block in self._modules.values():
            X = block(X)
        return X

首先,显然Sequential是继承于nn.Module的。在__init__(self,*args)中,可以把*args看成一个由作为参数的各个层组成的列表(*号类似于c中的指针理解),enumerate(args)是创建args的枚举,用法说明如下:

 然后,self._modules[str(idx)] = module 是将层的索引的字符串形式作为key,将层作为value创建有序字典。最后forward函数按照层的顺序执行计算,return结果。__init__函数将每个模块逐个添加到有序字典_modules中。 读者可能会好奇为什么每个Module都有一个_modules属性? 以及为什么我们使用它而不是自己定义一个Python列表? 简而言之,_modules的主要优点是: 在模块的参数初始化过程中, 系统知道在_modules字典中查找需要初始化参数的子块。

 

到此,我们可以根据自己的需要灵活地定义块。

class FixedHiddenMLP(nn.Module):
    def __init__(self):
        super().__init__()
        # 不计算梯度的随机权重参数。因此其在训练期间保持不变
        self.rand_weight = torch.rand((20, 20), requires_grad=False)
        self.linear = nn.Linear(20, 20)

    def forward(self, X):
        X = self.linear(X)
        # 使用创建的常量参数以及relu和mm函数
        X = F.relu(torch.mm(X, self.rand_weight) + 1)
        # 复用全连接层。这相当于两个全连接层共享参数
        X = self.linear(X)
        # 控制流
        while X.abs().sum() > 1:
            X /= 2
        return X.sum()

 

class NestMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.net = nn.Sequential(nn.Linear(20, 64), nn.ReLU(),
                                 nn.Linear(64, 32), nn.ReLU())
        self.linear = nn.Linear(32, 16)

    def forward(self, X):
        return self.linear(self.net(X))

chimera = nn.Sequential(NestMLP(), nn.Linear(16, 20), FixedHiddenMLP())
chimera(X)

 

标签:__,5.1,Linear,nn,self,Module,Sequential
From: https://www.cnblogs.com/pkuqcy/p/17575034.html

相关文章

  • 动态规划5.1-概述
    一、概念以下内容摘自代码源两个要求最优子结构:大问题的解可以从小问题的解推出,在问题的拆解过程中不能无限递归无后效性:未来与过去无关,一旦得到小问题的解,得到该解的过程不影响大问题的求解两个元素状态:求解过程进行到了哪一步,可以理解为一个子问题转移:从一个状态(......
  • Uncaught AssertionError: Assertion failed. See https://openlayers.org/en/v6.15.1
    openlayers点击具体错误Cannotfitemptyextentprovidedas geometry.这个错误信息意味着OpenLayers在尝试使用一个空的范围作为几何图形时出现了问题。范围(extent)表示几何图形覆盖的边界框或区域,它由四个坐标值组成:最小经度、最小纬度、最大经度和最大纬度。当范围没有......
  • VTK 9.2 Qt 5.14 安装及错误处理
    安装注意:编译release和debug,通过切换配置为release和debug,文件都是在cmake的CMAKE_INSTALL_PREFIX指定的文件夹,需要编译完一种后,把这个文件夹改名(比如debug配置,则改名为debug),不然会覆盖。在Qt项目中,出现错误:“无法解析的外部符号__imp_gl***”,“项目-属性-链接器-输入”添加:OpenG......
  • VTK9.1.0在Windows10+VS2019+Qt 5.15.2环境下编译安装以及VTK应用于QT
    下载VTK安装包在VTK官网Download|VTK中下载VTK9.1.0待编译源码,解压后在路径Documentation/dev/bulid.md中可以看到官方提供的Prerequisites以及简易教程编译环境安装按照官方提供的Prerequisites,安装以下环境:CMakeVersion3.12ornewer,however,thelatestversionisal......
  • 5.1 存储技术
    随机访问存储器随机访问存储器分为静态的与动态的。静态SRAM将每个位存储在一个双稳态的存储器单元里,每个单元用一个六晶体管电路来实现。这个电路有这样一个属性,它可以无限期地保持在两个不同的电压配置(configuration)或状态(state)之一。其他任何状态都是不稳定的——从不稳......
  • graylog5.1安装(Centos7)
    官网安装地址:https://go2docs.graylog.org/5-1/downloading_and_installing_graylog/red_hat_installation.htm?tocpath=Downloading%20and%20Installing%20Graylog%7CInstalling%20Graylog%7C_____6一、需要安装的组件OpenJDK17(5.0以上版本的graylog已内置,无需安装)OpenSe......
  • 5.1 缓冲区溢出与攻防博弈
    在黑客安全圈子中,基于内存攻击技术的攻击手段在随着时代的变化而不断发展着,内存攻击是指通过利用软件的安全漏洞,构造恶意的输入,从而使正常程序造成拒绝服务或者是远程获得控制权,内存攻击技术中最先登上历史舞台的就是缓冲区溢出漏洞,时至今日能够被广泛利用的并具有较大破坏性的高......
  • kali 5.16内核升级6.0.0 失败以后重新修改gurb引导菜单
    背景简介:自己拿测试机升级内核后,无法正常开机出现“unabletomountrootfsonunknown-block(0,0) kali”错误 #新内核不能正常启动尝试自己修复,并且恢复引导菜单,恢复开机默认启动,以下为研究记录 #首先几个重要目录/boot/grub/grub.cfg  #这个目录是开机引导选......
  • ubuntu20.04 卸载已有的显卡驱动,安装安装 NVIDIA 驱动程序 525.85.12(主要是搭建deepst
    nvidia安装deepstream官网:  https://docs.nvidia.com/metropolis/deepstream/dev-guide/text/DS_Quickstart.html一、首先卸载本机的显卡驱动:参考连接(https://blog.csdn.net/gongdiwudu/article/details/128850792)1、卸载驱动库sudoapt-get--purgeremovenvidia*sudoapt......
  • tinymce:插入视频/音频后的回调(tinymce 6.5.1)
     一,官方文档地址:https://www.tiny.cloud/docs/tinymce/6/media/二,需求及代码:我们需要在插入视频后,设置其style宽度为100%,注意,是style中的width,如图:代码:tinymce.init({selector:'#tinydemo',plugins:"media",toolbar:"media",video_templat......