PyTorch项目源码学习（3）——Module类初步学习

时间：2024-01-14 16:34:41浏览次数：41

标签：__ named parameters Module PyTorch 源码参数模块

torch.nn.Module

Module类是用户使用torch来自定义网络模型的基础，Module的设计要求包括低耦合性，高模块化等等。一般来说，计算图上所有的子图都可以是Module的子类，包括卷积，激活函数，损失函数节点以及相邻节点组成的集合等等，注意这里的关键词是“节点”，Module族类在计算图中主要起到搭建结构的作用，而不涉及运算逻辑的具体实现。

要注意的是，Module类对象的children所指向的其他Module类对象，并不等同于计算图中的子节点。如果我们展开Module网络，得到的一般是树形结构而非DAG，Module网络需要经过其他工作才能转化为计算图。

源代码分析

成员分析

首先直接从前端入手，找到torch/nn/module目录，可以看到这个目录下主要存放Module及其子类的定义，如。我们首先找到module.py内Module的定义

阅读__init__ 函数，可以看到Module基类的主要私有成员，其中包括

指向本Module内带梯度的可学习参数的parameter
指向本Module内不需要学习的模型状态参数的buffer
其他临时参数
前向与反向过程的hook函数，这些函数在运行backward与forward时允许自定义其它额外工作
state_dict相关函数，state_dict保存了模型的状态，是模型写入磁盘与加载的主要方式
modules指向该模块内部的所有子模块

方法分析

结构相关

子模块生成

首先从我们日常使用pytorch搭建网络的用法可以想到，应该先去__setattr__函数寻找建立子节点的入口。

下图折叠了几个分支，可以看到当我们运行self.c1 = Conv2d(...)时，将会进入1202行的分支内，并且判断新成员是否是Module类型，如果是则将其放入本对象的子模块字典内。

__setattr__ 内主要对Parameter，Module，特定name的Tensor（也就是buffer）等参数做特判，其他情况则调用object的属性设置流程。事实上，其他的类似方法（如getattr等）也是同样的流程。

内部参数访问

对于存储于私有成员_module内的子模块，一般使用children方法进行调用

我们在外部所使用的xx.modules()方法，就是通过调用children方法实现的。

另外，nn.Module实现了许多对参数转化的方法，比如CPU（将内部参数转移到内存中），CUDA（将内部参数转移到显存中）以及type（将参数转化为指定类型），而这些是通过调用内部的_apply方法实现的

可以看到，_apply接受一个函数指针参数，并对所有的子模块递归地调用自己。然后对本Module内所有的Parameter与buffer应用该函数。

问题来了，既然每个节点都进行函数应用，那么如何避免对同一参数重复应用fn？这个问题的关键在于内部的Parameter到底是如何存储的。

印象里，我们在外部使用xx.parameters()时，得到的是xx模块的所有参数，看起来和上述代码里的_parameters并非直接取用的关系，我们可以看一下parameters()的实现

注意到默认参数recurse=True，相信大部分人已经明白原因了，我们继续看到named_parameters()

对_named_member方法传入了获取子模块_parameters字典键值对的匿名函数，继续看到_named_members()

可以看到具体流程是先递归或者不递归地获取该模块下的所有用户希望获得的东西（具体定义在第一个函数参数中），然后返回迭代器

这里1489行体现递归调用，原因是named_modules方法本身就是一个递归函数

在这里插入图片描述

事实上，named_parameters, named_buffers均是通过named_members进而调用named_modules方法实现的，_module成员体现网络结构的特殊性在这里可以窥见一二。另外可以看到，上述方法内都存在memo集合进行去重，确保不会返回相同的指针对象。

简要流程图

在这里插入图片描述

参考文章

https://zhuanlan.zhihu.com/p/340453841

标签：__,named,parameters,Module,PyTorch,源码,参数,模块
From： https://www.cnblogs.com/int-me-X/p/17963848

基于SpringBoot+Vue的OA办公系统设计实现(源码+lw+部署文档+讲解等)
(文章目录)前言:heartpulse:博主介绍：✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌:heartpulse:......
Feign源码解析5：loadbalancer
背景经过前面几篇的理解，我们大致梳理清楚了FeignClient的创建、Feign调用的大体流程，本篇会深入Feign调用中涉及的另一个重要组件：loadbalancer，了解loadbalancer在feign调用中的职责，再追溯其是如何创建的。在讲之前，我先提个重点，本文章的前期是引用了nacos依赖且开启了如下选项，启用......
性能篇：深入源码解析和性能测试arraylist和LinkedList差异！
嗨，大家好，我是小米！今天我们要谈论的是Java中两个常用的集合类：ArrayList和LinkedList。大家都知道，这两者在新增和删除元素的操作上有一些差异，那么它们究竟在性能上有何表现呢？我们通过深入源码解析和性能测试来一探究竟！ArrayList新增元素到末尾这是最常见的新增元素操作，我们使用......
深入理解 Hadoop （一）网络通信架构与源码浅析
HadoopRPC网络通信框架原理剖析YARNRPC服务端的工作大致可以分为四个阶段:第一个阶段:Server初始化和启动在Server初始化的时候，会初始化Listener组件(内部启动了一个AcceptSelector绑定了相应的端口，用来处理客户端的OP_ACCEPT事件)，内部还初始化了一组Reader线程，其......
C++源码中司空见惯的PIMPL是什么？
前言:C++源码中司空见惯的PIMPL是什么？用原始指针、std::unique_ptr和std::shared_ptr指向Implementation，会有什么不同？优缺点是什么？读完这篇文章，相信你能搞懂这种设计方式并将其运用于实践，也将更容易阅读源码。1.PIMPL是什么？PIMPL是PointertoIMPLementation的缩写，意思是指......
IDEA项目名称后面出现中括号，模块Modules的名子和文件夹名称不同，可以右键修改名称也可
IDEA项目名称后面出现中括号，Modules的名子和文件夹名称不同，可以右键修改名称也可以在File->ProjectStructure修改Modules的Name(快捷键ctrl+Shift+Alt+s)Project中出现中括号如：原因：Modules的名子和文件夹名称不同解决主要是通过修改名称一致就可以可以右键修改名称也可......
AQS源码解析
AQS结构特性内部包含Node、ConditionObject静态内部类，Node用来存储没竞争到锁的线程状态、CondidtionObject是对条件变量的封装；volatileintstate变量记录锁的状态，1表示锁被持有、0表示锁被释放，同时对应三个方法来更改/获取锁的状态：getState()、setState(intnewState......
从零开始的源码搭建：详解连锁餐饮行业中的点餐小程序开发
时下，点餐小程序成为了许多餐饮企业引入的一种创新工具，不仅方便了顾客的用餐体验，同时也提高了餐厅的运营效率。本文将详细探讨如何从零开始搭建一个源码，并深入解析连锁餐饮行业中的点餐小程序开发过程。一、需求分析与规划在开始源码搭建之前，首先需要明确点餐小程序的具体需求。这......
源码开发实战：连锁餐饮数字化转型中的点餐小程序
如今，商家通过引入点餐小程序，不仅可以提高服务速度，还能够增加用户粘性，实现数字化运营的目标。为了实现这一愿景，源码开发成为一种高效的手段。一、技术选型在开发点餐小程序时，选择合适的技术是关键一环，结合小程序开发框架，实现了前后端分离，提高了开发效率。此外，数据库采用了高性能的......
Android 14 新特性代码 UUID.fromString & Matcher.matches 的细节改动（扒源码）
文章目录前言UUID处理的更改正则表达式的更改结束前言Android14已经出来好久好久了…今天其他的暂且不论，单纯的讲一下OpenJDK17更新的两点变更（扒源代码）~对正则表达式的更改UUID处理首先，正则表达式的更改：现在，为了更严格地遵循OpenJDK的语义，不允许无效的组引用。您可能会......