首页 > 其他分享 >以pytorch的forward hook为例探究hook机制

以pytorch的forward hook为例探究hook机制

时间:2024-10-09 18:43:51浏览次数:15  
标签:handle 为例 hooks self hook pytorch forward id

在看pytorch的nn.Module部分的源码的时候,看到了一堆"钩子",也就是hook,然后去研究了一下这是啥玩意。

基本概念

在深度学习中,hook 是一种可以在模型的不同阶段插入自定义代码的机制。通过自定义数据在通过模型的特定层的额外行为,可以用来监控状态,协助调试,获得中间结果。

以前向hook为例

前向hook是模型在forward过程中会调用的hook,通过torch.nn.Module的register_forward_hook() 函数,将一个自定义的hook函数注册给模型的一个层
该层在进行前向之后,根据其输入和输出会进行相应的行为。


import torch
import torch.nn as nn

# 定义模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(10, 5)
        self.fc2 = nn.Linear(5, 2)

    def forward(self, x):
        x = self.fc1(x)
        return self.fc2(x)

model = SimpleModel()

# 自定义的forward hook
def my_forward_hook(module, input, output):
    print(f"层: {module}")
    print(f"输入: {input}")
    print(f"输出: {output}")


# 为模型的fc1层注册hook
hook = model.fc1.register_forward_hook(my_forward_hook)

# 移除这个hook
hook.remove()

接口

hook函数的格式

需要是一个接受三个特定参数,返回None的函数

def hook_function(module, input, output):
    # 自定义逻辑
    return None
  • module: 触发钩子的模型层,事实上是调用register_forward_hook的nn.Module实例
  • input: 传递给该层的输入张量(可能是元组),是前向传播时该层接收到的输入。
  • output: 该层的输出张量,是前向传播时该层生成的输出。
    函数内部可以做自定义行为,可以在函数内部对output进行修改,从而改变模型的输出。

注册hook

hook = model.fc1.register_forward_hook(my_forward_hook)

hook.remove()

对于定义好的hook函数,将其作为参数,调用需要注册的模型层的注册函数即可。
如果不再需要这个hook,调用remove函数。

简单的源码讨论

还是以forward hook为例。一个nn.Module具有成员_forward_hooks,这是一个有序字典,在__init__()函数调用的时候被初始化

self._forward_hooks = OrderedDict()

注册钩子的register函数。
每个hook对应一个RemovableHandle对象,以其id作为键注册到hook字典中,利用其remove函数实现移除。

def register_forward_hook(
        self,
        hook: Union[
            Callable[[T, Tuple[Any, ...], Any], Optional[Any]],
            Callable[[T, Tuple[Any, ...], Dict[str, Any], Any], Optional[Any]],
        ],
        *,
        prepend: bool = False,
        with_kwargs: bool = False,
        always_call: bool = False,
    ) -> RemovableHandle:
        handle = RemovableHandle(
            self._forward_hooks,
            extra_dict=[
                self._forward_hooks_with_kwargs,
                self._forward_hooks_always_called,
            ],
        )
        self._forward_hooks[handle.id] = hook
        if with_kwargs:
            self._forward_hooks_with_kwargs[handle.id] = True
        if always_call:
            self._forward_hooks_always_called[handle.id] = True
        if prepend:
            self._forward_hooks.move_to_end(handle.id, last=False)  # type: ignore[attr-defined]
        return handle

#简化版的handle类
class RemovableHandle:
    def __init__(self, hooks_dict, handle_id):
        self.hooks_dict = hooks_dict
        self.id = handle_id

    def remove(self):
        del self.hooks_dict[self.id]

标签:handle,为例,hooks,self,hook,pytorch,forward,id
From: https://www.cnblogs.com/NiaxHahaha/p/18453732

相关文章

  • 20天吃掉那只PyTorch:深入浅出的PyTorch入门教程
    eat_pytorch_in_20_days《20天吃掉那只PyTorch》是一本面向PyTorch初学者的开源教程,旨在帮助读者在20天内快速掌握PyTorch的核心概念和使用方法。本教程的主要特点包括:面向有一定机器学习和深度学习基础的读者,假定读者使用过Keras、TensorFlow或PyTorch搭建过简单模型。采用......
  • SSD: PyTorch中的单发多框目标检测器实现
    SSD:PyTorch中的单发多框目标检测器实现SSD(SingleShotMultiBoxDetector)是一种高效的单阶段目标检测算法,由WeiLiu等人在2016年提出。本文将详细介绍SSD算法的PyTorch实现,包括其原理、网络结构、训练过程以及性能表现。SSD算法简介SSD是一种单阶段目标检测算法,它直接......
  • 基于yolov10的花卉识别检测,支持图像、视频和摄像实时检测【pytorch框架、python】
    更多目标检测和图像分类识别项目可看我主页其他文章功能演示:基于yolov10的花卉识别检测系统,支持图像、视频和摄像实时检测【pytorch框架、python】_哔哩哔哩_bilibili(一)简介基于yolov10的花卉识别检测系统是在pytorch框架下实现的,这是一个完整的项目,包括代码,数据集,训练好的......
  • (22)以RS码为例说明信道编码AWGN信道的Eb/N0设置
    文章目录前言一、编码Eb/N0与未编码Eb/N0及编码码率二、仿真代码三、仿真结果前言本文说明了如何为采用信道编码的通信链路设置Eb/N0(比特能量与噪声功率谱密度比)。一、编码Eb/N0与未编码Eb/N0及编码码率在通信系统仿真中,如果采用了FEC编码,则在设置AWGN信道Eb/N0......
  • Pytorch-Transformer轴承故障一维信号分类(三)
    往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了!Python轴承故障诊断(一)短时傅里叶变换STFT-CSDN博客Pyth......
  • 风速预测(六)基于Pytorch的EMD-CNN-GRU并行模型
    往期精彩内容:时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较全是干货|数据集、学习资料、建模资源分享!拒绝信息泄露!VMD滚动分解+Informer-BiLSTM并行预测模型-CSDN博客风速预测(一)数据集介绍和预处理_风速数据在哪里下载-CSDN博客风速预测(二)基于Pytorch......