首页 > 其他分享 >补充:关于GRU的详细运作原理以及特殊的优化思路

补充:关于GRU的详细运作原理以及特殊的优化思路

时间:2024-08-05 13:24:44浏览次数:14  
标签:GRU tanh 重置 运作 ht gate 思路 门控

1. GRU的基本结构和运作原理

1.1 GRU的基本概念

Gated Recurrent Unit (GRU) 是一种简化版的循环神经网络 (RNN),它通过引入门控机制来解决长期依赖问题,同时减少参数数量以降低计算复杂度。

1.2 GRU的结构详解

GRU 包含两个门控机制:更新门 (update gate) 和重置门 (reset gate)。

  • 重置门 (r_t): 控制当前时刻的输入与前一时刻的状态如何混合。
  • 更新门 (z_t): 控制多少旧状态信息被保留到下一个状态。

这些门控信号是通过 sigmoid 函数生成的,值域在 [0, 1] 之间。

1.3 公式详解

  1. 重置门: r t = σ ( W r x t + U r h t − 1 + b r ) r_t = \sigma(W_r x_t + U_r h_{t-1} + b_r) rt​=σ(Wr​xt​+Ur​ht−1​+br​)
  2. 更新门: z t = σ ( W z x t + U z h t − 1 + b z ) z_t = \sigma(W_z x_t + U_z h_{t-1} + b_z) zt​=σ(Wz​xt​+Uz​ht−1​+bz​)
  3. 候选隐藏状态: h ~ t = tanh ⁡ ( W h x t + U h ( r t ∘ h t − 1 ) + b h ) \tilde{h}_t = \tanh(W_h x_t + U_h (r_t \circ h_{t-1}) + b_h) h~t​=tanh(W

标签:GRU,tanh,重置,运作,ht,gate,思路,门控
From: https://blog.csdn.net/weixin_65502565/article/details/140924204

相关文章

  • 生产(线上)问题排查思路
    目录题外话线上问题应急的原则1.首先第一时间恢复系统2.尽量保留现场和数据3.处理和决断要快速问题排查思路梳理1.首先确定接口2.前后端兵分两路排查2.1前端:2.1.1是否有代码变更,检查变更逻辑是否正确2.1.2字段是否用错2.1.3是否有缓存(应用缓存/cdn缓存)2.1.4是......
  • 【全网首发】2024华数杯数学建模ABC题选题分析+解题思路代码+成品论文更新
    建议选哪道题?A题特点:数理分析题目此题难度较大与国赛难度较为贴近B题特点B题以运筹学/网络科学,图论、优化问题为主,涉及到的概念多,对基础要求较高,不建议优先选择。常用MATLAB函数例如toposort(有向无环图的拓扑顺序)、isomorphism(计算两个图之间的同构)、centrality(衡量节点......
  • 2024年电赛H题--自动行驶小车思路分享
    题目第一问:按照题目要求,小车从A点走到B点,实际上就是走固定直线,可以衍生出以下几种方案,声光提示想必大家都会,这里不做赘述方案一:速度环+位置环原理:利用速度环来控制两个轮子编码器数值(速度)一致,因此可以控制小车方向,利用位置环控制小车路程长短,使小车移动固定距离,但此方案属......
  • 【leetcode详解】另一棵树的子树 (C++递归:思路精析&& 过程反思)
    思路详解:总体框架:对root树进行先序遍历,如果当前结点(记为cur)的值和subRoot的根节点值相等时,就开始判断 以cur为根节点的树和子树是否结构一样?如何判断两棵树是否结构完全相同?分析:一提到“树”结构,很容易想到在(先/中/后序)遍历上做文章,请教了AI后笔者得知,如果两棵树......
  • CTFSHOW 萌新 web9 解题思路和方法(利用system函数执行系统命令)
    点击题目链接,从题目页面显示的代码中可以看到我们可以使用命令执行漏洞查看网站的文件:我们首先使用system函数并使用ls命令查看当前目录下的所有文件:因为题目中提示flag在config.php文件中,所有可以直接读取该文件当然,如果题目中没有说明falg在那个文件中,我们可以使用......
  • CTFSHOW 萌新 web10 解题思路和方法(passthru执行命令)
    点击题目链接,分析页面代码。发现代码中过滤了system、exec函数,这意味着我们不能通过system(cmd命令)、exec(cmd命令)的方式运行命令。在命令执行中,常用的命令执行函数有:system(cmd_code);exec(cmd_code);shell_exec(cmd_code);passthru(cmd_code);可以发现,passthru未被过滤,......
  • 灰狼优化算法(GWO)与门控循环单元(GRU)结合的预测模型(GWO-GRU)及其Python和MATLAB实现
    ####一、背景深度学习已成为解决复杂时序数据预测问题的重要工具。在众多神经网络架构中,门控循环单元(GatedRecurrentUnit,GRU)凭借其在捕捉时间序列数据中的长程依赖性和相对较低的计算复杂度而受到广泛关注。此外,优化算法在深度学习模型的训练中扮演着至关重要的角色。灰......
  • 【leetcode详解】正方形中的最多点数【中等】(C++思路精析)
    思路精析:自定义结构体解读:一个点是否在题给正方形中,只取决于其横纵坐标的最大值,记为dis沟通二位数组points和字符串s的桥梁,就是这个点的序号,记为idx由此自定义结构体,储存dis和idx//其中booloperator部分的功能:重载小于操作符“<”,使sort(vc.begin(),vc.end());按dis......
  • 门控循环单元GRU
    目录一、GRU提出的背景:1.RNN存在的问题:2.GRU的思想:二、更新门和重置门:三、GRU网络架构:1.更新门和重置门如何发挥作用:1.1候选隐藏状态H~t:1.2隐藏状态Ht:2.GRU:四、训练过程举例******:五、预测过程举例******:六、底层源码:七、Pytorch版代码:一、GRU提出的背景:1.RNN存......
  • 深圳航空顶象验证码逆向,和百度验证码训练思路
    ​声明(lianxia15018601872)本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 前言(lianxia15018601872)试了一天的百度验证码训练,下载ps一个个图来转。一......