首页 > 其他分享 >梯度回归三步走

梯度回归三步走

时间:2024-07-26 14:30:54浏览次数:14  
标签:loss optimizer 三步走 回归 step 参数 梯度 grad

模型训练的每个周期内我们会碰到以下固定的代码逻辑组合:

    optimizer.no_grad()
    loss.backward()
    optimizer.step()

他们的作用分别为:

  • optimizer.no_grad(): 清空上一轮训练留下来的梯度值。
    每一轮梯度训练过程中,针对模型的参数集,都会生成相应的梯度x.grad, 如果不显式清零,这些值会在后续梯度计算中累积。参考这里可以帮助理解累积过程:https://zhuanlan.zhihu.com/p/648538040

  • loss.backward():计算预测值附近的梯度值,保存到x.grad中。参考:https://zhuanlan.zhihu.com/p/648538040
    具体来说,loss.backward() 的作用是对损失函数进行求导,得到每个模型参数关于损失函数的梯度。这个梯度可以表示模型参数在当前状态下对损失函数的贡献大小和方向,即参数更新的方向和大小。

    计算公式为:

  • optimizer.step():执行一次优化步骤,通过梯度下降法来更新参数的值。因为梯度下降是基于梯度的,所以在执行optimizer.step()函数前应先执行loss.backward()函数来计算梯度。
    具体来说,optimizer.step() 根据优化算法的规则,将梯度应用于网络参数。例如,常用的优化算法如 Adam、SGD 等,都有自己的更新规则,optimizer.step() 会按照相应的规则更新网络参数的值。更新后的参数将被用于下一次的前向传递计算和反向传播计算。

    更新公式:

参考:https://blog.csdn.net/PanYHHH/article/details/107361827

标签:loss,optimizer,三步走,回归,step,参数,梯度,grad
From: https://www.cnblogs.com/zongzw/p/18325283

相关文章

  • 最新版《广东省优质中小企业梯度培育管理实施细则》有哪些调整
    广东省工业和信息化厅于2024年7月23日印发了最新版《广东省优质中小企业梯度培育管理实施细则》,2024年8月20日起正式实施。跟华夏泰科一起来看看最新版的《广东省优质中小企业梯度培育管理实施细则》跟《广东省优质中小企业梯度培育管理实施细则(试行)》(粤工信规字〔2022〕3号......
  • 精简模型,提升效能:线性回归中的特征选择技巧
    在本文中,我们将探讨各种特征选择方法和技术,用以在保持模型评分可接受的情况下减少特征数量。通过减少噪声和冗余信息,模型可以更快地处理,并减少复杂性。我们将使用所有特征作为基础模型。然后将执行各种特征选择技术,以确定保留和删除的最佳特征,同时不显著牺牲评分(R2分数)。使用的......
  • 我在训练随机森林回归器时不断遇到这个问题
    /usr/local/lib/python3.10/dist-packages/sklearn/base.py:432:UserWarning:X有特征名称,但RandomForestRegressor的安装没有特征名称warnings.warn(我尝试添加.values但它仍然标记一个错误。这个警告信息表明你输入到RandomForestRegressor的数据X......
  • 挑战房市预测领头羊:KNN vs. 决策树 vs. 线性回归
    挑战房市预测领头羊(KNN,决策树,线性回归)1.介绍1.1K最近邻(KNN):与邻居的友谊1.1.1KNN的基础1.1.2KNN的运作机制1.1.3KNN的优缺点1.2决策树:解码房价的逻辑树1.2.1决策树的基础1.2.2决策树的构建1.2.3决策树的优缺点1.3线性回归:简单而高效的预测工具1.3.1线性回归......
  • JCR一区级 | Matlab实现GJO-Transformer-LSTM多变量回归预测
    JCR一区级|Matlab实现GJO-Transformer-LSTM多变量回归预测目录JCR一区级|Matlab实现GJO-Transformer-LSTM多变量回归预测效果一览基本介绍程序设计参考资料效果一览基本介绍1.【JCR一区级】Matlab实现GJO-Transformer-LSTM多变量回归预测,金豹算法(GJO)优......
  • 机器学习 | 回归算法原理——多项式回归
    Hi,大家好,我是半亩花海。接着上次的最速下降法(梯度下降法)继续更新《白话机器学习的数学》这本书的学习笔记,在此分享多项式回归这一回归算法原理。本章的回归算法原理基于《基于广告费预测点击量》项目,欢迎大家交流学习!目录一、多项式回归概述二、案例分析1.设置问题2.......
  • 梯度方法求解最优投资组合问题 (二次规划问题)
    优化程序分析师的目标是帮助投资者“做最好的事”。他们的共同目标应该是制定一套投资策略,为投资者提供最大可能的效用。在某些情况下,这可以形式化为一个涉及目标函数最大化的问题(例如投资者的投资组合的效用),该问题受到一个或多个约束(例如投资者的财富水平所施加的约束)。在投......
  • 应用数学与机器学习基础 - 数值计算之梯度之上Jacobian和Hessian矩阵篇
    序言在数值计算与优化理论的广阔天地里,梯度作为一阶导数的向量表示,是理解函数局部变化率及进行最优化求解的基础工具。然而,当问题的复杂度提升,单一梯度信息往往不足以全面刻画函数的多变量间相互作用及更高阶的变化特性。此时,Jaco......
  • Groupby 以及变换和回归
    我试图从简单的回归中获得残差。此回归按每个年份和组进行。这就是我所做的。但是,有没有办法将残差作为新列与原始数据帧一起获取?df=pd.DataFrame({'Name':['a','b','c','d','e','a','b','c','d','e','a',&......