首页 > 其他分享 >强化学习理论-第6课-随机近似与随机梯度下降

强化学习理论-第6课-随机近似与随机梯度下降

时间:2024-12-05 11:35:48浏览次数:3  
标签:采样 梯度 近似 算法 随机 RM SGD

6.1 motivating example : mean estimation

  1. 采样足够多进行平均
  2. 迭代求平均:
    \(w_{k+1} = w_k - \frac{1}{k} (w_k - x_k)\)

6.2 Robbins-Monro algorithm

RM算法的优点是:不需要知道方程表达式,也不需要知道梯度信息啥的。随机梯度算法是RM算法的一种特殊情况。
求根问题:

RM算法求解:

RM算法收敛的条件:

  • 条件1:g(w)的梯度有限而且为正,这点很多函数都不满足
  • 条件2:\(a_k\)最后一定要收敛到零,而且不能收敛的太快,常用一个非常小的常数
  • 条件3:\(\eta\) 的mean为零,而且方差有界,不要求高斯噪音

6.3 Stochastic gradient descent

SGD是为了求解一个最优问题:
$\min_w J(w) = E[f(w,x)] $

1. example:


SGD是将GD算法中的true gradient 换成了stochastic gradient,那会不会造成梯度的不稳定呢?下面是证明:


如果\(w_k - w^*\)比较大的时候,SGD和GD的性质很像,比较小的时候,确实会产生一些随机项

6.4 BGD, MBGD, SGD:

BGD:需要所有采样数据;
MBGD:采样一些数据;
SGD:随机采样一个数据,迭代;

标签:采样,梯度,近似,算法,随机,RM,SGD
From: https://www.cnblogs.com/penuel/p/18574202

相关文章

  • 【Leetcode Top 100】138. 随机链表的复制
    问题背景给你一个长度为nnn的链表,每个节点包含一个额外增加的随机指针ra......
  • 接入[一言]的API实现网页随机首页文字
    我用GPT学的:)<?php//使用file_get_contents获取一言的JSON数据$hitokotoJson=file_get_contents('https://v1.hitokoto.cn');//解码JSON数据$hitokotoData=json_decode($hitokotoJson);//检查是否成功获取到数据if($hitokotoData&&isset($hitokotoData->......
  • 如何形象地理解梯度消失—水池模型
    梯度消失本质梯度消失的根本原因是链式法则的反复相乘导致梯度逐渐趋近于零。具体体现在:在反向传播中,梯度通过链式法则计算:这意味着:前面层的参数更新很慢(因为梯度太小)。训练网络时,后面的层学得还不错,但前面的层几乎学不到东西。为什么会产生小于1的值?激活函数的导......
  • 计算公式:求cos(x)的近似值(java)
    【问题描述】给定一个精度值e,用下列公式计算cos(x)的近似值,要求前后两次迭代之差的绝对值小于e,给出相应的最小迭代次数n和最后一次计算的cos(x)值。cos(x)=x0/0!-x2/2!+x4/4!-x6/6!+......+(-1)n&times;x2n/((2n)!)  【输入形式】从控制台输入x( -6.28<=x<=6.28 )和e(......
  • 4.1.1.1 圆近似外形
    usefj_math::{Circle,Point};usecrate::geometry::{traits::GenPolyline,CurveBoundary,Tolerance};///#近似一个圆轮廓//////##论点//////除了一个圆,这个方法还有两个参数://////--圆应该近似的“边界”。///-“公差”,指定允许近似值偏离实际圆的......
  • 随机森林算法:原理、实现与应用
    一、引言在当今的大数据时代,数据挖掘和机器学习技术在各个领域都发挥着至关重要的作用。其中,随机森林算法作为一种强大的机器学习算法,因其出色的性能和广泛的适用性而备受关注。随机森林算法是一种基于决策树的集成学习算法,它通过构建多个决策树并综合它们的结果来进行预测或......
  • 机器学习模型从理论到实战|【005-决策树与随机森林】客户流失预测
    决策树与随机森林:从可解释性到集成方法决策树和随机森林是机器学习中常见的两种算法,它们在分类和回归任务中广泛应用,尤其在处理具有复杂非线性关系的数据时具有显著优势。决策树具有较好的可解释性,而随机森林作为一种集成学习方法,在提高模型准确性和鲁棒性方面表现出色。......
  • 《随机森林在不同领域的璀璨应用:点亮数据驱动的灯塔》
    在当今数据爆炸的时代,随机森林算法以其强大的预测能力和稳健性,在众多领域如同一颗颗闪耀的星辰,照亮了数据分析和决策的道路。一、金融领域:风险评估的精准利器(一)信贷风险预测在银行等金融机构的信贷业务中,准确评估借款人的信用风险至关重要。随机森林可以处理包含借款人年......
  • 随机森林:从原理到实践,解锁机器学习 “神器”
    在机器学习的广袤天地里,随机森林犹如一片神秘而强大的智慧丛林,以其卓越的性能、良好的稳定性和广泛的适用性,成为数据科学家们手中的得力“法宝”。今天,就让我们深入这片“丛林”,探寻随机森林背后的奥秘与魅力。随机森林是什么“物种”?随机森林(RandomForest),从本质上讲,属......
  • 写一个方法从数组中随机抽取N个不重复的元素
    /***从数组中随机抽取N个不重复的元素*@param{Array}arr原数组*@param{number}n要抽取的元素个数*@returns{Array}包含n个不重复元素的新数组,如果n大于数组长度,返回打乱顺序的原数组*/functiongetRandomElements(arr,n){if(n>=arr.length){......