HJB方程简述

HJB方程简述

时间：2022-12-18 22:22:06浏览次数：64

标签：方程函数推导如下简述 HJB

参考资料：维基的哈密顿-雅克比-贝尔曼方程条目。有条件的同学可以自行查看，效果比本文要好一些。文末也会给出相关更深入的资料供大家学习。

作为强化学习的一个基础思想，HJB方程从大框架概述了控制优化的方向。这里对其推导与应用进行简述。

定义如下变量：为过程价值函数，其中S(t)为在t时刻的状态函数，A(t)为在t时刻的动作函数。

为在t时刻状态为S(t)的终点值函数。

我们可以定义如下过程：在[0,T]时间段，最终值函数的表现形式如下：

而我们的优化目标就是保证右端公式的最小化。

HJB偏微分形式推导：

考虑如下表达形式：

对右端的进行泰勒展开，可得到以下形式：

与上式联立可消去，然后去除dt，可得如下优化形式：

JCB方程微分形式推导得证。

如何求解：

一般采用逆向归纳法，即从t=T推导至t=0，利用动态规划的思想求解。

HJB方程相关资料：

链接：https://pan.baidu.com/s/1pBom-F4cLqHVA3_u3XSOyA?pwd=4s5e
提取码：4s5e

标签：方程,函数,推导,如下,简述,HJB
From： https://www.cnblogs.com/johnsonstar/p/16991073.html

【221217-1】解方程：6的(a+7)次方=7的(a+6)次方
......
Java同步器简述
一、概述在并发编程领域，有两大核心问题：一个是互斥，即同一时刻只允许一个线程访问共享资源；另一个是同步，即线程之间如何通信、协作。主要原因是，对于多线程实现实现并发，一直以......
简述安装scrapy的方法
今天照着别个的方法安装了下scrapy，把主要步骤记录在这里，方便日后再次安装！1.首先保证已经安装python2.X，我安装的是2.72.easy_install工具安装：下载：http://pypi.python.org/pac......
【机器学习】李宏毅——浅谈机器学习原理+鱼与熊掌兼得的深度学习简述
如何评判一个训练集的好坏如果我们希望得到一个训练集，并且用该训练集所训练出来的模型，在训练集上的误差和在整个数据空间上的误差相距较小，即写成如下表达式：\[L(h^{train}......
常用工具简述 nmcli tmux
nmcli是NetworkManager的客户端，感觉有点象systemd与systemctl工具。nmcli的使用格式为nmcliobjcommand 三部分obj主要、常用的有两个deviceconnectiondevice......
【221213-4】解方程：5x平方+x=x*(5x平方-1)开方+2
......
【221213-3】解方程：(x-6)的立方+(x-7)的平方=3
......
【221213-2】解方程组：(1)(x-6)开方+ (y+5)开方=5 (2)x+y=18
......
字节流简述
字节简述字节概述字节（byte）是计算机用于计量存储容量的一中计量单位。B（字节）KB(千字节)无论网络上两个终端需要传输什么数据，都需要传输二进制bit的数据。既然传输的都是b......
django基础操作简述
django基础操作简述静态文件static文件夹---存一些css，js，img，第三方模块等，也可以再分文件夹如：我们可以要引入本地的bootstrap的css和js文件，那么就可以放在static文件夹......

相关文章

赞助商

阅读排行