首页 > 其他分享 >DRL数学基础 | 01 随机变量及数学期望

DRL数学基础 | 01 随机变量及数学期望

时间:2023-01-09 15:42:59浏览次数:41  
标签:01 公式 学习 数学 DRL 深度 强化 随机变量



导读



深度强化学习是近几年比较热门的技术,也是被很多大牛看做是实现真正的人工智能的最理想的工具。


深度强化学习用到很多数学概念,为了帮助大家更好地学习深度强化学习,我们同步更新深度强化学习必要的数学基础。在这里我们会给出每一个数学概念的简单理解,数学表达,相关公式、重要性质等


因为不是讲数学专业的基础,所以不会涉及严格的数学证明,难度不会很大,仅是为了帮助大家更快更好理解未来深度强化学习中的公式


最后也会总结所有讲到的公式符号,便于大家查阅


今天我们要讲的是概率论中的随机变量、随机变量的概率分布和数学期望


接下来让我们一起走进今天的文章吧!


DRL数学基础 | 01 随机变量及数学期望_概率密度函数


1

随机变量


1、随机变量

DRL数学基础 | 01 随机变量及数学期望_概率分布_02


2、离散型随机变量与概率质量函数


DRL数学基础 | 01 随机变量及数学期望_取值_03

DRL数学基础 | 01 随机变量及数学期望_取值_04



DRL数学基础 | 01 随机变量及数学期望_概率密度函数_05


连续型随机变量的概率密度函数要满足:


DRL数学基础 | 01 随机变量及数学期望_概率密度函数_06

2

分布函数

DRL数学基础 | 01 随机变量及数学期望_概率密度函数_07


DRL数学基础 | 01 随机变量及数学期望_概率密度函数_08

DRL数学基础 | 01 随机变量及数学期望_取值_09

DRL数学基础 | 01 随机变量及数学期望_概率分布_10

标签:01,公式,学习,数学,DRL,深度,强化,随机变量
From: https://blog.51cto.com/u_12001271/5997264

相关文章

  • 【卷积神经网络】01 卷积神经网络简介
    戳一戳!和我一起走进深度学习的世界导读深度学习发展已久,我们经常听到别人说神经网络,如果做计算机视觉,我们也会经常听到别人说卷积神经网络。今天要分享这篇文章带我们一起了......
  • P4654 [CEOI2017] Mousetrap
    \(\mathcalLink\)为了方便,以目标为根,向深度浅的位置走为“向上走”,否则为“向下走”。考虑到老鼠一旦开始向下走,它就一定会一直向下,直到走到叶子或者唯一向下的路被堵住......
  • 【2023.01.08】NUC9I9安装PVE7.3和OpenWrt,WinServer
    前面的教程可以看:【2022.11.17】N5105安装PVE系统,关联proxmox-Mokou-博客园(cnblogs.com)本文主要做一个备注,方便以后查阅同时改路由器将作为一个旁路由使用,不作为......
  • 如何学好数学?
    如何学好数学?如何学好数学呢?我们首先来看几道题,你就会发现的。例1:16-9=?好的,我们来计算一下这个算式,首先,我们列竖式来看看,$16-9$,首先先看个位$6-9$,不够......
  • WC 2018 题解
    A若干套路拼起来的胖题。设这三棵树分别是\(T_1,T_2,T_3\)。沿用“CTSC2017暴力写挂”的思路,对第一棵树点分治,此时要处理的是以\(u\)为中心的一块在\(T_1\)上的连......
  • C语言员工销售统计及奖金发放系统[2023-01-09]
    C语言员工销售统计及奖金发放系统[2023-01-09]课题3:员工销售统计及奖金发放系统程序设计功能及要求:(1)总人数不定,开始先输入员工的人数及工号进行初始化,数据使用文......
  • 01notepad++如何比较两个文件内容
    下面介绍,通过在NotePad中下载安装Compare插件,可以比较两个文件内容。(推荐学习:notepad++)打开NotePad,点击工具栏上的【插件】–》PluginManager—》ShowPluginManage......
  • 前后端分离开发模式下的接口测试工具推荐|第1万01次卸载postman , 我要用eolink
    ❤️作者主页:​​微凉秋意​​✅作者简介:后端领域优质创作者......
  • 0801安卓就业班毕业后
    1.1.代码练习提速学员学习的时候只是有一两行代码有问题造成整个程序跑不起来,这一两行学员要找很久为了提高效率现在推荐大家使用一款软件 Be......
  • struts2_day01
    Struts2第一天Struts2的学习路线1.Struts2的入门:主要是学习Struts2的开发流程(Struts2的开发流程、常见的配置、Action类的编写)2.Struts2的Servlet的API、参数封装和拦截器......