导读
深度强化学习是近几年比较热门的技术,也是被很多大牛看做是实现真正的人工智能的最理想的工具。
深度强化学习用到很多数学概念,为了帮助大家更好地学习深度强化学习,我们同步更新深度强化学习必要的数学基础。在这里我们会给出每一个数学概念的简单理解,数学表达,相关公式、重要性质等。
因为不是讲数学专业的基础,所以不会涉及严格的数学证明,难度不会很大,仅是为了帮助大家更快更好理解未来深度强化学习中的公式。
最后也会总结所有讲到的公式符号,便于大家查阅。
今天我们要讲的是概率论中的随机变量、随机变量的概率分布和数学期望。
接下来让我们一起走进今天的文章吧!
1
随机变量
1、随机变量
2、离散型随机变量与概率质量函数
连续型随机变量的概率密度函数要满足:
2
分布函数