• 2024-12-21强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector)(续)
    前文:强化学习算法中的log_det_jacobian——概率分布的仿射变换(Bijector)前文说到概率分布的仿射变换(Bijector)在贝叶斯、变分推断等领域有很重要的作用,但是在强化学习中呢,其实在强化学习中也会用到,但是最为普遍的应用场景其实只是做简单的tanh变换。在强化学习中一般用高斯分
  • 2024-12-21强化学习算法中的log_det_jacobian
    相关:https://colab.research.google.com/github/google/brax/blob/main/notebooks/training_torch.ipynb之前写过一篇同主题的文章,后来发现这个文章中有一些问题,不过也有些不好改动,于是就新开一篇来进行更正和补充!!!之前版本:https://www.cnblogs.com/xyz/p/18564777之所以之
  • 2024-11-23强化学习算法中log_det_jacobian的影响是否需要考虑
    相关:人形机器人-强化学习算法-PPO算法的实现细节是否会对算法性能有大的影响.https://openi.pcl.ac.cn/devilmaycry812839668/google_brax_ppo_pytorchlog_det_jacobian是什么,我也是头一次遇到,百度了一下,没有答案,Google了一下也没有答案,虽然在TensorFlow的help文档中看到了