代码实现的开源地址:
https://openi.pcl.ac.cn/devilmaycry812839668/SyncVectorEnv
这个代码的实现就是对强化学习(on-line)进行并行采样的一种实现的扩展,相关类似的实现在gym中也有,可以参考:
https://gymnasium.farama.org/introduction/speed_up_env/
https://gymnasium.farama.org/tutorials/gymnasium_basics/vector_envs_tutorial/
强化学习(在线强化学习,on-line reinforcement leanring)算法在训练时需要对环境样本进行采样,传统方式采样单进程的非并行采样方式,其采样效率较低,为解决该问题本项目的实现采用同步并行采样的方式,可以大大提高在线强化学习的采样效率。
标签:采样,SynVectorEnv,并行,gymnasium,学习,https,强化 From: https://www.cnblogs.com/xyz/p/18649747