首页 > 其他分享 >强化学习:手动实现一个并行环境采样的代码 —— SynVectorEnv

强化学习:手动实现一个并行环境采样的代码 —— SynVectorEnv

时间:2025-01-03 11:36:06浏览次数:1  
标签:采样 SynVectorEnv 并行 gymnasium 学习 https 强化

代码实现的开源地址:

https://openi.pcl.ac.cn/devilmaycry812839668/SyncVectorEnv


image



这个代码的实现就是对强化学习(on-line)进行并行采样的一种实现的扩展,相关类似的实现在gym中也有,可以参考:


https://gymnasium.farama.org/introduction/speed_up_env/

https://gymnasium.farama.org/tutorials/gymnasium_basics/vector_envs_tutorial/



强化学习(在线强化学习,on-line reinforcement leanring)算法在训练时需要对环境样本进行采样,传统方式采样单进程的非并行采样方式,其采样效率较低,为解决该问题本项目的实现采用同步并行采样的方式,可以大大提高在线强化学习的采样效率。



标签:采样,SynVectorEnv,并行,gymnasium,学习,https,强化
From: https://www.cnblogs.com/xyz/p/18649747

相关文章