• 2025-01-03强化学习:手动实现一个并行环境采样的代码 —— SynVectorEnv
    代码实现的开源地址:https://openi.pcl.ac.cn/devilmaycry812839668/SyncVectorEnv这个代码的实现就是对强化学习(on-line)进行并行采样的一种实现的扩展,相关类似的实现在gym中也有,可以参考:https://gymnasium.farama.org/introduction/speed_up_env/https://gymnasium.faram
  • 2024-11-2905.方法
    方法定义方法只包含于类和对象中一个方法只完成一个功能,方便后期拓展。修饰符返回值类型方法名(参数类型参数名){...方法体...return返回值;}值传递值传递(passbyvalue):在调用函数时,将实际参数复制一份传递到函数中,这样在函数中对参数进行修改,就不会影响到原来的
  • 2024-08-11mujoco gymnasium 环境
    本文简要介绍gynasium中基于mujoco的环境搭建。参照gynasium.envs.mujoco。1.gynasium.Env简介在gynasium中,环境基类为gynasium.Env,其中定义了step,reset,render,close等方法以及action_space,observation_space,reward_range,spec,metadata,np_random