首页 > 其他分享 >RL 基础:如何搭建自定义 gym 环境

RL 基础:如何搭建自定义 gym 环境

时间:2023-03-03 11:12:57浏览次数:64  
标签:observation 自定义 space gym 环境 RL self

需实现的方法:

  • __init__(self):
    • 需定义 action_space 和 observation_space,使用 space.Box 之类来表示(from gym import spaces)。
  • step(self, action):
    • 返回
      • observation (object) 。
      • reward (float) 。
      • done (bool):当前 episode 是否结束。
      • info (dict):其他信息。
    • 输出值(如 observation)最好是 np.ndarray。
  • reset(self):reset 整个环境,返回 observation。

有用的教程:

标签:observation,自定义,space,gym,环境,RL,self
From: https://www.cnblogs.com/moonout/p/17174833.html

相关文章

  • delphi 自定义cxGrid的导航面板
    效果图  面板设置:1.把导航面板显示出来:Navigator.visible:=true 2.在Navigator-Buttons下设置自己需要显示或者隐藏的按钮  3.添加自定义按钮  双......
  • 苹果手机如何自定义手机铃声和闹钟铃声?
    受够了Iphone自带铃声,需要自定义手机铃声或者闹钟铃声的指导文章。本文以QQ音乐为例设置,其它音乐软件设置类似。设置铃声选择喜欢的歌曲,在更多设置中找到“设置铃声”,......
  • Less 安装和hello world
    本文提供了LESS安装的步骤过程。 LESS的系统要求操作系统:跨平台浏览器支持: IE(InternetExplorer8+),Firefox,GoogleChrome,Safari。 安装LESS步骤(1):我......
  • 获取Url后面参数JS工具
    getQueryString(name){letparameters=location.href.split('?')[location.href.split('?').length-1];letaps=parameters.split('&');......
  • echarts自定义展示tooltip功能
    效果如图:      //得分趋势图rollCoolW021Option:{tooltip:{show:true,trigger:'axis',axisPointer......
  • uniapp 自定义 picker
    前言我们在开发的过程中经常会遇到现有插件无法满足需求的情况,毕竟不是组件库不能满足项目所有需求,这时就需要我们自己去构建组件。写这篇博文也是记录我平时开发的,以后......
  • 【http】url的格式
    ┌─────────────────────────────────────────────────────────────────────────────......
  • 自定义方法
    Array自带方法的实现Array.flatconstarray1=[1,2,3,4,[5,6],[7,[8,9]]];functionflat(list){returnlist.reduce((pre,next)=>pre.concat(Array.i......
  • Serverless 时代开启,云计算进入业务创新主战场
    作者:于洪涛“我们希望让用户做得更少而收获更多,通过Serverless化,让企业使用云服务像用电一样简单。”Serverless化正在成为全新的软件研发范式,阿里云将坚定推进核心......
  • Serverless 时代开启,云计算进入业务创新主战场
    作者:于洪涛“我们希望让用户做得更少而收获更多,通过Serverless化,让企业使用云服务像用电一样简单。”Serverless化正在成为全新的软件研发范式,阿里云将坚定推进核心产品......