首页 > 其他分享 >强化学习如何自定义环境?【写代码的时候如何与标准接轨】

强化学习如何自定义环境?【写代码的时候如何与标准接轨】

时间:2022-12-06 17:45:34浏览次数:70  
标签:接轨 自定义 代码 环境 gym 如何 链接

还是需要学习如何自定义一个可以交互的环境,走上标准的道路,才能调用很多东西。

摸清楚套路,然后一步一步跟着实现。Just get close to your aim!

这次的环境搭建主要模仿参考链接1,

前言

稍微看了一下,只要定义好自己的名字,有对应的函数实现,自己在gym库里边的__init__.py中注册就可以调用了。
【希望实际操作起来和我想的差不多】

注册了的环境,可以通过向gym的通用接口写入环境名创建。除了环境名和接口两个基本信息外,奖励阈值和最大步长则是与训练相关的参数,还可以自行添加其他参数。

实践

不得不说,真的很久没有跟着教程就能完成的代码了。经验证,代码可用。真是皆大欢喜啊!
给了迷茫的我一点动力。
大家直接看参考链接就可以啦!

参考链接

  1. 【强化学习实战:自定义Gym环境】https://www.cnblogs.com/wsy950409/p/15645049.html

标签:接轨,自定义,代码,环境,gym,如何,链接
From: https://www.cnblogs.com/yuyuanliu/p/16927705.html

相关文章

  • 记录--uniapp自定义相机 自定义界面拍照录像闪光灯切换摄像头
    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助因公司业务需要,需要开发水印相机功能,而项目代码用的uniapp框架,App端只能简单调用系统的相机,无法自定义界......
  • 电子邮件漏洞以及 S/MIME 如何提供帮助
    作为连续博客系列的第一篇,本文开始探讨企业和组织可能面临的电子邮件威胁、部署S/MIME技术如何提供帮助,以及保持遵守GDPR和HIPAA等信息安全法规的必要性。随着越来越......
  • 2022-12-06 js 如何正确富文本中的字号
    编辑内容,提交,后端以富文本形式返回,内容假设为 "<p><b><fontsize="7">标题</font></b></p>"我们可以看到里面有一个size="7",对应着富文本里面的字号48px。由此得知,你......
  • 如何按时间周期保存或备份已处理文件?
    在使用知行之桥EDI系统时,经常会遇到根据日期查询某个文件是否已被成功处理的情况,最近运维顾问在处理客户问题时,发现很多客户都有这样的疑问,尤其是业务量较大的客户,那么如何......
  • 电子邮件漏洞以及 S/MIME 如何提供帮助
    作为连续博客系列的第一篇,本文开始探讨企业和组织可能面临的电子邮件威胁、部署S/MIME技术如何提供帮助,以及保持遵守GDPR和HIPAA等信息安全法规的必要性。随着越来......
  • [转]mysql中表设计如何更好的选择数据类型
    原文地址:https://www.modb.pro/db/100714日常工作中我们会接触到不同业务,同样也会设计不同的表,但是你有真正考虑的mysql支持的那些数据类型吗?知道如何根据不同的需求选择......
  • jsdelivr被墙,hexo-next切换为自定义CDN
    1.Next主题需要升级到8.9以上,我的是多少忘记了,最好升级到最新使用npm管理gitclonehttps://github.com/next-theme/hexo-theme-nextthemes/next2.替换链接官方......
  • vue3 input 控制小数位 自定义指令
    创建文件 globalindex.ts main.ts文件引入importglobalfrom"@/global";app.use(global)index.ts    内容import{App}from"vue";exportdefaul......
  • 在django如何给CBV添加装饰器?
    在Django中,给CBV添加装饰器有几种方式?在类视图中使用为函数视图准备的装饰器时,不能直接添加装饰器,需要使用method_decorator将其转换为适用于类视图方法的装饰器。method......
  • 项目中如何安装同一依赖的两个版本
    背景如项目中有一个1.0版本的antd库,我们不得已必须使用更高版本的antd方案我们可以使用npm的别名,安装不同版本的库如://安装npminstallantd-v3@npm:[email protected]......