还是需要学习如何自定义一个可以交互的环境,走上标准的道路,才能调用很多东西。
摸清楚套路,然后一步一步跟着实现。Just get close to your aim!
这次的环境搭建主要模仿参考链接1,
前言
稍微看了一下,只要定义好自己的名字,有对应的函数实现,自己在gym库里边的__init__.py中注册就可以调用了。
【希望实际操作起来和我想的差不多】
注册了的环境,可以通过向gym的通用接口写入环境名创建。除了环境名和接口两个基本信息外,奖励阈值和最大步长则是与训练相关的参数,还可以自行添加其他参数。
实践
不得不说,真的很久没有跟着教程就能完成的代码了。经验证,代码可用。真是皆大欢喜啊!
给了迷茫的我一点动力。
大家直接看参考链接就可以啦!
参考链接
- 【强化学习实战:自定义Gym环境】https://www.cnblogs.com/wsy950409/p/15645049.html