python语言下的迷宫游戏的实现猜想

时间：2024-02-04 11:32:20浏览次数：34

标签：猜想 python 白格迷宫黑格 AI maze 环境

由于本人是研究AI的，尤其是AI的强化学习方向，有时候就会对一些小游戏环境的实现有几分兴趣，因为刚看了有关reinforcement learning解决maze游戏的论文，于是就突发奇想的对这个maze迷宫的实现有些想了解了。

迷宫其实就是在一个表格上画线，然后构成的从某点到另一个点的一个通路的环境：

python语言下的迷宫游戏的实现猜想_强化学习

具体的迷宫的样子：

python语言下的迷宫游戏的实现猜想_强化学习_02

我们可以用一个0、1组成的二维矩阵来表示一个类似上图的迷宫环境：

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 0 1 0 0 0 1 0 0 1 0 1 1 0 0 0 0 0 0 1

1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 1 1

1 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1

1 0 1 0 1 1 1 1 0 0 0 1 0 1 0 1 0 1 0 1

1 0 1 0 1 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1

1 0 1 0 0 0 1 1 1 1 0 1 1 0 1 0 1 0 0 1

1 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1

1 0 1 1 1 0 1 0 0 1 1 1 0 0 1 0 1 0 1 1

1 0 1 0 0 0 1 1 0 0 0 1 0 1 1 0 1 1 1 1

1 0 1 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1

1 0 1 0 1 0 1 1 0 0 1 0 0 0 1 1 1 0 0 1

1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1

1 0 1 0 1 1 1 1 0 1 0 1 1 0 1 0 1 1 1 1

1 0 1 0 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 1

1 0 1 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 1 1

1 0 0 0 1 0 1 1 1 1 0 1 0 0 1 0 1 0 1 1

1 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 1 0 0 1

1 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

其中，我们可以把1当做是黑格，而0视作为白格，黑格我们认为是不可以通行的地方，也就是迷宫的墙壁，而白格则为可通行的地方。

标签：猜想,python,白格,迷宫,黑格,AI,maze,环境
From： https://blog.51cto.com/u_15642578/9580900

pyqt报错、python报错：src/pyaudio/device_api.c:9:10: fatal error: portaudio.h: 没
报错信息：-DNDEBUG-fwrapv-O2-Wall-fPIC-O2-isystem/home/devil/anaconda3/envs/91/include-fPIC-O2-isystem/home/devil/anaconda3/envs/91/include-fPIC-I/usr/local/include-I/usr/include-I/home/devil/anaconda3/envs/91/include/python3.10-csrc/pyaudio/d......
如何绕过Python readline的Tab-补全
在Python中，readline模块提供了一个交互式的命令行输入接口，其中的Tab补全是指用户在输入时按下Tab键，系统会自动尝试完成当前输入的命令或路径。Tab补全的主要功能是帮助用户更快速、更准确地输入命令或路径，尤其是当有很多可能的选项时。下面我将用详细的步骤来说明Tab补全......
python操作yaml
补充：yaml语法详见：yaml语法 yaml应用场景1、保存自动化测试数据2、保存自动化测试中的关联数据安装yaml模块pipinstallpyyaml==5.4.1 读取yaml数据读取数据：load()或者full_load()，返回一个对象用例数据：case.yaml-caseId:1apiName:registerdescribe:注册url:......
系统环境变量，python包导入的路径搜索机制，PYTHONPATH，sys.path
系统环境变量的定义通过在环境变量里面加入所有软件的安装路径，当我们想运行某一软件时双击其快捷方式，此时，计算机除了在其当前目录下寻找该软件的.exe文件外（windows系统），还会在环境变量中搜索软件的路径，找到，运行。综上，Windows中的环境变量，当要求系统运行一个程序而没有告诉它程序......
Python 基于pymongo操作Mongodb学习总结
实践环境Python3.6.4pymongo4.1.1pymongo-3.12.3-cp36-cp36m-win_amd64.whl下载地址：https://pypi.org/simple/pymongo/代码实践#!/usr/bin/envpython#-*-coding:utf-8-*-importdatetimeimportrandomimportpymongofrompymongoimportMongoClientfrombson.objecti......
Python elasticsearch-py类库基础用法
实践环境https://pypi.org/project/elasticsearch/pipinstallelasticsearch==7.6.0离线安装包及依赖包下载地址：https://files.pythonhosted.org/packages/f5/71/45d36a8df68f3ebb098d6861b2c017f3d094538c0fb98fa61d4dc43e69b9/urllib3-1.26.2-py2.py3-none-any.whl#sha256=d8ff9......
Python 机器学习 K-近邻算法鸢尾花种类预测
K-近邻算法（K-NearestNeighbors,KNN）是一种简单而强大的机器学习算法，适用于分类和回归任务。可以使用scikit-learn库的KNN算法来预测鸢尾花（Iris）的种类。鸢尾花数据集是机器学习领域中常用的一个数据集，包含了150个鸢尾花样本，每个样本有四个特征：萼片长度、萼片宽度、花瓣长度......
BeautifulSoup爬虫库应用——Python 页面解析
爬虫技术作为信息搜集的重要手段，在大数据时代发挥着至关重要的作用。通过网络爬虫，可以高效地从各种在线源头获取大规模、多样化的数据，为大数据分析和应用提供了必要的原始材料。首先，爬虫使得大数据的采集更为全面和及时。网络上存在着庞大的信息资源，包括社交媒体、新闻网站、电子......
工作安排-od-python
工作安排小明每周上班都会拿到自己的工作清单，工作清单内包含n项工作，每项工作都有对应的耗时时长(单位h)和报酬，工作的总报酬为所有已完成工作的报酬之和。那么请你帮小明安排一下工作，保证小明在指定的工作时间内工作收入最大化。输入描述输入的第一行为两个正整数T，n。T代表工作......
Python随机波动模型Stochastic volatility，SV随机变分推断SVI分析标普500指数股票价格
全文链接:https://tecdat.cn/?p=33809原文出处：拓端数据部落公众号随机波动模型（Stochasticvolatilitymodels）经常被客户用来对股票价格随时间的变动性进行建模。波动性（volatility）是随时间的对数收益的标准差。与假设波动性恒定不变不同，随机波动模型具有隐变量参数，可以在每个时刻......

python语言下的迷宫游戏的实现猜想

相关文章

赞助商

阅读排行