首页 > 编程语言 >python语言下的迷宫游戏的实现猜想

python语言下的迷宫游戏的实现猜想

时间:2024-02-04 11:32:20浏览次数:25  
标签:猜想 python 白格 迷宫 黑格 AI maze 环境

由于本人是研究AI的,尤其是AI的强化学习方向,有时候就会对一些小游戏环境的实现有几分兴趣,因为刚看了有关reinforcement learning解决maze游戏的论文,于是就突发奇想的对这个maze迷宫的实现有些想了解了。


迷宫其实就是在一个表格上画线,然后构成的从某点到另一个点的一个通路的环境:

python语言下的迷宫游戏的实现猜想_强化学习


具体的迷宫的样子:

python语言下的迷宫游戏的实现猜想_强化学习_02


我们可以用一个0、1组成的二维矩阵来表示一个类似上图的迷宫环境:

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 0 1 0 0 0 1 0 0 1 0 1 1 0 0 0 0 0 0 1

1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 1 1

1 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1

1 0 1 0 1 1 1 1 0 0 0 1 0 1 0 1 0 1 0 1

1 0 1 0 1 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1

1 0 1 0 0 0 1 1 1 1 0 1 1 0 1 0 1 0 0 1

1 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1

1 0 1 1 1 0 1 0 0 1 1 1 0 0 1 0 1 0 1 1

1 0 1 0 0 0 1 1 0 0 0 1 0 1 1 0 1 1 1 1

1 0 1 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1

1 0 1 0 1 0 1 1 0 0 1 0 0 0 1 1 1 0 0 1

1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1

1 0 1 0 1 1 1 1 0 1 0 1 1 0 1 0 1 1 1 1

1 0 1 0 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 1

1 0 1 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 1 1

1 0 0 0 1 0 1 1 1 1 0 1 0 0 1 0 1 0 1 1

1 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 1 0 0 1

1 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1


其中,我们可以把1当做是黑格,而0视作为白格,黑格我们认为是不可以通行的地方,也就是迷宫的墙壁,而白格则为可通行的地方。



标签:猜想,python,白格,迷宫,黑格,AI,maze,环境
From: https://blog.51cto.com/u_15642578/9580900

相关文章

  • pyqt报错、python报错:src/pyaudio/device_api.c:9:10: fatal error: portaudio.h: 没
    报错信息:-DNDEBUG-fwrapv-O2-Wall-fPIC-O2-isystem/home/devil/anaconda3/envs/91/include-fPIC-O2-isystem/home/devil/anaconda3/envs/91/include-fPIC-I/usr/local/include-I/usr/include-I/home/devil/anaconda3/envs/91/include/python3.10-csrc/pyaudio/d......
  • 如何绕过Python readline的Tab-补全
    在Python中,readline模块提供了一个交互式的命令行输入接口,其中的Tab补全是指用户在输入时按下Tab键,系统会自动尝试完成当前输入的命令或路径。Tab补全的主要功能是帮助用户更快速、更准确地输入命令或路径,尤其是当有很多可能的选项时。下面我将用详细的步骤来说明Tab补全......
  • python操作yaml
     补充:yaml语法详见:yaml语法 yaml应用场景1、保存自动化测试数据2、保存自动化测试中的关联数据  安装yaml模块pipinstallpyyaml==5.4.1 读取yaml数据读取数据:load()或者full_load(),返回一个对象用例数据:case.yaml-caseId:1apiName:registerdescribe:注册url:......
  • 系统环境变量,python包导入的路径搜索机制,PYTHONPATH,sys.path
    系统环境变量的定义通过在环境变量里面加入所有软件的安装路径,当我们想运行某一软件时双击其快捷方式,此时,计算机除了在其当前目录下寻找该软件的.exe文件外(windows系统),还会在环境变量中搜索软件的路径,找到,运行。综上,Windows中的环境变量,当要求系统运行一个程序而没有告诉它程序......
  • Python 基于pymongo操作Mongodb学习总结
    实践环境Python3.6.4pymongo4.1.1pymongo-3.12.3-cp36-cp36m-win_amd64.whl下载地址:https://pypi.org/simple/pymongo/代码实践#!/usr/bin/envpython#-*-coding:utf-8-*-importdatetimeimportrandomimportpymongofrompymongoimportMongoClientfrombson.objecti......
  • Python elasticsearch-py类库基础用法
    实践环境https://pypi.org/project/elasticsearch/pipinstallelasticsearch==7.6.0离线安装包及依赖包下载地址:https://files.pythonhosted.org/packages/f5/71/45d36a8df68f3ebb098d6861b2c017f3d094538c0fb98fa61d4dc43e69b9/urllib3-1.26.2-py2.py3-none-any.whl#sha256=d8ff9......
  • Python 机器学习 K-近邻算法 鸢尾花种类预测
    ​ K-近邻算法(K-NearestNeighbors,KNN)是一种简单而强大的机器学习算法,适用于分类和回归任务。可以使用scikit-learn库的KNN算法来预测鸢尾花(Iris)的种类。鸢尾花数据集是机器学习领域中常用的一个数据集,包含了150个鸢尾花样本,每个样本有四个特征:萼片长度、萼片宽度、花瓣长度......
  • BeautifulSoup爬虫库应用——Python 页面解析
    爬虫技术作为信息搜集的重要手段,在大数据时代发挥着至关重要的作用。通过网络爬虫,可以高效地从各种在线源头获取大规模、多样化的数据,为大数据分析和应用提供了必要的原始材料。首先,爬虫使得大数据的采集更为全面和及时。网络上存在着庞大的信息资源,包括社交媒体、新闻网站、电子......
  • 工作安排-od-python
    工作安排小明每周上班都会拿到自己的工作清单,工作清单内包含n项工作,每项工作都有对应的耗时时长(单位h)和报酬,工作的总报酬为所有已完成工作的报酬之和。那么请你帮小明安排一下工作,保证小明在指定的工作时间内工作收入最大化。输入描述输入的第一行为两个正整数T,n。T代表工作......
  • Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格
    全文链接:https://tecdat.cn/?p=33809原文出处:拓端数据部落公众号随机波动模型(Stochasticvolatilitymodels)经常被客户用来对股票价格随时间的变动性进行建模。波动性(volatility)是随时间的对数收益的标准差。与假设波动性恒定不变不同,随机波动模型具有隐变量参数,可以在每个时刻......