由于本人是研究AI的,尤其是AI的强化学习方向,有时候就会对一些小游戏环境的实现有几分兴趣,因为刚看了有关reinforcement learning解决maze游戏的论文,于是就突发奇想的对这个maze迷宫的实现有些想了解了。
迷宫其实就是在一个表格上画线,然后构成的从某点到另一个点的一个通路的环境:
具体的迷宫的样子:
我们可以用一个0、1组成的二维矩阵来表示一个类似上图的迷宫环境:
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 0 1 0 0 0 1 0 0 1 0 1 1 0 0 0 0 0 0 1
1 0 0 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 1 1
1 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1
1 0 1 0 1 1 1 1 0 0 0 1 0 1 0 1 0 1 0 1
1 0 1 0 1 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1
1 0 1 0 0 0 1 1 1 1 0 1 1 0 1 0 1 0 0 1
1 0 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1
1 0 1 1 1 0 1 0 0 1 1 1 0 0 1 0 1 0 1 1
1 0 1 0 0 0 1 1 0 0 0 1 0 1 1 0 1 1 1 1
1 0 1 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1
1 0 1 0 1 0 1 1 0 0 1 0 0 0 1 1 1 0 0 1
1 0 1 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1
1 0 1 0 1 1 1 1 0 1 0 1 1 0 1 0 1 1 1 1
1 0 1 0 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 1
1 0 1 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 1 1
1 0 0 0 1 0 1 1 1 1 0 1 0 0 1 0 1 0 1 1
1 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 1 0 0 1
1 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
其中,我们可以把1当做是黑格,而0视作为白格,黑格我们认为是不可以通行的地方,也就是迷宫的墙壁,而白格则为可通行的地方。