首页 > 编程语言 >个人的一种设想:能否使用元强化学*算法解决路径导航问题 —— 快速的适配于相似结构的场景

个人的一种设想:能否使用元强化学*算法解决路径导航问题 —— 快速的适配于相似结构的场景

时间:2024-05-02 18:58:15浏览次数:27  
标签:化学 适配 设想 问题 元强 算法 解决

pathfinding是人工智能领域的一个老问题,随着humanoid的应用火热起来这个问题也随之再度受关注。比较传统的人工智能方法一般都是使用A* 这样的启发式的算法,不仅在2D领域同时也在3D(Voxel space)领域有着较好的表现,不过随着深度学*和强化学*的*些年的快速发展也就有了一些使用深度强化学*算法来解决该问题的研究,在本文中只是提一个个人的一种设想,那就是能否实现一种元强化学*的算法,使该算法在一些类似的pathfinding的问题环境下训练后具备一定的bias(偏置,人工智能领域中的推断假设),对于一些新的没有遇到的相似问题可以快速的解决。



给出以下问题的场景:


image


image


image


image



在上面的问题中如果使用A* 类似的传统的AI规划算法往往需要遍历大部分的空间才可以找到目标点,如:

App演示地址:

https://qiao.github.io/PathFinding.js/visual/

image


image


image


image


可以看到,传统的A* 算法在解决复杂困难的pathfinding问题时往往性能较差,使用神经网络来解决这个问题是未来的研究热点,那么具体该如何解决呢,最*看到有外网的信息说是有人使用diffusion模型来解决这个问题获得的SOTA的表现,不过具体的research内容还没有公开,我这里的一个个人设想就是可以不可以使用元强化学*算法来解决这类问题呢,比如在一个相类似的场景下训练后具有一定的假设偏好,然后在新的相似环境下可以快速的解决问题呢,就像本文最开始给出的四个示意图,可以不可以根据前3个环境的训练然后在第4个环境下快速解决呢。


本文更多的是提一个设想,至于具体的解决方法,甚至是否可以被解决也都是未来才知道的事情。



注意:

这里都是假设目标点的信息是已知的,这在A* 算法中往往都是预先设定的条件,但是在强化学*算法中我们往往是不知道目标点的位置信息的,那么在这种情况下又该如何设计算法呢,元强化学*算法是否可以很好解决呢?







标签:化学,适配,设想,问题,元强,算法,解决
From: https://www.cnblogs.com/devilmaycry812839668/p/18170420

相关文章

  • 数论学习笔记 (4):扩展欧几里得算法
    概述扩展欧几里得算法(\(exgcd\))可以用来求形如\(ax+by=c\)的不定方程的通解。铺垫-\(\small\texttt{ax+by=gcd(a,b)}\)的解\(exgcd\)的思想是在用辗转相除法递归\(gcd(a,b)\)的回溯时求出对应方程\(ax+by=gcd(a,b)\)的解。考虑方程\(ax+by=gcd(a,b)\)。看回辗......
  • Java(4)-十大排序算法
    更好的总结:RUNOOB.COM十大经典排序算法冒泡排序冒泡排序的基本思想是比较数组中相邻的两个元素,根据比较结果交换它们的位置,让较大的元素排到数组末尾。遍历过程:首轮遍历:从数组的第一个元素开始,比较相邻的两个元素,如果前一个元素大于后一个元素,则交换它们的位置,从而第一遍遍......
  • Akima算法
        测量数据的内插已有各种方法,如线性内插、多项式内插、样条函数插值等,但这里的Akima插值法具有独特的优点。  线性内插只顾及其附近两点的影响。  多项式内插时,低阶多项式由于参数较少,内插精度很低,而使用高阶多项式又会使解不稳定,出现“龙格”现象,即......
  • HPA* (Near Optimal hierarchical Path-finding)算法的效果图
    本文中的图全部来自:https://mohitsharma0690.blogspot.com/2016/01/hierarchical-pathfinding.html图的说明:Hereisanexampleofhowclustersarecreatedinanopenspaceenvironment.Thewhitesquaresrepresentwalkablegrids.Non-walkablegridspacesaremark......
  • 读天才与算法:人脑与AI的数学思维笔记15_声响的数学之旅
    1. 音乐1.1. 巴赫的作品以严格的对位著称,他十分中意对称的结构1.2. 巴托克的作品很多都以黄金比例为结构基础,他非常喜欢并善于使用斐波纳契数列1.3. 有时,作曲家是本能地或者不自知地被数学的模式和结构所吸引,而他们并没有意识到这些数学模式的意义1.4. 有时,他们主动去寻......
  • 排序算法
    数据结构排序算法·插入排序插入排序的思路就是从右侧的未排序区域内取出一个数据,然后将它插入到已排序区域内合适的位置上。/******************************************************************************functionname:InsertSort*function:......
  • leetcode算法热题--盛最多水的容器
    题目给定一个长度为n的整数数组height。有n条垂线,第i条线的两个端点是(i,0)和(i,height[i])。找出其中的两条线,使得它们与x轴共同构成的容器可以容纳最多的水。返回容器可以储存的最大水量。说明:你不能倾斜容器。示例1:输入:[1,8,6,2,5,4,8,3,7]输出:49解释......
  • leetcode算法热题-爬楼梯
    题目假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢?示例1:输入:n=2输出:2解释:有两种方法可以爬到楼顶。1阶+1阶2阶示例2:输入:n=3输出:3解释:有三种方法可以爬到楼顶。1阶+1阶+1阶1......
  • 基于DCT变换的彩色图像双重水印嵌入和提取算法matlab仿真
    1.算法运行效果图预览灰度图   彩色图   2.算法运行软件版本matlab2022a  3.算法理论概述      双重水印嵌入算法涉及两个独立的水印:主水印和辅水印,它们可以是灰度图像、二进制序列或其他形式的数据。以下简述嵌入过程: 图像预处理:将彩色图像从R......
  • boost的安装、查看与卸载(某动态库要求的boost版本不适配怎么办?)
    boost的安装、查看与卸载(某动态库要求的boost版本不适配怎么办?)查看版本dpkg-S/usr/include/boost/version.hpp原生安装动态库位置:Usr/local/lib/或者/usr/lib/x86_64-linux-gnu/安装boost官网下载想要的boost版本,按下述方式编译安装,不需要卸载原本的boost,注意最后.......