首页 > 其他分享 >图灵奖获得大佬Yann LeCun看好的模型预测控制(MPC)策略是什么?

图灵奖获得大佬Yann LeCun看好的模型预测控制(MPC)策略是什么?

时间:2024-09-03 10:49:52浏览次数:12  
标签:控制 MPC 模型 系统 LeCun 图灵奖 Yann 优化 预测

MPC

图灵奖获得大佬Yann LeCun看好的模型预测控制(MPC)策略是什么?

模型预测控制(Model Predictive Control, MPC)作为一种先进的控制策略,近年来在工业过程控制、自动驾驶、能源系统等多个领域得到了广泛应用。凭借其对系统未来行为的预测能力,MPC在处理多变量系统、显式考虑系统约束等方面具有独特优势。本文将深入解析MPC的基本原理、优势与挑战,并通过一个通俗易懂的案例来展示MPC在实际应用中的效果。

一、模型预测控制的基本原理

MPC的工作机制可以概括为以下几个核心步骤:

  1. 系统建模
    MPC的第一步是构建一个精确的系统模型。这个模型通常由系统的状态空间方程或差分方程表示,其目的是描述系统在给定输入条件下的演化方式。例如,考虑一个简单的线性离散时间系统,其模型可表示为:

    x ( k + 1 ) = A x ( k ) + B u ( k ) x(k+1) = Ax(k) + Bu(k) x(k+1)=Ax(k)+Bu(k)
    y ( k ) = C x ( k ) + D u ( k ) y(k) = Cx(k) + Du(k) y(k)=Cx(k)+Du(k)

    其中, x ( k ) x(k) x(k) 表示系统在时刻 k k k 的状态向量, u ( k ) u(k) u(k) 为控制输入, y ( k ) y(k) y(k) 为系统输出, A A A、 B B B、 C C C 和 D D D 为系统的状态空间矩阵。

    在非线性系统中,系统模型可以更复杂,通常表示为:

    x ( k + 1 ) = f ( x ( k ) , u ( k ) ) x(k+1) = f(x(k), u(k)) x(k+1)=f(x(k),u(k))

    非线性MPC(NMPC)处理这类系统时,需要考虑更复杂的优化过程和算法。

  2. 预测与优化
    在每个控制周期,MPC会根据当前状态 x ( k ) x(k) x(k) 使用系统模型预测未来一段时间内的状态和输出。预测时域 N p N_p Np​ 通常为未来几个时间步长。基于这一预测,MPC会求解一个优化问题,找到在这段预测时域内的最优控制序列 u ( k ) , u ( k + 1 ) , . . . , u ( k + N p − 1 ) u(k), u(k+1), ..., u(k+N_p-1) u(k),u(k+1),...,u(k+Np​−1)。

    优化目标通常是最小化某个代价函数,常见的代价函数包括跟踪误差和控制输入的变化量。例如,一个典型的代价函数可以表示为:

    J = ∑ i = k k + N p − 1 ( ∥ y ( i ) − y r e f ( i ) ∥ Q 2 + ∥ u ( i ) ∥ R 2 ) J = \sum_{i=k}^{k+N_p-1} \left( \| y(i) - y_{ref}(i) \|_Q^2 + \| u(i) \|_R^2 \right) J=i=k∑k+Np​−1​(∥y(i)−yref​(i)∥Q2​+∥u(i)∥R2​)

    其中, y r e f ( i ) y_{ref}(i) yref​(i) 是期望的参考输出, Q Q Q 和 R R R 为权重矩阵,分别调节跟踪误差和控制输入的影响。MPC通常使用二次规划(QP)或线性规划(LP)方法来求解这个优化问题,确保找到满足系统约束的最优控制输入。

  3. 滚动优化
    MPC的控制策略是滚动式的。虽然在预测时域内得到了一个最优控制序列,但实际上在每个时刻只应用当前的控制输入 u ( k ) u(k) u(k),然后重新根据新的状态信息更新预测和优化过程。通过这种方式,MPC能够动态适应系统变化和不确定性,保持系统的鲁棒性和稳定性。

二、MPC的优势与挑战

MPC相比于传统控制方法具有以下明显优势:

  • 处理多变量系统:MPC能够同时处理多个输入和输出变量,并能显式处理系统约束(如输入限幅、状态边界等),非常适合复杂多变量系统的控制。
  • 鲁棒性强:MPC在每个时间步长都进行重新优化,能够有效应对模型不确定性和外部扰动。
  • 优化全局性能:通过在预测时域内优化控制输入,MPC能够在全局范围内优化系统的性能,而不仅仅关注当前时刻。

然而,MPC也存在一些挑战:

  • 计算量大:MPC在每个时间步长都需要求解一个优化问题,计算负担较重,尤其在高维系统或实时应用中。这通常需要高效的优化算法和强大的计算资源。
  • 模型依赖性:MPC依赖于系统模型的准确性,如果模型与实际系统存在较大偏差,控制效果可能会受到影响。为此,鲁棒MPC(Robust MPC)通过考虑模型不确定性来提高控制性能。
  • 参数调节复杂:MPC的性能受预测时域、控制时域、权重矩阵等参数的影响,这些参数的选择需要权衡控制性能和计算复杂性。

三、举个栗子:自动驾驶中的MPC

为了更好地理解MPC的工作机制,我们通过一个自动驾驶中的实际案例来说明。

案例背景
假设我们设计一辆自动驾驶小车,任务是在一条曲折的道路上行驶。目标是让小车尽可能准确地跟随道路,同时避免超出道路边界。

步骤解析

  1. 系统建模
    我们可以将小车的运动建模为一个简单的离散时间系统,其中状态向量 x ( k ) x(k) x(k) 包含小车的位置和速度,控制输入 u ( k ) u(k) u(k) 可能是方向盘的转角和加速度。

    模型可以表示为:
    x ( k + 1 ) = f ( x ( k ) , u ( k ) ) x(k+1) = f(x(k), u(k)) x(k+1)=f(x(k),u(k))

    在此模型中,我们可以引入环境噪声或外部干扰以更接近真实应用场景。通过MPC,系统能够动态调整控制输入,以保持在道路中心并应对道路上的变化。

  2. 预测与优化
    在每个时间步,MPC将预测小车在未来若干步内的轨迹,基于当前状态和可能的控制输入。MPC的优化目标是最小化小车实际轨迹与道路中心线之间的偏差,同时保持速度稳定,避免剧烈转向或加速。

    代价函数可能包含以下项:

    • 小车偏离道路中心线的距离。
    • 控制输入的变化率,以保持驾驶平稳。

    例如,MPC可能会选择一个稍微调整方向盘的角度来保持在道路中心,同时不做出过大的调整,以避免剧烈晃动。这个过程通常通过求解一个QP问题来实现,确保优化的计算效率和准确性。

  3. 滚动优化
    虽然MPC会计算出未来几个时间步的最优控制序列,但实际应用中只会使用当前时刻的控制输入。小车会调整方向,然后在下一个时间步重新计算新的控制策略。这种滚动优化方式使得MPC能够实时应对道路变化,如弯道、坡道或障碍物。

通过这种方式,MPC能够在复杂的驾驶环境中保持小车的稳定性和安全性。与传统PID控制相比,MPC能够处理更复杂的多变量系统,并且更具适应性,适合应用在自动驾驶等高级场景中。

四、总结与展望

模型预测控制(MPC)因其强大的预测能力和优化性能,已成为许多复杂控制系统中的核心技术。尽管MPC具有计算量大、模型依赖性强等挑战,但随着计算技术和优化算法的发展,这些问题正在逐步得到解决。未来,随着自适应MPC、分布式MPC、机器学习与MPC的结合,我们可以期待MPC在更多复杂系统中的广泛应用,尤其是在智能驾驶、能源管理等前沿领域。

标签:控制,MPC,模型,系统,LeCun,图灵奖,Yann,优化,预测
From: https://blog.csdn.net/mieshizhishou/article/details/141685837

相关文章

  • GPT-4并非世界模型,LeCun双手赞同!ACL力证LLM无法模拟真实世界
    一直以来,支持LLM的观点之一是模型可以集成海量事实知识,作为通往「世界模拟器」的基础。虽然也有不少反对意见,但缺乏实证依据。那么,LLM能否作为世界模拟器?最近,亚利桑那大学、微软、霍普金斯大学等机构联合发布了一篇论文,从实证角度否定了这一观点。最新研究已被ACL2024顶会......
  • Yann Lecun-纽约大学-深度学习(PyTorch)
    课程介绍    本课程涉及深度学习和表示学习的最新技术,重点是有监督和无监督的深度学习,嵌入方法,度量学习,卷积和递归网络,并应用于计算机视觉,自然语言理解和语音识别。前提条件包括:DS-GA1001数据科学入门或研究生水平的机器学习课程。     免费获取:YannLecun-纽约......
  • 基于energy score的out-of-distribution数据检测,LeCun都说好 | NerulPS 2020
     论文提出用于out-of-distributions输入检测的energy-based方案,通过非概率的energyscore区分in-distribution数据和out-of-distribution数据。不同于softmax置信度,energyscore能够对齐输入数据的密度,提升OOD检测的准确率,对算法的实际应用有很大的意义来源:晓飞的算法工程笔记......
  • 疑似威胁人类?OpenAI神秘Q*项目更多信息曝光,马斯克、Lecun下场争论…
    大家好我是二狗随着前天OpenAI官宣SamAltman将回归,并继续担CEO,OpenAI“宫斗事件”已经告一段落了。然而,对于专业吃瓜的二狗来说,有一个核心问题还是没有搞明白:SamAltman究竟为何被董事会开除?之前网络上有各种猜测,但似乎都没有得到石锤。直到昨天,路透社最新爆料来了:“在SamA......
  • GPT-4没有意识!但图灵奖得主Bengio等88页论文暗示「天网」迟早降临
    人工智能发展到现在,到底有没有意识?图灵奖得主YoshuaBengio,联合19人团队跨界发表了一篇88页巨作,得出结论:人工智能目前没有意识,但是以后会有。论文地址:https://arxiv.org/pdf/2308.08708.pdf具体来说,目前的人工智能系统都不具备意识,但人类想要构建有意识的人工智能系统,并不存在明显......
  • LeCun墙裂推荐!Meta发布最新AI智能体,贾维斯是你来了吗!
    作者|付奶茶最近Meta的一项工作引来LeCun的推荐!芜湖!贾维斯来了?Meta发布了Habitat3.0,这是一款最高质量的模拟器,其允许在类似家庭等环境中进行人机协作。与此前的AI音箱和机器人相比,我们对AI智能体的想象还是保守了!Habitat3.0引入了具有感知能力、可以与环境互动的AI智能体,这些......
  • LeCun和Bengio“吵”起来了,人工智能是“潘多拉魔盒”吗?
    作者|谢年年上周末,深度学习领域最有影响力的三巨头之二YannLeCun和YoshuaBengio就AI的潜在风险和安全问题引发了一场激烈辩论,人工智能是“潘多拉魔盒”吗?这场辩论引来众多AI知名人士围观。LeCun在Facebook上发起了这场辩论,并呼吁那些相信人工智能的力量和可靠性的“沉默大多数......
  • SAP Fiori Elements propertyAnnotations 举例讲解
    SAPFioriElements是SAP提供的一种用户界面开发框架,它允许开发人员创建符合Fiori设计原则的应用程序。这种框架主要基于SAPUI5,它是SAP的一种基于HTML5的用户界面技术。FioriElements提供了一种声明性的方式来定义用户界面,这意味着开发人员不需要编写大量的前端代码。......
  • 不用RLHF,匹敌GPT-4!Meta重磅发布LIMA 65B,1000个样本性能飞升,LeCun转赞
    人人都知,让ChatGPT称霸天下的秘密武器,就是人类反馈强化学习(RLHF)。而现在,MetaAI等机构的爆火研究LIMA直接打破这一规则,直言RLHF并没有那么重要!论文一出,直接在AI圈炸了锅!就连LeCun忍不住发推炫一番:LIMA:LLaMa-65B+1000监督样本=GPT-4/Bard级别的性能。正如标题所称,LIMA是「LessisMo......
  • Yann Lecun-纽约大学-深度学习(PyTorch)
    课程介绍    本课程涉及深度学习和表示学习的最新技术,重点是有监督和无监督的深度学习,嵌入方法,度量学习,卷积和递归网络,并应用于计算机视觉,自然语言理解和语音识别。前提条件包括:DS-GA1001数据科学入门或研究生水平的机器学习课程。  sphq: https://mp.weixin.qq.com/s?__b......