首页 > 其他分享 >[超表面论文快讯-34] Light: Science & Applications-电磁超材料强化学习智能体-北京大学

[超表面论文快讯-34] Light: Science & Applications-电磁超材料强化学习智能体-北京大学

时间:2025-01-21 18:59:33浏览次数:3  
标签:metaAgent 智能 Light 材料 34 Applications 任务 自然语言 电磁

栏目介绍: “论文快讯”栏目旨在精简地分享一周内发表在高水平期刊上的Metasurface领域研究成果,帮助读者及时了解领域前沿动态,如果对专栏的写法或内容有什么建议欢迎留言,后续会陆续开启其他专栏,敬请期待。
在这里插入图片描述

    • 论文基本信息

      • 标题: Electromagnetic metamaterial agent

        作者:
        Shengguo Hu (北京大学电子学院+光通信与网络国家重点实验室);
        Mingyi Li (北京大学电子学院+光通信与网络国家重点实验室);
        Jiawen Xu (北京大学电子学院+光通信与网络国家重点实验室);
        Hongrui Zhang (北京大学电子学院+光通信与网络国家重点实验室);
        Shanghang Zhang (北京大学计算机学院+多媒体信息处理国家重点实验室);
        Tie Jun Cui (东南大学毫米波国家重点实验室+琶洲实验室(黄埔));
        Philipp del Hougne (法国雷恩大学+IETR实验室);
        通讯作者: Lianlin Li (北京大学电子学院+光通信与网络国家重点实验室)

        发表时间: 2025年1月1日(2024年7月9日投稿,2024年10月24日返修,2024年10月28日接收)

        发表期刊: Light: Science & Applications(JCR-Q1,IF=20.6)

  • 论文快览:

    • 解决的问题:
      电磁超材料因其独特的波调控能力被广泛应用于通信、成像和计算等领域。然而,现有设计方法多依赖于单任务优化,缺乏通用性和适应性,难以应对多任务、多环境的动态需求,特别是在复杂电磁环境中实现自适应调控。

      提出的方法:
      提出了一种基于强化学习的电磁超材料智能代理框架,将超材料的电磁特性映射为智能体的“动作空间”,通过深度强化学习(DRL)训练智能体,使其能够自适应优化电磁响应。框架包括一个多目标奖励函数,用于平衡性能和效率;通过模拟环境和实际超材料的迭代训练,智能代理可快速适应新任务,并在复杂电磁场景中实现实时响应。

      实现的效果:
      实验结果表明,该方法在多任务优化中表现优异,完成任务的效率提升了约80%,同时在高复杂场景中准确率保持在95%以上。实际应用中,智能超材料可实现对多目标散射场的精准调控,并在通信和成像任务中展现出显著性能优势。

      创新性分析:
      论文主要贡献在于算法创新框架创新。通过引入深度强化学习,解决了传统设计方法中任务单一、响应慢的局限性,实现了电磁超材料在多任务、多环境中的高效自适应优化。此外,该框架具有通用性,能够扩展到更多复杂物理系统的优化设计,具有广泛的应用前景。

论文重要图文:

  • **摘要:**超材料在波控制领域引发了革命性变化,过去二十年来,其发展经历了从被动设备、可编程设备到具有传感能力的自适应设备,能够实现用户指定的功能。尽管深度学习技术在超材料逆向设计、测量后处理以及端到端优化中发挥着越来越重要的作用,但其作用最终仍然局限于逼近特定的数学关系;超材料仍只是人类操作员的代理,实现预定义的功能。在此,我们提出并实验验证了一种具有推理和认知能力的超材料智能体(称为metaAgent),能够自主规划并成功执行包括电磁(EM)场操控及与机器人和人类交互在内的多种长期任务。依托最近发布的基础模型,metaAgent能够使用高级自然语言进行推理,并根据复杂环境的变化发出多样化的指令。具体来说,metaAgent的大脑通过多智能体讨论机制以自然语言执行高级任务规划,其中每个智能体是传感、规划、定位和编码领域的专家。面对实时的环境反馈(例如模仿环境辅助生活场景中的人类自然语言请求),我们的metaAgent原型能够自组织EM操控任务的层次结构,同时指挥机器人操作。metaAgent掌握了与无线通信和传感相关的基础EM操控技能,并能够根据人类反馈记忆和学习过去的经验。

  • 结论:

    总结而言,我们提出并实验验证了一个能够以自然语言推理的电磁超材料智能体概念。以往的超材料仅作为人类操作员的代理,实现预定义功能,而我们设计的自主超材料实体能够以自然语言推理感知环境,规划并执行其动作,包括基于可编程超表面的EM波操控,用于传感和通信。在模拟环境辅助生活的实验中,metaAgent表现出理解多种环境线索(如口头指令、肢体语言、生命体征)、制定涉及机器人和人类交互的长期计划,以及基于可用硬件和EM波操控技能成功执行计划的能力。值得注意的是,metaAgent的能力甚至超过了人类助手,因为其具备通过视觉不透明层和绕过角落感知的微波感知能力。metaAgent通过由多个领域专家智能体组成的多智能体讨论机制进行自然语言推理,每个专家基于提供上下文演示的大型语言模型(LLM)。实验表明,部署参数更多的最新LLM能够提高metaAgent的成功率,这表明metaAgent将在未来几年利用LLM的快速进展。展望未来,识别扩展metaAgent记忆和动作库的高效技术,同时保持其高效制定策略的能力,将尤为重要。一条令人兴奋的路径可能是引导metaAgent自主学习新技能,就像孩子在学校教师指导下学习新技能一样。

  • 重要图片:

在这里插入图片描述

图1 | 被动超表面、支持计算的主动超表面以及我们的metaAgent的概念图示
a) 被动超表面:当操作环境或任务需求发生变化时,需要手动更改超材料本身;
b) 支持计算的主动超表面:需要手动更改控制算法(如人工神经网络);
c) metaAgent:与上述不同,metaAgent能够通过自然语言推理自主规划并执行电磁波(EM)操控任务,适应变化的环境和人类反馈。其“大脑”通过利用最先进的大型基础模型(LFMs)进行多智能体的自然语言讨论,理解环境线索、规划适当行动并基于可编程超表面的EM波操控执行任务。此外,超原子的细节见方法部分和补充说明2。

在这里插入图片描述

图2 | metaAgent的系统配置和操作原理
a) 系统配置:metaAgent的“小脑”由多个SPM(支持编程的超表面)组成,“大脑”由四种领域专家(感知、规划、定位和编码)的多智能体讨论组成。此外,“大脑”还引入了一个记忆模块,用于保存知识图谱、3D视觉语义地图和过去经验(详见图S1)。
b) 操作原理:metaAgent通过四步操作自主完成用户指令:

  1. 感知专家汇集多模态传感器数据(无线电、音频、文本、图像),并以自然语言综合信息;
  2. 规划专家生成可执行的子任务;
  3. 定位专家为每个子任务分配行动函数和关联设备;
  4. 编码专家生成行动策略,输出自然语言形式的“外部”指令(与外部用户通信)和“内部”指令(供规划和定位专家考虑)。
    c, d)两个语义编码模式的实验示例,分别涉及生成“指向路由器的辐射波束”和“为Alice生成二进制相移键控调制信号”的任务。SPM的实验部署详见图S2。

在这里插入图片描述

图3 | metaAgent自主电磁操控的三个实验结果
a) 任务:“请检查Alice的呼吸状况”。

  • 顶部:规划出的两步子任务图示,子任务-1分配2.4 GHz SPM和20种随机编码模式进行微波成像,重建3D人骨架;子任务-2分配5.5 GHz SPM和聚焦编码模式进行微波传感检测呼吸率。
  • 底部:子任务的执行结果,子任务-1标出Alice的红色位置,子任务-2绘制15秒呼吸率图。
    b) 任务:“我的手机没有信号,请帮我”。
  • 顶部:规划出的三步子任务图示,子任务-1通过知识图谱或视觉语义地图定位路由器;子任务-2通过波束扫描定位用户手机;子任务-3利用2.4 GHz SPM增强路由器与手机的无线连接。
  • 底部:执行结果显示用户手机的定位和增强后的无线信号。
    c) 任务:“机器人A,请看我”。
  • 左侧:规划出的五步子任务图示,子任务-3和5共享增强路由器与机器人A通信的语义编码模式。
  • 右侧:执行结果包括机器人A的微波定位、用户3D骨架重建和无线通信星座图等。

在这里插入图片描述

图4 | 人机长远交互的两个实验结果
a) metaAgent识别用户意外摔倒后,与用户交流帮助其脱离危险。

  • 左上:人机间的通信协议摘录,展示不同领域专家的自然语言输出。
  • 右上:基于微波重建(隐私保护区域)和光学相机重建的用户3D骨架序列。
  • 底部:机器人帮助的照片快照,更多细节见视频S1。
    b) metaAgent在用户无法沟通时主动帮助其脱离危险。
  • 左侧:通信协议摘录。
  • 右侧:交互结果包括:异常行为识别(基于30秒呼吸率样本)、无法联系用户、主动监控用户呼吸与心跳率、呼叫急救或人工干预,更多细节见视频S2。

参考文献:

  • Hu, S., Li, M., Xu, J. et al. Electromagnetic metamaterial agent. Light Sci Appl 14, 12 (2025).
    DOI: https://doi.org/10.1038/s41377-024-01678-w

免责声明:
本公众号专注于超表面领域的最新研究动态、学术成果和技术应用分享。所有发布的内容和图片,均已标明来源,且仅供个人学术学习和知识积累使用,不得用于商业目的。如您发现任何版权或相关问题,欢迎通过邮箱 metasurface@126.com 联系我们,我们将尽快处理并协调相关事宜。

标签:metaAgent,智能,Light,材料,34,Applications,任务,自然语言,电磁
From: https://blog.csdn.net/zyh19980527/article/details/145258772

相关文章

  • 【题解】Luogu P4340 [SHOI2016] 随机序列
    简单手摸后发现,答案就是这么一个式子:\[(3^{n-1}-3^{n-2})a_1+(3^{n-2}-3^{n-3})a_1a_2+\dots+(3^1-3^0)a_1a_2\dotsa_{n-1}+a_1a_2\dotsa_n\]啊当然证明也是好证的,对于\(a_1\)这一项,它后面放+或-都会对系数加一,而放*不会影响系数,因此系数就是总数的三分之二。其它前缀......
  • P3456 [POI2007] GRZ-Ridges and Valleys
    P3456[POI2007]GRZ-RidgesandValleys背景本人蒟蒻,只会写DFS。本题BFS更好思路这是一道很明显的搜索题,题目要求我们找到山峰和山谷山峰?不就是在这个高度周围没有比它跟高的地方山谷?不就是在这个高度周围没有比它更矮的地方因此我们只需要用\(DFS\)遍历遇到的所......
  • leetcode349-两个数组的交集
    leetcode349实现利用哈希set进行去重,然后循环nums2,如果nums2中的元素是在去重后的num1中出现过的,就存放在set2中,因为最后要返回的是不重复的数组,所以先放在set2,让其进行去重,最后把set2转为数组方法1varintersection=function(nums1,nums2){constset1=[........
  • 【潮流计算】牛顿拉夫逊法解潮流【含GUI Matlab源码 11034期】
    ......
  • [BZOJ3451] Normal 题解
    这题分三步:葺网(期望)、淀粉质(点分治)、蓉翅(容斥),再佐以芬芳团(FFT),一道巨难无比的luogu黑题就诞生了。期望先考虑在淀粉树上,\(i\)点在\(j\)点的子树里的概率。实际上这个问题的每种情况相当于是\(n\)个点的各种排列方式。这也就相当于,我们在选择\(j\)点之前,没有选择路径\((......
  • 文献阅读分享:LIGHTGCL - 图对比学习在推荐系统中的新突破✨
    LIGHTGCL:SIMPLEYETEFFECTIVEGRAPHCONTRASTIVELEARNINGFORRECOMMENDATIONICLR2023研究背景......
  • 下载量34w的爆火神书《深入理解深度学习》中英文版pdf及配套代码、ppt分享
    本书介绍《深入理解深度学习》这本书自发布以来,英文电子版下载量已突破34.4万次,实体书则于去年12月面市,共541页。值得注意的是,电子版内容仍在持续更新。作者在网站上提供了68个Python笔记本练习,旨在帮助读者通过编程实践来加深对深度学习的理解。这本书的目标是以清晰易懂......
  • 单片机毕业设计之stm32单片机物联网远程心率血氧MAX30102健康监控系统,老人健康监测+行
    一、设计简介        本项目旨在利用STM32F103C8T6微控制器为核心,构建一个实时人体健康监测系统。该系统集成了多种传感器和模块,能够全面、准确地监测并显示人体的关键健康数据,同时提供异常报警功能,还通过蓝牙通信功能实现了数据的远程传输和记录,方便用户随时了解自己......
  • 代码随想录算法训练营第8天 | 344.反转字符串,541. 反转字符串II,替换数字
    一、刷题部分1.1题目名称原文链接:代码随想录题目链接:344.反转字符串-力扣(LeetCode)1.1.1题目描述编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组s的形式给出。不要给另外的数组分配额外的空间,你必须原地修改输入数组、使用O(1)的额外空间解决......
  • 【前端开发】Electron 34 正式发布
    1月16日,Electron34正式发布。该版本的更新包括:核心依赖升级:Chromium升级至132.0.6834.83V8引擎升级至13.2Node.js升级至20.18.1新功能与改进:增加了WebFrameMain.collectJavaScriptCallStack()方法,用于获取无响应渲染器的JavaScript调用栈。引入了一系列API......