首页 > 其他分享 >o1快慢思考的风又吹到了Agent!

o1快慢思考的风又吹到了Agent!

时间:2024-10-17 11:19:39浏览次数:8  
标签:快慢 智能 用户 Agent Reasoner 信念 Talker 记忆 o1

智能体(Agent)通过自然对话与用户互动有两个任务:交谈和规划/推理。对话回应必须基于所有可用信息,行动必须有助于实现目标。与用户交谈和进行多步推理和规划之间的二分法,类似卡尼曼引入的人类快速思考慢速思考系统。

为此,Google DeepMind提出了一个名为Talker-Reasoner的双系统架构,以模拟人类的两种思考系统。

图片

Talker-Reasoner的双系统架构,用于构建能够通过自然对话与用户互动的智能代理。这种架构受到人类“快速思考”和“慢速思考”系统的启发,将Agent分为两个部分:快速直观的“Talker”(系统1)慢速、深思熟虑的“Reasoner”(系统2)

双系统Talker-Reasoner方法的示意图

图片

Talker-Reasoner智能体模型

详细介绍了提出的双系统Talker-Reasoner智能体模型,该模型受到人类快速思考(System 1)和慢速思考(System 2)的启发。这个模型将智能体分为两个独立的但相互协作的组件:

Talker-Reasoner架构的图表

图片

  1. Talker智能体(System 1):这个智能体是快速、直观的,负责与用户进行自然语言交流,生成对话回应。它类似于人类的直觉反应,能够迅速地从记忆中获取信息,以支持其回应。Talker智能体在每次与用户互动时都会激活,并且可以访问记忆来引导其回应,类似于System 1的持续激活。

  2. Reasoner智能体(System 2):这个智能体是慢速、深思熟虑且逻辑性强的,负责执行复杂的多步推理和规划。它调用工具、执行动作,并更新智能体的状态。Reasoner智能体还负责形成和更新关于用户的信念状态,这些信念状态以结构化的语言对象形式存储在记忆中。

这两个智能体之间的主要交互方式是通过记忆。Reasoner智能体负责生成新的信念状态和推导多步推理和规划,并将它们存储在记忆中。Talker智能体在需要信念时,会从记忆中检索最新的状态。因此,Talker智能体可能会使用延迟的世界视图进行操作,因为Reasoner智能体可能还没有时间生成新的信念并将其存储在记忆中。

此外,Talker智能体还可以选择等待Reasoner智能体完成其推理过程,然后再生成回应。这种设计允许快速印象和回应的Talker智能体成为Reasoner智能体明确信念和选择(计划)的来源。这种分工方式在大多数情况下都能很好地工作,因为Talker智能体通常非常擅长其任务:它可以自动从记忆中获取信息,有效地引导其底层模型以很好地应对熟悉情况。

睡眠辅导智能体案例研究

通过一个睡眠辅导智能体的案例研究来评估和实例化Talker-Reasoner双智能体架构。在一个现实世界的应用场景中展示该架构的有效性,特别是在处理需要用户建模、使用专家知识提供科学支持的建议、提供多步骤辅导计划以及进行对话和同理心交流的复杂任务时。

睡眠辅导智能体的实现:

  1. Talker智能体:通过一组专家提供的指导原则来编码睡眠领域的专业知识,这些原则描述了智能体的构成(例如,表现出同理心、进行对话交流、提供准确的建议)以及睡眠辅导的不同阶段(理解、目标设定和辅导计划)。Talker智能体通过一个强大的语言模型实现,能够理解复杂的模式并提供深思熟虑的对话回应。

  2. Reasoner智能体:明确地对用户的信念进行建模。通过与临床专家的合作,作者编码了一个JSON/XML模式的信念,包括睡眠问题、目标、习惯、障碍和睡眠环境等字段。Reasoner智能体在执行多步推理/规划时,推断并更新这些模式字段,从而创建或更新其信念状态。

  3. Talker和Reasoner的协调:Talker智能体是否等待Reasoner智能体完成,取决于信念状态。在规划辅导阶段,Talker智能体会等待Reasoner智能体完成;否则,它不会等待。

定性结果:

  1. 示例对话:展示了Talker和Reasoner智能体之间的互动,包括如何根据用户的需求生成回应和计划,以及如何根据用户的反馈调整计划。

  2. 根据反馈调整计划:展示了Reasoner智能体如何根据Talker智能体从用户那里收集的反馈来调整其计划。

以下是一段示例对话,展示了Reasoner和Talker之间的互动:

用户:嘿,我需要你的帮助来规划如何营造一个放松的睡前环境。(记忆中的信念更新为:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我们开始为你打造一个放松的睡前环境吧:-) 你的卧室里有没有什么可能会干扰你睡眠的东西?
用户:我觉得噪音和光线太分散注意力了。你能帮我制定一个消除这些干扰的计划吗?(记忆中的信念保持不变)
Talker:当然可以!这里有一个消除卧室干扰的计划:噪音:
确定噪音源:列出卧室中所有的噪音源隔绝外界噪音:使用遮光窗帘来阻挡光线和减少噪音;考虑使用降噪窗帘或隔音板;试试耳塞或白噪音机。光线:...记住,一致性是关键。每晚都坚持这个计划,以营造一个平静而黑暗的睡眠环境。还有什么我可以帮助你的吗?
用户:当然,这很有用。不过,我希望步骤能更详细一些。还想看看如何在我的卧室里营造一个宁静放松的氛围的资源。(记忆中的信念更新为:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的计划:当然!让我们更深入地看看你的计划的第一步:
步骤:选择一个平静的色彩调色板。描述:在选择卧室颜色时,选择柔和的中性色调,如柔和的蓝色、绿色或灰色。这些色调已被科学证明可以促进放松和宁静。1. YouTube视频:(链接)标题:创造放松和无压力卧室的墙面颜色创意。频道:roomdsignTV。推理:这个来自roomdsignTV的视频提供了平静卧室色彩调色板的视觉示例。它展示了舒缓色彩对营造宁静氛围的影响。2. YouTube播放列表:(链接)标题:Berger油漆色彩组合。频道:Hresun Interiors。推理:这个来自Hresun Interiors的播放列表提供了一系列的卧室色彩组合创意。它涵盖了从传统到现代的多种风格,帮助你找到适合卧室的完美色彩方案。
Talker:复制Reasoner的回应
##### 根据反馈调整计划
以下是Reasoner智能体如何根据Talker智能体从用户那里收集的反馈来调整其计划的示例:
用户:谢谢你,这非常有用。你能在我的计划中加入更多关于我应该在空间中添加哪些放松声音的步骤吗?(记忆中的信念保持不变)
Reasoner的计划:当然可以!这是你的计划中的“探索自然声音”部分,以及一些相关的YouTube内容:
探索自然声音:这个部分旨在帮助你使用自然声音在空间中创造一个平静和宁静的氛围。通过加入这些声音,你可以促进放松和减轻压力。推荐YouTube视频:...
发现治疗频率:在这个计划的部分,我们将探索治疗频率的世界,这些频率被认为对放松和情绪健康有深远的影响。...YouTube推荐:
https://arxiv.org/pdf/2410.08328Agents Thinking Fast and Slow: A Talker-Reasoner ArchitectureGoogle DeepMind

来源 | PaperAgent

Agent11

Agent · 目录

上一篇从0手搓4种Agentic模式,主打去框架化!

标签:快慢,智能,用户,Agent,Reasoner,信念,Talker,记忆,o1
From: https://blog.csdn.net/AIBigModel/article/details/143002715

相关文章

  • 大模型中的Agent
    简介:个人学习分享,如有错误,欢迎批评指正。在大模型(如GPT-4等大型语言模型)中,Agent(代理)是指具备自主决策和执行能力的智能体,能够根据输入的信息和环境,自主完成特定任务或实现特定目标。Agent通常结合了大模型的强大语言理解和生成能力,以及其他模块化的功能,如感知、规划、......
  • opencv yolo11 onnx c++代码
    1.exportonnx,opset我设置的是12,其它值或许也可以2.opencv使用的4.10【其他版本或许也可以,4.7.0版本是不行的】3.代码核心参考yolo之前版本的实现即可。 model.setInput(blob);model.forward(outputs,outnames);constintdimensions=84;constintrows=......
  • YOLO11涨点优化:原创自研 | 自研独家创新BSAM注意力 ,基于CBAM升级
     ......
  • UCB CS194/294-196 (LLM Agents) Lecture 4 (2024.10.1)
    预备知识英文缩写&术语英语简中补充LargeLanguageModel(LLM)大语言模型ArtificialGeneralIntelligence(AGI)通用人工智能一个远大的目标Agent智能体/代理Embody具身Multi-AgentSystem(MAS)多智能体系统Token文本分割后得到的最小语义单位Prompt提示词我们向AI提出的......
  • YOLO11有效改进专栏目录
    |试读篇|使用YOLO11训练自己的数据集【下载模型】-【导入数据集】-【训练模型】-【评估模型】-【导出模型】YOLO11关键改进与网络结构图YOLO11改进|注意力机制篇|添加GAM、CBAM、CA、ECA等注意力机制YOLO11改进|卷积篇|引入可变核卷积AKConv|注意力机制篇|YOLO11改进|注意......
  • YOLO11在训练和导出时的一些参数设置
    train时,imsz只能设置成1个整数。如果设置成数组,会提示:updatingto'imgsz=640'.'train'and'val'imgszmustbeaninteger,while'predict'and'export' 图像会以较长的边等比例缩放到指定的整数,然后较短的边的两侧填充114到指定的整数尺寸。即最终会是一个正方形,原图缩放......
  • 【AIGC】AI Agent 和 AI Workflow 的区别,Agent搭建
    Agent详解引言AIAgent和AIWorkflow的区别1.定义与功能2.自主性与灵活性3.应用场景AIWorkflowAIAgent详解基本特征分类应用场景dify搭建简单的agent结语引言随着AI的不断进步,我们见证了多种不同类型的AI概念的出现。其中,AIAgent和AIWorkflow是两个经常......
  • Bocha Web Search API:使用Langchain的Agent模式通过Tool Use调用博查 Search API实现L
    上篇文章介绍了国内可用的博查WebSearchAPI,详见:使用博查WebSearchAPI获取搜索引擎的网页链接和文本摘要,给AI/RAG应用增加联网搜索功能本篇讲述一下如何通过LangChain的FunctionCall方式使用它。1.安装LangChainpipinstalllangchainopenai2.获取博查......
  • OpenAI 开源项目 “swarm” 涉嫌抄袭?智能体 Eagle DevAgent 深度解秘
    近日,OpenAI的新多智能体框架Swarm引发了一场激烈的争议——20岁创始人KyeGomez控诉OpenAI窃取了其初创公司Swarms的知识产权。青年才俊的G创始人声称,OpenAI不仅盗用了其项目的名称,还抄袭了相似的代码结构和方法。这一消息迅速引发了科技社区的广泛关注,这两个......
  • 为什么普通AI不够用?定制AI Agents工具是关键!
    1新建一个实时搜索工具@tooldefweb_search(query:str):"""实时搜索工具"""serp=SerpAPIWrapper()result=serp.run(query)print("实时搜索结果:",result)returnresult#初始化工具列表tools=[web_search]#创建OpenAI工具......