首页 > 其他分享 >LLM应用实战: OpenAI多代理新作-Swarm

LLM应用实战: OpenAI多代理新作-Swarm

时间:2024-10-22 12:34:09浏览次数:7  
标签:22 09 Agent 2024 Swarm OpenAI LLM cancel

1.背景

本qiang~关注到OpenAI两周前发布的轻量级多代理框架Swarm,因此想要深入了解了一下,运行了官方提供的例子,整理并总结一些心得体会~

源码非常简单,各位看官们可以小读一下,本文采用gpt-4o-mini进行验证,如果想免费使用gpt-4o-mini,可私信沟通。

Ps: 发布之后,便在X引起了Swarm涉嫌抄袭,但吃瓜的我还是关注技术内部本身。

2.简介

Swarm项目是一个轻量级multi-agent编排框架,当前主要是为了实验及教学,而非用于生产。

Swarm专注于使agent协调和运行变得轻量级、高度可控且易于测试。

有两个主要抽象模块:Agent和handoffs(切换),Agent封装了instructions和tools,且可以随时选择将对话移交给另一个代理。

3. 适用场景

适用于大量的独立功能和指令难以整合到一个prompt的场景,而是将独立功能和指令通过agent, functions, tools等方式进行链接。

4. Swarm核心模块

4.1 Swarm.run()

类似于openai的chat completions api中的create()函数,接收并返回messages,并在调用之间不保存任何状态。注意,该方法也处理Agent函数执行、切换、上下文变量引用,且可以在返回最终输出前进行多轮对话。

其核心实现了如下循环:

(1) 从当前Agent调用模型返回结果

(2) 执行工具调用并且保存结果

(3) 必要时切换代理

(4) 必要时更新上下文变量

(5) 如果没有新的函数调用,则返回

该方法执行完毕后,会返回一个Response,包含所有相关的更新状态,包括新的messages, 最后被调用的agent以及最新的上下文变量context_variables。

4.2 Agents

Agent简单封装了一组instructions和functions,且具有将执行移交给另一个agent的能力。这些instructions和functions可用于表示非常具体的工作流程或步骤。

Instructions将被直接转化为一个对话的system提示,任何时候,只会存在活跃agent的instructions。

instructions可以是普通的字符串,也可以是返回字符串的函数,该函数可以选择一个context_variables参数,进而传入到swarm.run()中。

Swarm的Agent可以直接调用python函数,通常function应返回一个str,但也可以是一个Agent,如果返回Agent的话,则将执行转移到该Agent。如果Agent的函数调用出现错误,错误响应会添加到聊天中,以便Agent可以正常恢复。如果Agent调用多个函数,他们将按顺序进行。

4.3 切换Agent及更新上下文变量

一个agent可以通过在function中返回它来将其移交给另一个代理。还可以通过返回更完整的Result对象来更新context_variables

5. 实战

本次实战主要运行项目自带的例子airline。这个例子能够很好地说明Swarm的运行机理。

5.1 Agent之间的整体交互流程

 

 

交互步骤如下:

  1. 首先经过意图识别Agent,判断是处理航班变更还是行李丢失,并分别通过transfer_to_flight_modification, transfer_to_lost_baggage切换到对应的Agent
  2. 如果是航班变更,则进一步判断是航班取消,还是航班更换,如果是航班取消,通过transfer_to_flight_cancel切换到”航班取消Agent”进行处理,该Agent支持退款、兑换飞行积分、向上级反馈、问题已解决、切换到意图识别Agent等5个方法;如果是航班更换,通过transfer_to_flight_change切换到”航班更换Agent”,该Agent支持更换有效性验证、更换成功、向上级反馈、问题已解决、切换到意图识别Agent等5个方法。
  3. 如果是行李的相关问题,则切换至”行李丢失Agent”,该Agent包含行李搜寻、向上级反馈、问题已解决、切换到意图识别Agent等4个方法

5.2 实战效果

其中User是我的输出,[2024...]是打印的日志,Triage Agent、Flight Modification Agent、Flight cancel traversal是对应的Agent或方法​调用大模型后返回的结果。

Starting Swarm CLI ��

User: 我想要退票

[2024-10-22 09:38:14] Ending turn.

Triage Agent: 请问您能提供一下您的航班号以及您希望退票的原因吗?

User: 航班号是1919,我的时间有些冲突了

[2024-10-22 09:38:48] Processing tool call: transfer_to_flight_modification with arguments {}

[2024-10-22 09:38:49] Processing tool call: transfer_to_flight_cancel with arguments {}

[2024-10-22 09:38:50] Ending turn.

Triage Agent: transfer_to_flight_modification()

Flight Modification Agent: transfer_to_flight_cancel()

Flight cancel traversal: 您提到的航班号是1919。请确认您是否确实是要取消这个航班。如果是的话,我将继续进行处理。

User: 是的

[2024-10-22 09:38:57] Ending turn.

Flight cancel traversal: 请问您是希望申请退款还是希望获得航班积分?

User: 退款吧

[2024-10-22 09:39:05] Processing tool call: initiate_refund with arguments {}

[2024-10-22 09:39:06] Ending turn.

Flight cancel traversal: initiate_refund()

Flight cancel traversal: 您的退款请求已被处理,退款将在3-5个工作日内完成。请您耐心等待。请问您还有其他问题吗?

User: 没有了,谢谢

[2024-10-22 09:39:16] Processing tool call: case_resolved with arguments {}

[2024-10-22 09:39:20] Ending turn.

Flight cancel traversal: case_resolved()

Flight cancel traversal: 感谢您的联系!如果将来有任何问题,请随时与我们联系。祝您有美好的一天!

User:

 

 

6.总结

一句话足矣~

本文主要是OpenAI开源multi-agent框架swarm进行介绍,包括其核心组件Agent, instructions,functions,多个Agent之间如何进行切换,以及针对其中的examples进行验证,框架及源码非常简单,看官们可以亲自尝试一下。

Multi-agent的适用场景非常丰富,比如客服、工作流处理等

如果想免费获取使用openai的看官,可私信沟通。

7.参考

(1) Swarm仓库: https://github.com/openai/swarm

 

 

标签:22,09,Agent,2024,Swarm,OpenAI,LLM,cancel
From: https://www.cnblogs.com/mengrennwpu/p/18492361

相关文章

  • AI大模型时代下运维开发探索第二篇:基于大模型(LLM)的数据仓库
    在SREWorks社区聚集了很多进行运维数仓建设的同学,大家都会遇到类似的挑战和问题:数仓中存储大量数据消耗成本,但很多存储的数据却并没有消费。进数仓的ETL学习成本高、管理成本高,相关同学配合度低,以及上游结构改动后ETL却迟迟无人调整。数仓中数据的时效性、准确性问题,导致很......
  • LLM学习-基础知识
    NLPNLP代表自然语言处理,是关于计算机和人类语言之间交互的领域。NLP涵盖了一系列任务,包括文本处理、语音识别、语言翻译、信息检索等。NLP技术的发展使得计算机能够理解、解释和生成人类语言,促进了许多领域的发展,包括智能助手、文本分析、情感分析等。LLMLLM指的是大型语言模型......
  • LLM大模型: blip2多模态大模型原理
      截止目前,图片检索领域最出名的应该是openAI的clip了,分别用bert和vit对text和image做encoder,然后让配对的embedding接近,不配对的embedding拉远,通过这种方法达到text匹配(检索)image的目的!但这种方式只能检索,没法生成text啊(比如对image做适当的description),咋整了?总结一下,单存的......
  • 【OpenAI】第一节(OpenAI API)获取OpenAI API KEY的两种方式,开发者必看全方面教程!
    在当今人工智能迅猛发展的时代,OpenAI的大模型为开发者提供了强大的文本生成能力。无论你是想创建聊天机器人、内容生成工具,还是其他创新应用,掌握如何获取和使用OpenAIAPIKey是你迈向成功的第一步!本文将详细介绍获取APIKey的步骤、充值方法以及如何在项目中调用API......
  • AI全栈开发:大模型LLM学习路线图来了!
    LLM学习可以为大家带来的能力:•......
  • 使用 Ollama 部署本地 LLM:构建 AI REST API 的简易指南
    最近已有不少大厂都在秋招宣讲,也有一些已在Offer发放阶段了。节前,我们邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对新手如何入门算法岗、该如何准备面试攻略、面试常考点、大模型技术趋势、算法项目落地经验分享等热门话题进行了深入的讨论。总结链......
  • LLM与Gamma.ai与Napkin的PPT制作
    LLM与Gamma.ai与Napkin的PPT制作Chagpt/Claude/LLM+Gamma+Napkin的组合好用到爆炸,制作一个分享的PPT就只需要几十分钟。Gamma.aiGamma.ai平台具有一系列显著的特点,这些特点使得它在PPT制作、内容创作以及数据分析等方面表现出色。以下是对Gamma.ai平台特点的详细归纳:一、......
  • OpenAI前CTO离职后大动作!Mira Murati为新AI项目融资1亿美元
    在科技界,创业者不断打破边界,而前OpenAI首席技术官(CTO)MiraMurati正准备掀起新一轮的AI风暴。Murati近期离开了OpenAI,并火速转向创业,目前正在为她的全新AI项目进行高达1亿美元的融资。她的迅速转型和新创项目的消息,立刻在行业内引发了热议。为何她选择在这个时机辞职?又会给AI......
  • 适用于 .NET 稳定的官方OpenAI库
    前言今天给大家分享一个由OpenAI官方提供,旨在为.NET开发者提供方便的接口来访问OpenAI的RESTAPI。这个项目通过NuGet包的形式发布,使得.NET应用程序能够轻松地集成和使用OpenAI的各种AI模型和功能,如文本生成、图像生成、音频转写等。类库主要特性命名空间组织......
  • 论文翻译:arxiv-2024.Dillon Bowen.Scaling Laws for Data Poisoning in LLMs
    ScalingLawsforDataPoisoninginLLMshttps://arxiv.org/pdf/2408.02946论文主要研究了大型语言模型在数据中毒威胁下的脆弱性,发现模型规模越大,对有害行为的学习速度越快,强调了在更大模型中建立健全数据保护措施的必要性。在大型语言模型(LLMs)中数据投毒的规模法则......