首页 > 其他分享 >智能体时代:Agent开发的三重境界

智能体时代:Agent开发的三重境界

时间:2024-08-07 22:01:53浏览次数:11  
标签:API 境界 AI 模型 Agent 开发 三重 自然语言

在人工智能领域,Agent开发是一个不断演进的过程,它涉及到如何将AI技术与实际应用相结合,以提高效率、增强用户体验和推动业务发展。本文将探讨Agent开发的三个阶段,从基础的API使用到复杂的智能应用开发,逐步深入,帮助读者理解Agent开发的深层含义。

引言

随着人工智能技术的飞速发展,Agent(智能体)的概念已经从科幻小说走进了现实世界。Agent可以被理解为一种具有一定智能的软件实体,它能够自主地执行任务、做出决策并与其他系统交互。

  • Demo地址:https://github.com/q2wxec/langgraph-demo/tree/master/coalagent/

当作能理解语义的API使用

在Agent开发的初级阶段,我们可以将大语言模型视为一种能理解自然语言的API。这意味着,我们可以像调用任何传统API一样,向Agent发送请求,并期望得到一个经过理解和处理的响应。

在这个阶段开发的智能体,大多是在传统软件业务流程中,嵌入LLM的能力,对软件功能进行增强。对LLM使用局限在其对自然语言的理解能力上,应用场景大多局限在,文本生成、总结等方面,与传统软件开发调用各类工具的api的模式并无明显区别。典型用例如下:

短视频文案创作

我们可以将Agent作为一个内容生成器,输入视频的关键信息,Agent则能够根据这些信息生成吸引人的文案。这个过程可以看作是将Agent作为一个文本生成API来使用。

新闻日报总结

另一个典型的应用场景是新闻内容的自动总结。Agent可以接收大量的新闻数据,然后通过自然语言理解能力,提炼出关键信息,生成一份简洁的新闻日报。结合网页信息获取工具,我基于LangChain做了一个简单的新闻总结demo见github。

在这一阶段,Agent的开发主要集中在如何更好地理解和处理自然语言上。开发者在AI领域只需要熟悉自然语言处理(NLP)的基本原理,在AI工程上用到最多的也限于提示词优化,就能够利用现有的AI模型来实现这一功能。

当作自然语言编程工具使用

从API到编程工具的转变

在第二阶段,Agent不再仅仅是一个理解语言的API,而是一个可以进行自然语言编程的工具。这意味着,开发者可以通过自然语言来指导Agent完成更复杂的任务。

在这个阶段开发的智能体,不再局限于文本理解的场景。通过提示词工程,function_calling等方式,能够让大语言模型按提示要求格式化输出内容,进而在一定程度上能够重塑传统软件业务流程的多个环节,可以说是通过LLM进行自然语言编程应用。典型用例如下:

数据表汇总与去重

在这个场景中,Agent接收多个数据表,然后通过自然语言提示,自动进行数据汇总和去重,最终输出一份整洁的汇总表。使用LangGraph的流程编排,我实现了一个结合数据处理,过滤,去重,汇总的数据表汇总demo见github。

自动推动业务流程

通过AI执行意图识别,Agent可以在某些业务流程中减少人工审核环节,自动识别并推动流程的执行。
为了实现这一阶段的功能,开发者需要掌握提示词工程和function_calling等技术。这些技术允许开发者通过自然语言来指导Agent的行为,使其能够按照预期执行特定的任务。

当作真正的智能使用

在Agent开发的第三阶段,Agent被真正当作一个智能体来使用。这时,Agent不再只是一个简单的API或者工具,而是成为了一个具有自主决策能力的智能伙伴。

这个阶段的智能体开发,与大家理解的AI原生应用开发大体相同(虽然AI原生应用也没有一个规范统一的定义),但这个阶段的应用开发与传统软件开发的思维方式确实是完全不同了,LLM被真正当作智能来使用。

在软件开发时,可能更多要思考的是,这个事情如果是由一个人类团队来执行,

  • 需要哪些角色(提示词Role限定)

  • 这些相关角色需要具备哪些技能(tools绑定)

  • 团队之间应该如何交互(state设置)

  • 团队之间的工作如何流转(workflow的设置)

可以看到,这个阶段LLM不再作为API独立存在,而是绑定了角色和技能,并需要进行多个agent的组合,已经与人类智能的使用方式一致。典型用例如下:

Plan-and-Execute

Plan-and-Execute指的是涉及规划与执行两个主要步骤的过程,Agent需要根据给定的目标自主生成计划,并基于计划步骤自动执行任务,这要求Agent具备理解计划、制定策略并执行任务的能力。

例如,如果给定的任务是“计划一次从北京到上海的旅行”,那么大语言模型的“规划”步骤可能包括确定旅行日期、选择交通方式、预订住宿和活动等,而“执行”步骤则可能涉及生成详细的行程安排和必要的预订步骤。

作者结合搜索和自动问答工具,使用Plan-and-Execute做了一款搜索问答增强demo见github。

示例2:BabyAgI

BabyAGI是一个由开发者Yohei Nakajima创建的AI驱动的任务管理系统。它利用OpenAI和Pinecone APIs来创建、优先排序和执行任务

在这一阶段,开发者需要考虑的是如何将Agent与人类团队的工作方式相结合。这涉及到角色限定、技能绑定、状态设置以及工作流程的设置等多个方面。

结语

Agent开发的三重境界代表了AI技术从简单应用到深度融合的演进过程。随着技术的不断进步,我们有理由相信,Agent将在未来的软件开发中扮演越来越重要的角色。对于程序员而言,理解并掌握Agent开发的这三个阶段,将有助于他们更好地适应未来的技术发展趋势。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:API,境界,AI,模型,Agent,开发,三重,自然语言
From: https://blog.csdn.net/lvaolan/article/details/141002072

相关文章

  • 【AI Agent】一文讲透Agent!!
    ......
  • OpenAI Function Call大模型调用单个多个agent案例
    参考:https://platform.deepseek.com/api-docs/zh-cn/function_callinghttps://blog.csdn.net/qq_31095905/article/details/139143778https://blog.csdn.net/jacbo/article/details/136278619##官方案例https://cookbook.openai.com/examples/how_to_call_functions_wi......
  • AI科普:探索人工智能体(Agent)的世界
    前言近来,人工智能(AI)正在逐渐融入我们生活的各个角落。而在AI领域中,一个核心概念就是“人工智能体”(Agent)。那么,究竟什么是人工智能体?它们如何工作?又将在未来扮演怎样的角色呢?接下来,让我们一起探索这个神奇的世界!人工智能体简介智能体(Agent):它是一种能够自主行动、与......
  • 解锁监控新境界:Zabbix——您的全能IT运维守护者
     作者简介:我是团团儿,是一名专注于云计算领域的专业创作者,感谢大家的关注 座右铭:云端筑梦,数据为翼,探索无限可能,引领云计算新纪元 个人主页:团儿.-CSDN博客目录实验目标:安装zabbix,并实现基本的监控实验拓扑:192.168.8.5 zabbix-server         192.16......
  • 生成式 AI 的发展方向:Chat 还是 Agent?
    ......
  • 【YashanDB知识库】ycm纳管主机安装YCM-AGENT时报错“任务提交失败,无法连接主机”
    问题现象执行安装ycm-agent命令纳管主机时报错问题的风险及影响会导致ycm-agent纳管不成功,YCM无法监控主机和数据库问题影响的版本yashandb-cloud-manager-23.2.1.100-linux-aarch64.tar问题发生原因因为10.149.223.121对ycm的主机没有开放端口9070或9071解决方法及规避......
  • RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anythi
    RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐1.MaxKBMaxKB=MaxKnowledgeBase,是一款基于LLM大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一......
  • 什么是智能体(agent)
    智能体(Agent)是人工智能领域中的一个核心概念。在最基本的层面上,智能体可以被定义为一个实体,它能够在其所处的环境中自主地感知信息,并根据这些信息做出决策,以实现特定的目标或任务。智能体的关键特性包括自主性、感知能力和决策能力。自主性:智能体能够在没有外部干预的情......
  • LONGAGENT:优化大模型处理长文本
    人工智能咨询培训老师叶梓转载标明出处有的大模型(LLMs),尽管在语言理解和复杂推理任务上取得了显著进展,但在处理这些超长文本时却常常力不从心。它们在面对超过10万令牌的文本输入时,常常会出现性能严重下降的问题,这被称为“中间丢失”现象。这一问题不仅限制了LLMs在实际应用......
  • Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版)
    吴恩达教授最近在红杉AI峰会上讲述了他对Agent的一些看法,尽管一些媒体已经进行了相关报道,但为了分发的及时性,而采用了机翻的方式,牺牲了表述的准确性,增加了不必要的阅读门槛。特工宇宙于是重新整理翻译了一版,既保留了吴恩达教授的原意,又加之了部分个人理解。期望即使是......