首页 > 其他分享 >要大爆发的AI Agent是什么?(软件测试人员需要掌握)

要大爆发的AI Agent是什么?(软件测试人员需要掌握)

时间:2024-09-24 19:18:58浏览次数:3  
标签:输出 AI 业务 Agent 版本 我们 软件测试

什么是AI Agent?


AI Agent 是一种软件程序,可以与环境交互,收集数据,并使用数据执行自主任务以实现预定目标。即人类设定目标,AI Agent 独立选择实现这些目标所需的最佳行动。

简单来说,AI Agent是一个能够感知环境、做出决策并采取行动以达成特定目标的自主实体。它基于预设的目标或任务,在给定的环境中运作,通过感知环境状态、处理信息、规划行动路径并最终执行行动来实现其功能。AI Agent的核心在于其“智能”——即通过算法模拟人类或其他生物的智能行为,以自动化解决复杂问题。

                                  

        AI Agent是一个智能代理程序,它通过人工智能技术来执行各种任务和功能。这些代理程序可以设计用于各种不同的目的,包括自动化任务、提供信息、解决问题、管理数据等等。

  

     

基于规则的 AI agent

 AI Agent可以是基于规则的,也可以是基于机器学习或深度学习的。基于规则的代理程序遵循预先定义的规则和逻辑来执行任务,而基于机器学习或深度学习的代理程序则通过数据学习和改进自身的行为。这些代理程序可以嵌入到各种设备和系统中,例如智能手机、智能家居设备、自动化生产线等。它们可以与用户进行交互,以执行特定的任务或提供帮助和建议。

       

 AI Agent的应用范围


       AI Agent的应用范围非常广泛,包括但不限于:智能助手、虚拟客服、自动驾驶汽车、工业机器人、金融交易系统、医疗诊断系统等等。随着人工智能技术的发展和普及,AI Agent将在各个领域发挥越来越重要的作用。AI Agent,你可以想象它就像是个特别聪明的小帮手。它能自己看环境、动脑筋想问题,然后做出决定,最后动手去做事情,这一切都是为了完成交给它的任务。

如何设计AI Agent

那么怎么设计符合业务需求的 AI Agent ?

1. 找到合适的业务场景

首先,我们需要确定适合AI Agent 的场景,通过模拟数据输入和收集输出结果的方式来评估所选场景的适宜程度。在判断输出结果的同时,需要考察是否符合预期。若结果不符合预期,则需要评估误差的严重程度,以及准确率和召回率是否存在改进空间。若存在改进空间,可以通过优化提示词,或者通过引入感知、行动和规划模块的构建,使得AI符合我们的场景需求。

其次,我们可以将业务场景进行划分,让AI仅负责适宜的场景,作为业务的辅助与补充,即使无法完全覆盖整个业务,也能发挥作用。

2. 梳理输入和输出预期

我们需要明确对于AI Agent的’目标’和’要求’,以确定我们输入什么,Agent需要输出什么。

基于这些’目标’和’要求’,我们应该思考如何选择合适的输入输出方式来满足业务需求并为业务赋能。这将有助于我们设计后续的输出流程,并在设计验证阶段进行评估,以确定是否符合要求。

3. 梳理输出流程

当我们面临复杂的输出要求时,需要设计多个AI会话流程,以使各个AI之间相互协作,最终实现符合要求的输出结果。例如,在文本分类场景中,我们可以首先使用3.5版本的大模型进行准确的一级分类,以满足需求。

由于4.0版本的成本是3.5版本的几十倍,而3.5版本在一级分类上已经足够使用,因此可以选择使用3.5版本以节省成本。接着,我们可以使用4.0版本进行二级分类,以获得更好的分类效果,确保我们输出所需的内容。

在设计流程时,需要考虑以下几个因素:

成本因素:不同大模型及其版本的费用各不相同,我们需要权衡业务收益,选择一个合理的大模型使用方案,以避免得不偿失。
效果因素:不同大模型及其版本的效果各有差异,并且在不同领域有其擅长之处。我们需要结合使用需求,选择最适合的方案。
综合考虑成本和效果因素,最终确定一个合适的方案。

                                 
4. 输出检验机制

为了避免AI输出结果中存在误导性内容对业务产生影响,我们需要建立一套有效的验证机制。常见的验证方法包括词库匹配、正则表达式匹配和人工检验。通过使用词库或人工方式拦截具有误导性的内容。此外,我们还可以构建质检Agent,让AI自身对输出进行质检,以过滤出存在问题的内容,提高误导性内容的检测率。

5. 幻觉兜底方案

幻觉的产生是无法完全根除的现象。为了避免对业务造成不良影响,我们需要制定兜底方案,例如:

1)人工检验:在AI输出传递给用户之前,引入人工检验环节。只有在人工检验通过后,才将结果输出给用户。这样一来,我们能够完美地防止AI幻觉对业务产生负面影响,并且还能够利用AI的输出结果提升效率。然而,这种方法需要人力审核,因此会增加一定的人力成本。

2)合理包装:考虑到我们是面向B端的AI应用,我们可以采用包装输出应用为“AI助手”等方式,直接向用户明确表示:“这里的输出结果由AI生成,仅供参考”。通过这种方式,我们能够让用户形成合理的心理预期,避免在出现幻觉输出时产生不良反应。

  

基于以上思路,我们便可以构建B端的翻译Agent、数据分类Agent、智能客服Agent等等业务了,当然这仅仅是我个人的一些思考。

                     

标签:输出,AI,业务,Agent,版本,我们,软件测试
From: https://blog.csdn.net/longxiaotian718/article/details/142496655

相关文章

  • 【ComfyUI工作流】神级AI文生图Flux.1本地一键部署整合包,6G显存NSFW版本​
    FLUX.1是由BlackForestLabs精心研发的AI图像生成模型,其强大的文本到图像的转换能力,让梦想变得触手可及。然而,FLUX.1模型对硬件的要求极为苛刻,尤其是显存需求高达42GB,这使得大多数普通用户难以直接运行该模型。为了解决这一难题,开发者们推出了FLUX.1GGUF版本。GGUF(GPT-Generated......
  • Serverless + AI 让应用开发更简单,加速应用智能化
    2024云栖大会开幕,在大会第一天,阿里云正式发布全新产品——云应用开发平台CAP。CAP拥有丰富的场景化应用模板,可以极速体验,并且具备更低的成本优势以及灵活组装等特点,成为广大开发者与企业必备的一站式应用开发平台,让应用开发更简单。阿里云云原生应用平台负责人丁宇AI被认为......
  • 重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系
    引言:近日,阿里云可观测产品家族正式发布云监控2.0,隶属产品日志服务SLS、云监控CMS、应用实时监控服务ARMS迎来重磅升级。借助全新升级的一站式全景接入、统一观测图谱以及AI增强的跨域智能洞察能力。同时,为了帮助企业与开发者更从容地面对AI创新,阿里云正式发布开箱即用的A......
  • 小渡AI论文写作研究生论文写作技巧
    ......
  • 小渡AI论文写作原创论文生成研究生论文写作技巧
    步骤:1.明确研究目标和问题:首先,确定你的研究目标和问题,明确你想要解决的研究问题和要达到的目标。这个步骤对于帮助你集中精力和确保研究的有效性非常重要。2.进行文献综述:进行文献综述是论文写作中的重要环节。你需要搜索和查阅相关文献,了解已有的研究成果和学术观点。文献......
  • 重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系
    引言:近日,阿里云可观测产品家族正式发布云监控2.0,隶属产品日志服务SLS、云监控CMS、应用实时监控服务ARMS迎来重磅升级。借助全新升级的一站式全景接入、统一观测图谱以及AI增强的跨域智能洞察能力。同时,为了帮助企业与开发者更从容地面对AI创新,阿里云正式发布开箱即用的......
  • 期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
    在AI程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都......
  • 期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
    在AI程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都......
  • 烟火识别算法、AI烟火识别算法、烟火检测算法
    烟火检测算法主要用于火灾早期预警系统中,能够在火灾初期阶段及时发现烟雾或火焰,从而快速响应并采取行动,以减少火灾带来的损失。这种技术广泛应用于公共安全、工业生产、家庭安全等领域。一、技术实现烟火检测算法通常依赖于计算机视觉和深度学习技术,通过分析图像或视频数据来检测......
  • 3. 初窥全貌 - main方法执行全流程
    0.前言一个类被编译为classfile之后,使用java命令去执行,暂时抛开OS层面的syscall 及glibc的入口函数,java中的main方法执行,经历了什么样的过程?要执行main方法,必须要有vm支持,那vm又是如何去构建的?本章我们把握整体流程,建立一个初步认识。1.整体流程1.main()  ma......