要大爆发的AI Agent是什么？（软件测试人员需要掌握）

什么是AI Agent？

AI Agent 是一种软件程序，可以与环境交互，收集数据，并使用数据执行自主任务以实现预定目标。即人类设定目标，AI Agent 独立选择实现这些目标所需的最佳行动。

简单来说，AI Agent是一个能够感知环境、做出决策并采取行动以达成特定目标的自主实体。它基于预设的目标或任务，在给定的环境中运作，通过感知环境状态、处理信息、规划行动路径并最终执行行动来实现其功能。AI Agent的核心在于其“智能”——即通过算法模拟人类或其他生物的智能行为，以自动化解决复杂问题。

AI Agent是一个智能代理程序，它通过人工智能技术来执行各种任务和功能。这些代理程序可以设计用于各种不同的目的，包括自动化任务、提供信息、解决问题、管理数据等等。

基于规则的 AI agent

AI Agent可以是基于规则的，也可以是基于机器学习或深度学习的。基于规则的代理程序遵循预先定义的规则和逻辑来执行任务，而基于机器学习或深度学习的代理程序则通过数据学习和改进自身的行为。这些代理程序可以嵌入到各种设备和系统中，例如智能手机、智能家居设备、自动化生产线等。它们可以与用户进行交互，以执行特定的任务或提供帮助和建议。

AI Agent的应用范围

AI Agent的应用范围非常广泛，包括但不限于：智能助手、虚拟客服、自动驾驶汽车、工业机器人、金融交易系统、医疗诊断系统等等。随着人工智能技术的发展和普及，AI Agent将在各个领域发挥越来越重要的作用。AI Agent，你可以想象它就像是个特别聪明的小帮手。它能自己看环境、动脑筋想问题，然后做出决定，最后动手去做事情，这一切都是为了完成交给它的任务。

如何设计AI Agent

那么怎么设计符合业务需求的 AI Agent ？

1. 找到合适的业务场景

首先，我们需要确定适合AI Agent 的场景，通过模拟数据输入和收集输出结果的方式来评估所选场景的适宜程度。在判断输出结果的同时，需要考察是否符合预期。若结果不符合预期，则需要评估误差的严重程度，以及准确率和召回率是否存在改进空间。若存在改进空间，可以通过优化提示词，或者通过引入感知、行动和规划模块的构建，使得AI符合我们的场景需求。

其次，我们可以将业务场景进行划分，让AI仅负责适宜的场景，作为业务的辅助与补充，即使无法完全覆盖整个业务，也能发挥作用。

2. 梳理输入和输出预期

我们需要明确对于AI Agent的’目标’和’要求’，以确定我们输入什么，Agent需要输出什么。

基于这些’目标’和’要求’，我们应该思考如何选择合适的输入输出方式来满足业务需求并为业务赋能。这将有助于我们设计后续的输出流程，并在设计验证阶段进行评估，以确定是否符合要求。

3. 梳理输出流程

当我们面临复杂的输出要求时，需要设计多个AI会话流程，以使各个AI之间相互协作，最终实现符合要求的输出结果。例如，在文本分类场景中，我们可以首先使用3.5版本的大模型进行准确的一级分类，以满足需求。

由于4.0版本的成本是3.5版本的几十倍，而3.5版本在一级分类上已经足够使用，因此可以选择使用3.5版本以节省成本。接着，我们可以使用4.0版本进行二级分类，以获得更好的分类效果，确保我们输出所需的内容。

在设计流程时，需要考虑以下几个因素：

成本因素：不同大模型及其版本的费用各不相同，我们需要权衡业务收益，选择一个合理的大模型使用方案，以避免得不偿失。
效果因素：不同大模型及其版本的效果各有差异，并且在不同领域有其擅长之处。我们需要结合使用需求，选择最适合的方案。
综合考虑成本和效果因素，最终确定一个合适的方案。

4. 输出检验机制

为了避免AI输出结果中存在误导性内容对业务产生影响，我们需要建立一套有效的验证机制。常见的验证方法包括词库匹配、正则表达式匹配和人工检验。通过使用词库或人工方式拦截具有误导性的内容。此外，我们还可以构建质检Agent，让AI自身对输出进行质检，以过滤出存在问题的内容，提高误导性内容的检测率。

5. 幻觉兜底方案

幻觉的产生是无法完全根除的现象。为了避免对业务造成不良影响，我们需要制定兜底方案，例如：

1）人工检验：在AI输出传递给用户之前，引入人工检验环节。只有在人工检验通过后，才将结果输出给用户。这样一来，我们能够完美地防止AI幻觉对业务产生负面影响，并且还能够利用AI的输出结果提升效率。然而，这种方法需要人力审核，因此会增加一定的人力成本。

2）合理包装：考虑到我们是面向B端的AI应用，我们可以采用包装输出应用为“AI助手”等方式，直接向用户明确表示：“这里的输出结果由AI生成，仅供参考”。通过这种方式，我们能够让用户形成合理的心理预期，避免在出现幻觉输出时产生不良反应。

基于以上思路，我们便可以构建B端的翻译Agent、数据分类Agent、智能客服Agent等等业务了，当然这仅仅是我个人的一些思考。

标签：输出,AI,业务,Agent,版本,我们,软件测试
From： https://blog.csdn.net/longxiaotian718/article/details/142496655