首页 > 其他分享 >Agent 如何更有用

Agent 如何更有用

时间:2024-05-25 19:35:01浏览次数:27  
标签:如何 AI 模型 Agent 有用 幻觉 方法 工具

先看这篇会更连贯 Agent的记忆能力

学习来源

LLM的基础能力

1、复杂任务的规划和分解

2、遵循复杂指令

3、自主使用工具

4、减少幻觉

一两个人就能开发的有用AI

AI的优势:长文本的阅读理解能力、广阔的知识面。

1、导游:GPT-4知道很多著名景点,还能做行程规划。

2、企业ERP助手:对 需求描述能力、架构设计能力、技术表达能力 有很强的要求。What - Why - How 有条理的讲清楚自己做的东西。

3、大模型采集数据:本质是利用了大模型阅读速度比人快的特点。不需要定制开发。

4、手机语音助手:RPA(机器人流程自动化) 比如腾讯的AppAgent,可以自动学习操作 Telegram、Youtube、Gmail、Lightroom等多款app。RPA的主要难点是 学习使用app的过程。「app的各种功能、操作序列的记录等」

5、会议和生活记录器

Zoom:包括将会议语音内容实时转录成文字;根据实时转录的文字,将会议所讲过的内容做总结;根据实时转录的文字,用户提出问题,大模型给出问题的回答。

Rewind.AI 的录屏和录音吊坠:本地化算力或者隐私计算是解决隐私问题的必由之路

解决复杂任务和使用工具

记忆是有趣和有用 AI 都必须具备的公共能力。

情感是有趣 AI 需要的。

解决复杂任务和使用工具更多是有用 AI 所需的能力。

(1)CoT:先想后说

(2)复杂任务的规划和分解

Agent-FLAN论文 可知,这一步相对于检索、理解要更难,是模型基础能力问题,需要依靠 scaling law。另外从系统角度思考,与用户交互式解决复杂任务是很重要的,AI遇到困难要及时求助

(3)自动调用多种工具分步求解

a.按照流程调用工具的方法是 few-shot(在prompt中给AI提供几个样例任务的执行过程)

b.让AI学会使用上万种工具:方法一是SFT、pretrain;方法二是RAG+prompt

减少幻觉的工程方法

消除幻觉的根本方法是 scaling law,靠基模进步。但也有一些工程方法来缓解:

(1)事实性校验

大模型生成 - RAG(搜索引擎、向量数据库、倒排索引、知识图谱等)找出与回答内容匹配的原始语料 - 前两步一起送给大模型,让LLM判断回答与原始语料是否相符

这种方法只能发现 编造事实类的幻觉,不能发现答非所问类的幻觉。

(2)多次生成

类似投票的思想,多次生成同一问题的回答,然后一起给到大模型,让大模型挑出最一致的结果。

这种方法可以解决偶发的幻觉问题,但不能解决系统性偏差。

开源模型的护城河

  • 微调:基于微调而非prompt构建更像一个人的agent
  • 推理优化:降低成本和延迟
  • 多模态:语音、图片、视频理解和生成
  • 基于Embedding的记忆:例如LongGPT
  • 流式推理(例:多个Agent语音聊天):基于KV Cache的工作记忆和流式推理
  • 本地化部署:数据安全需求的to B场景
  • 终端设备:有隐私需求的个人终端设备
  • 机器人

未记录的

成本
数字生命
去中心化
详见 AI Agent更有趣还是更有用

标签:如何,AI,模型,Agent,有用,幻觉,方法,工具
From: https://blog.csdn.net/jinselizhi/article/details/139087210

相关文章

  • 如何让ALG、FPGA、EMU、SOC、SubIp实现驱动复用
       摘要        在芯片验证场景中,我们通常涉及到算法team、fpga测试team、EMUteam、SOC验证和Subip验证如何对芯片的完备性测试的探讨。由于各个team都是相互独立的,很多flow都是独立开发出来,对于交互的文件也是五花八门,这些文件各team协助起来很不方便,如何打通......
  • 面试题剖析:Netty编解码如何解决拆包沾包问题?
    今天我们要聊的主题是Netty的编解码机制,特别是如何解决TCP的拆包和沾包问题。如果你曾在处理网络数据传输时遇到数据包混乱的情况,那么你已经体验过拆包和沾包的“乐趣”了。别担心,Netty提供了一系列强大的解码器,帮助我们轻松应对这些问题。本文将详细介绍这些解码器的工作原......
  • 探索大模型的智慧之源:如何使其更“聪明”?
            在人工智能技术的浪潮中,大模型已经成为了引领变革的重要力量。它们在语言理解、图像识别、自然语言生成等多个领域展现出了令人瞩目的能力。然而,正如任何技术进步都伴随着挑战,大模型在理解力、泛化能力和适应性方面仍有待提升。那么,我们如何让这些庞然大物变得......
  • 服务器端口号怎么看?如何查看服务器端口号呢?有哪些需要注意的?
    简单来说,端口号就是计算机与外界通讯交流的出口,每个端口都有不同的编号,也就是“端口号”。它们是唯一的,用于标识不同的服务和应用程序。通过端口号,我们可以知道哪些服务正在运行,以及如何与它们进行通信。那么,如何查看服务器端口号呢?以下是一些常用的方法:一、通过命令行查看......
  • HR招聘测评,如何判断候选人的团队协作能力?
    什么是团队协作能力?团队协作能力,说的是在集体环境中,能同他人协同工作,为追求共同的目标而努力,其中包括沟通,表达,协调,尊重,信任,责任共担等一系列综合素质要求。良好的团队协作能力,可以促进效率提升,激发团队成员的热情,创造力,能确保任务质量和效率。对于企业和团队来说,都希望招聘进......
  • Android14音频进阶之AAOS之CarAudioService如何衔接AudioControl服务(七十四)
    简介:CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长!优质专栏:Audio工程师进阶系列【原创干货持续更新中……】......
  • html中如何改变value返回值在页面的位置
    如果您想在HTML页面上更改一个元素(如 <div> 或 <span>)的 value 返回值或者内容的位置,通常可以通过JavaScript来实现。以下是一种常见的方法:HTML结构:首先在HTML中定义一个元素,例如 <div>,并为其设置一个 id 以便JavaScript可以选择该元素进行操作。<!DOCTYPE......
  • 【电源专题】什么是层间短路(Rare Short),如何检测?
    层间短路发生的原因        一般线圈类制品是以漆包线缠绕导磁材料制造而成,漆包线是指外层披覆一层薄薄绝缘漆的铜线。我们常见的线圈类制品有:电源变压器、高压变压器、SwitchingPower变压器、通讯变压器、脉冲变压器、环型变压器、电力传输变压器、音频传......
  • wxPython==4.2.1 aui.AuiToolBar 如何去掉烦人的抓手?
    aui.AuiToolBar如何去掉烦人的抓手?最近在用wxPython做一些GUI小应用,发现工具栏总有几个点(抓手),很影响美观,如下:目前官方没有提供隐藏抓手的功能,需要更改源码的auibar.py文件注释掉对应代码。如下:#注释这句,大致在auibar.py+3480(不同版本可能有差异)#self._art.DrawGrip......
  • 如何恢复未保存或已删除/丢失的 Word 文件?
    关闭Word应用程序而不保存文档?误删除了Word文档?许​​多用户在不同情况下会丢失Word文档。如果您不幸遇到此类问题,如何恢复已删除或未保存的Word文档?有一些方法可以恢复未保存/删除的文档。此外,您还可以使用Word文件恢复软件来恢复已删除/丢失的Word文档。恢复未......