检索增强生成RAG

时间：2024-01-05 18:13:56浏览次数：28

标签：检索 RAG 信息生成响应文档

检索增强生成（Retrieval-Augmented Generation, RAG）是一种结合了检索（搜索）和生成（如自动文本生成）的技术。

它通常用于自然语言处理（NLP）任务，如问答、文本摘要或聊天机器人的构建。

RAG的优势

RAG 通过首先从一个大型文档集合中检索相关信息，然后基于这些信息生成响应来工作。

这种方法的优势在于，它可以利用检索到的信息来生成更准确、更丰富的回答或内容。

减少幻觉

就像有时人们可能会记错事情或混淆细节一样，计算机生成的文本也可能包含错误或捏造的信息。

RAG通过查找真实的、已经存在的信息来生成回答，这就像在说话前先查一下资料，确保所说的内容是准确的，从而减少了错误或虚构信息的可能性。

图：幻觉
左侧：“我想写一篇关于火星的文章，但我记不清火星的表面温度是多少，然后不查资料各种幻觉。”
右侧：“我查了一下资料，火星的表面温度约为-63℃。”

促进事实检查

使用RAG就像有一个可以随时查证的智能助手。它在生成回答时会参考一些已经存在的信息源。

这就意味着用户可以回头去看看这些信息源，来检查RAG给出的答案是否准确，就像你在网上看到一个新闻后去查看原始来源一样。

图：你在网上看到一个新闻后，去查看原始来源。

提高特定领域任务的准确性

想象一下，如果你在一个特别专业的领域提出问题，比如关于罕见疾病的治疗，RAG能够找到和这个主题密切相关的专业文章或数据，然后用这些信息来回答你的问题。

这就像有一个能够即刻访问大量专业书籍和资料的专家一样，可以提供更准确、更具针对性的答案。

图：能够即刻访问大量专业书籍和资料的专家

灵活性

RAG的运作就像是有一个非常聪明且灵活的图书管理员。你不需要每次都教它新东西，而是通过改变它可以访问的资料库（即矢量数据库），它就能找到不同的答案。

这就像你告诉图书管理员今天你对科学感兴趣，明天又对历史感兴趣，而他能够每次都找到相关的书籍。

图：可以灵活切换资料库的图书馆

对公司来说具有成本效益

对于那些已经有大量相关信息的公司来说，使用RAG就像是找到了一个更便宜、更高效的办法来改进他们的服务或产品。

他们不需要花大量时间和金钱来训练一个全新的系统，而是可以利用他们已有的数据和信息来提升效果，这就像是用现有的资源来做更好的事情，而不是从头开始。

图：RAG对企业来说，可以低成本的利用现有知识库

RAG的局限性

RAG在使用时，会遇到下面的限制和挑战：

依赖于语义搜索

RAG 的有效性高度依赖于语义搜索的质量。

如果搜索检索到不相关或低质量的文档，则生成的响应的质量也可能很差。

需要现有数据

RAG 依赖于要从中检索文档的现有数据库。

如果没有大量的数据库，就不可能利用 RAG 的优势。

延迟问题

首先检索文档然后生成响应的两步过程可能会导致延迟。

这可能不适合需要实时响应的应用程序。

上下文长度限制

GPT和Gemini这些都有最大上下文长度限制，如果输入序列和检索到的文档的组合长度超过此限制，则必须截断某些信息，这会影响响应的质量。

总结

检索增强生成（Retrieval-Augmented Generation, RAG）是一种结合了检索和生成技术的方法，主要用于自然语言处理任务，如问答、文本摘要或聊天机器人。它通过从大型文档集合中检索相关信息，然后基于这些信息生成响应，从而提供更准确、丰富的内容。

RAG的优势包括减少错误或虚构信息（减少幻觉），促进事实检查，提高特定领域任务的准确性，灵活性以及对公司来说的成本效益。

然而，它也有局限性，如高度依赖语义搜索质量、需要现有数据、可能产生的延迟问题，以及面临上下文长度限制。

这些特点使得RAG在处理复杂的语言任务时既有效又具有挑战性。

标签：检索,RAG,信息,生成,响应,文档
From： https://www.cnblogs.com/ghj1976/p/17947784/RAG

大语言模型优化方法简介：Prompt、RAG、Fine-tuning
GPT、LLama、Gemini等大语言模型虽展现出强大能力，但在实际应用中仍有问题，例如在准确性、知识更新速度和答案透明度方面，仍存在挑战。论文“Retrieval-AugmentedGenerationforLargeLanguageModels:ASurvey（面向大语言模型的检索增强生成技术：调查）”https://arxiv.org/abs/231......
支持API文档生成，API管理工具：Apipost
随着数字化转型的加速，API（应用程序接口）已经成为企业间沟通和数据交换的关键。而在API开发和管理过程中，API文档、调试、Mock和测试的协作显得尤为重要。Apipost正是这样一款一体化协作平台，旨在解决这些问题，提高API开发效率和质量。Apipost提供API文档管理功能，让后端开发人员可以在开......
支持API文档生成，API管理工具：Apipost
随着数字化转型的加速，API（应用程序接口）已经成为企业间沟通和数据交换的关键。而在API开发和管理过程中，API文档、调试、Mock和测试的协作显得尤为重要。Apipost正是这样一款一体化协作平台，旨在解决这些问题，提高API开发效率和质量。 Apipost提供API文档管理功能，让后端开发人员可......
react-draggable All In One
ReactDraggableComponentAllInOneHTML5DnD/DragandDrop/draggableDraggableAPIreact-draggablehttps://www.npmjs.com/package/react-draggablehttps://github.com/react-grid-layout/react-draggabledemoshttps://react-grid-layout.github.io/react-......
Python生成文件的MD5
importhashlibdefcalc_md5(filename):md5_hash=hashlib.md5()withopen(filename,"rb")asf:#Readandupdatehashinchunksof4Kforbyte_blockiniter(lambda:f.read(4096),b""):md5_hash.up......
SpringCloud微服务实战——搭建企业级开发框架（三十二）：代码生成器使用配置说明
一、新建数据源配置因考虑到多数据源问题，代码生成器作为一个通用的模块，后续可能会为其他工程生成代码，所以，这里不直接读取系统工程配置的数据源，而是让用户自己维护。参数说明数据源名称：用于查找区分数据源的名称连接地址：连接方式:数据库类型:数据库地址等参数，例：jdbc:m......
JAVA-EE使用谷歌的ZXing实现生成带LOGO的QR Code------JAVA-EE
packagecom.powernode.qrcode.servlet;importcom.google.zxing.BarcodeFormat;importcom.google.zxing.EncodeHintType;importcom.google.zxing.MultiFormatWriter;importcom.google.zxing.common.BitMatrix;importcom.google.zxing.qrcode.decoder.ErrorCorrect......
【Webpack】-定义及各种使用和自动生成html插件
一、什么是Webpackwebpack被定义为现代JavaScript应用程序的静态模块打包器(modulebundler)，是目前最为流行的JavaScript打包工具之一。静态模块：指的是编写代码过程中的，html,css,js,图片等固定内容的文件打包：把静态模块内容，压缩，整合，转译等（前端工程化）1.把less/sass转成css代码2.......
[简道云] 表单开发-如何检索出差日期并禁止重复日期提交
应用场景技术员申请出差，处理项目维护业务，但是部分员工，填报时经常记错日期，交叉登记出差日期，引发后续报销费用重复情况。已存在的表单功能登记出差开始日期，结束日期自动列出所选择范围的全部日期自动计算所选择范围的出差天数需要处理的问题新增一个字段，实现检索已录入的出差人员，出差......
川普真会说中文？连嘴型都同步，用VideoReTalking一键生成你的AI播报员
你能想到这种画面吗？霉霉在节目中用普通话接受采访，特朗普在老家用中文脱口秀，蔡明老师操着一口流利的英文调侃潘长江老师..这听起来似乎很魔幻，可如今全部由VideoReTalking实现了你只需要传入一个视频文件和音频文件，它会生成一个新的视频，在这个视频里，不仅人物的嘴型会与音频同步，就连表......