首页 > 其他分享 >论文阅读:Corrective Retrieval Augmented Generation

论文阅读:Corrective Retrieval Augmented Generation

时间:2024-06-18 19:43:40浏览次数:26  
标签:检索 RAG Corrective Generation 生成 CRAG 文档 Retrieval 评估器

Corrective Retrieval Augmented Generation(https://arxiv.org/pdf/2401.15884.pdf)

https://github.com/jiangnanboy/paper_read_note

一.序言

RAG即检索增强生成(retrieval augmented generation),当检索到不准确的数据时,会产生对模型的生成干扰。Corrective Retrieval Augmented Generation (CRAG)方法可以增强生成的鲁棒性(是当检索中有错误时)。

CRAG是一个轻量级的检索评估器,它评估被检索文档的整体质量,提供一个置信度来触发不同的知识检索操作。此外,为了解决静态和有限语料库的局限性,大规模网络搜索被用于增强检索结果。CRAG对检索到的文档采用分解-再重组(decompose-then-recompose)算法,允许选择性地关注关键信息并过滤掉不相关的细节。CRAG被设计为即插即用,并可与各种基于RAG的方法无缝集成。

代码: github.com/HuskyInSalt/CRAG

二.CRAG概述

如下图,构建一个检索评估器来评估检索的文档与输入的相关性。在对置信度进行估计的基础上,触发正确、不正确、不确定(Correct,Incorrect,Ambiguous)的知识检索动作。

所提出的方法为纠错检索增强生成(CRAG),旨在自我纠正检索结果并提高生成文档的利用率。引入了一个轻量级检索评估器来评估给定查询的检索文档的总体质量。该评估器是检索增强生成(RAG)的关键组成部分,通过审查和评估检索文档的相关性和可靠性,为信息生成做出贡献。检索评估器输出一个置信度,根据评估实现不同的知识检索操作,如正确、不正确、不确定(Correct,Incorrect,Ambiguous)。对于不正确和不确定(Incorrect,Ambiguous)的情况,将网络搜索整合进来,以解决静态和有限语料库的局限性,旨在提供更广泛和更多样化的信息集。最后,在整个检索和利用过程中实现了分解-重构算法。该算法有助于消除对RAG没有帮助的检索文档中的冗余上下文,改善信息提取过程并优化关键信息的包含,同时减少非必要元素。

三.检索评估器(Retrieval Evaluator)

检索评估器的准确性在决定整个系统的性能方面起着关键作用。该算法确保了检索信息的精细化,优化了关键信息的提取,并最大限度地减少了非必要元素的包含,从而提高了检索数据的利用率。这里利用轻量级T5-large预训练模型对检索评估器进行了微调。

四.推理

五.结论

本文主要研究了检索增强生成(retrieval - augmented Generation, RAG)方法在检索结果不准确、导致语言模型生成错误知识时所面临的挑战。提出的解决方案被研究人员称为纠错检索增强生成(CRAG)。该研究引入了CRAG作为即插即用的解决方案,通过减轻不准确检索引起的问题来增强生成的鲁棒性。CRAG包含一个检索评估器,用于估计和触发三种不同的动作。在CRAG中包含网络搜索和优化的知识利用操作,改进了自动自我纠正,提高了检索文档的有效利用。

标签:检索,RAG,Corrective,Generation,生成,CRAG,文档,Retrieval,评估器
From: https://www.cnblogs.com/little-horse/p/18254997

相关文章

  • VideoGeneration
    StableVideoDiffusion:ScalingLatentVideoDiffusionModelstoLargeDatasets主要贡献:设计了一套数据清洗策略来清洗大规模的低质量的数据,用于训练T2V的SOTA模型,并证明了此模型具有足够强的关于动作和3D的先验知识可以用于视频相关的下游任务。目前主要的T2V的模型都是......
  • CoLLEGe: Concept Embedding Generation for Large Language Models
    本文是LLM系列文章,针对《CoLLEGe:ConceptEmbeddingGenerationforLargeLanguageModels》的翻译。CoLLEGe:大型语言模型的概念嵌入生成摘要1引言2相关工作3CoLLEGe:概念学习与语言嵌入生成4用于训练CoLLEGe的数据集5实验6结论和讨论摘要当前的语言......
  • [论文速览] Design and Development of a Framework For Stroke-Based Handwritten Gu
    1.Pretitle:DesignandDevelopmentofaFrameworkForStroke-BasedHandwrittenGujaratiFontGenerationsource:arXiv2024paper:https://arxiv.org/abs/2404.03277code:None关键词:fontgeneration,handwritten,gujarati,stroke阅读理由:刷新鲜论文ing2.Mo......
  • [论文阅读] FontDiffuser@ One-Shot Font Generation via Denoising Diffusion with M
    Pretitle:FontDiffuser:One-ShotFontGenerationviaDenoisingDiffusionwithMulti-ScaleContentAggregationandStyleContrastiveLearningaccepted:AAAI2024paper:https://arxiv.org/abs/2312.12142code:https://github.com/yeungchenwa/FontDiffuserref:......
  • Re-Search for The Truth Multi-round Retrieval-augmented Large Language Models ar
    本文是LLM系列文章,针对《Re-SearchforTheTruth:Multi-roundRetrieval-augmentedLargeLanguageModelsareStrongFakeNewsDetectors》的翻译。重新寻找真相:多轮检索增强的大型语言模型是强大的假新闻检测器摘要1引言2相关工作3方法4实验5结论局限......
  • Elevate Your Lead Generation Game with Maps Scraper AI
    RevolutionizingLeadGenerationTransformingLeadAcquisitionMapsScraperAIintroducesagroundbreakingapproachtoleadgenerationbyautomatingtheextractionofvaluabledatafromBingMapslistings.Thisinnovativemappingtoolstreamlinestheproce......
  • 【论文速读】LLM-Augmented Retrieval:EnhancingRetrievalModels Through LanguageMod
    论文链接:https://arxiv.org/html/2404.05825v1文章标题:LLM-AugmentedRetrieval:EnhancingRetrievalModelsThroughLanguageModelsandDoc-LevelEmbedding这篇文章提出了一种与检索模型无关的框架框架,通过大型语言模型来丰富文档的嵌入,显著提高了现有检索模型的性......
  • Bridging Language and Items for Retrieval and Recommendation
    目录概BLaIR代码HouY.,LiJ.,HeZ.,YanA.,ChenX.,andMcAuleyJ.Bridginglanguageanditemsforretrievalandrecommendation.2024.概本文提出了一种利用对比损失训练的预训练模型,能够把握数据集中的交互信息.BLaIRBLaIR的思想很简单如上图所示,输入......
  • dbeaver连接mysql报错Public Key Retrieval is not allowed
    这个错误通常发生在尝试通过JDBC连接MySQL数据库时,并且是由于MySQL的配置不允许公钥检索导致的。从MySQL5.0开始,连接时默认需要使用密钥进行密码加密传输。如果JDBC驱动程序尝试通过不允许公钥检索的方式进行连接,就会抛出这个错误。解决方法:更新JDBC连接字符串,添加允许公钥检......
  • text-generation-webui 推理模型Qwen1.5-7B-Chat相关报错问题解决
    推理代码text-generation-webui推理模型Qwen1.5-7B-Chatsysinfo nvcc--versioncuda11.8importtorch>>>print(torch.__version__)1路径错误2依赖没安装ImportError:Thismodelingfilerequiresthefollowingpackagesthatwerenotfoundinyourenvironme......