首页 > 其他分享 >论文阅读:UniMS-RAG: Unified Multi-Source RAG for Personalised Dialogue

论文阅读:UniMS-RAG: Unified Multi-Source RAG for Personalised Dialogue

时间:2024-06-18 19:42:50浏览次数:20  
标签:检索 RAG Multi Unified 知识 生成 个性化 UniMS

UniMS-RAG: Unified Multi-Source RAG for Personalised Dialogue(https://arxiv.org/abs/2401.13256)

https://github.com/jiangnanboy/paper_read_note

一.概述

本研究探讨如何分解RAG过程,加入多文件检索、记忆和个人信息等元素。大型语言模型(llm)在自然语言任务中表现出色,但在对话系统中的个性化和上下文方面面临挑战。该研究提出了一个统一的多源检索-增强生成系统(UniMS-RAG),通过将任务分解为知识来源选择、知识检索和响应生成来解决个性化问题,如下图。

该系统包括一个自改进机制,该机制基于响应和检索证据之间的一致性分数迭代地改进生成的响应。实验结果表明,UniMS-RAG在知识来源选择和响应生成任务方面具有先进的性能。

上图显示了两个场景,其中用户和机器人角色是独立的,而(在第二个示例中)是相互依赖的。对于相互依赖的方法,需要有评估令牌(evaluation tokens)和代理令牌(acting tokens)。

知识源选择:智能和准确的知识来源选择,以及将多个信息来源综合成一个连贯而简洁的答案将变得至关重要。

复杂性:使用RAG的一个诱人之处在于其实现的简单性。然而,在agenic RAG、多文档搜索和添加会话历史等元素方面,需要进行大量工作。代理RAG是将代理层次结构与RAG实现相结合的地方。复杂性的引入和智能的增强是不可避免的。

个性化和上下文:个性化和通过会话历史维护上下文都是优秀用户体验的重要元素。UniMS-RAG根据其建议的RAG结构对这些元素进行优先排序。

持续改进:该研究包括一种自我细化推理算法,并结合RAG通常提供很大程度的可检查性和可观察性的事实。

二.UniMS-RAG框架

UniMS-RAG统一了计划、检索和阅读任务的训练过程,并将它们集成到一个综合框架中。利用大型语言模型(llm)的力量来处理外部知识来源,UniMS-RAG增强了llm在个性化知识基础对话中无缝连接各种资源的能力。这种集成简化了传统上分离的检索器和阅读训练任务,允许以统一的方式进行自适应证据检索和相关性评分评估。下图是所提出的称为UniMS-RAG的方法的说明。精心设计了三个优化任务(知识来源选择,相关性评分预测 ,回答生成。)。

计划:这是在给定不同来源之间的关系的情况下,创建一系列应该使用哪些特定知识来源的决策的过程。

检索:根据决策从外部数据库检索前n个结果。

生成:将所有检索到的知识合并到最终的响应生成中。

三.总结

该方法寻求在多源环境中解决个性化的基于知识的对话任务,将问题分解为三个子任务:知识库选择、知识检索和响应生成。

提出的统一多源检索-增强对话系统(UniMS-RAG)使用大型语言模型(llm)同时作为计划、检索和阅读。

该框架在推理过程中引入了自我改进,使用一致性和相似性分数来改进响应。

在两个数据集上的实验结果表明,UniMS-RAG产生了更加个性化和真实的反应,优于基线模型。

标签:检索,RAG,Multi,Unified,知识,生成,个性化,UniMS
From: https://www.cnblogs.com/little-horse/p/18255002

相关文章

  • python系列&AI系列:cannot import name ‘ForkProcess‘ from ‘multiprocessing.conte
    cannotimportname‘ForkProcess‘from‘multiprocessing.context‘问题解决cannotimportname‘ForkProcess‘from‘multiprocessing.context‘问题解决问题描述问题原因解决方案cannotimportname‘ForkProcess‘from‘multiprocessing.context‘问......
  • Activity和fragment是如何交互的
    Fragment是Android中历史十分悠久的一个组件,在Android3.0(API级别11)的时候推出,时至今日已成为Android开发中最常用的组件之一在一开始的时候,引入Fragment的目的是为了在大屏幕(如平板电脑)上能够更加动态和灵活地设计界面,被定义为一个**轻量级Activity**而进行设计......
  • MultiPoint.dll文件丢失导致程序无法运行问题
    其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题,如果是新手第一时间会认为是软件或游戏出错了,其实并不是这样,其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库,这时你可以下载这个MultiPoint.dll文件(挑选合适的版本文件)把......
  • Ragas实践问题记录1 ValueError: Directory ./arxiv-papers/ does not exist.
    纯小白,记录一下在尝试ragas时遇到的一些问题。尝试官方文档“CompareLLMsusingRagasEvaluations”时,在Createsynthetictestdata步骤复制github中的代码时,遇到了以下问题:ragas官方文档查看请点此解决方法是前往openxlab下载数据集,再使用本地的路径替换掉报错的地方......
  • Ragas实践问题记录2 AttributeError: ‘TestsetGenerator‘ object has no attribute
    报错问题依然是在尝试官方文档“CompareLLMsusingRagasEvaluations”的“Createsynthetictestdata”步骤发生报错。官方文档以及文档中代码如下:Ragas:CompareLLMsusingRagasEvaluations官方文档中的代码:importosfromllama_indeximportdownload_loader,Simp......
  • 【AI开发】RAG基础
    RAG的基本流程:用一个loader把knowledgebase里的知识做成一个个的document,然后把document切分成snippets,把snippets通过embedding(比如openai的embedding模型或者huggingface的)向量化,存储到vectordb向量数据库,以供后续相关性检索。至此便完成了私域数据集的索引indexing。......
  • Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
    检索增强生成(RAG:RetrievalAugmentedGeneration)技术旨在把信息检索与大模型结合,以缓解大模型推理“幻觉”的问题。近来关于RAG的研究如火如荼,支持RAG的开源框架也层出不穷,并孕育了大量专业领域的AI工程应用。我们设计了一个通用的开源RAG框架,以兼容未来多样化的基础研究建设和工......
  • 如何手撸一个自有知识库的RAG系统
    RAG通常指的是"Retrieval-AugmentedGeneration",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统数据收集建立知识库向......
  • 论文阅读:《Chinese Relation Extraction with Multi-Grained Information and Externa
    LiZ,DingN,LiuZ,etal.Chineserelationextractionwithmulti-grainedinformationandexternallinguisticknowledge[C]//Proceedingsofthe57thAnnualMeetingoftheAssociationforComputationalLinguistics.2019:4377-4386.该方法的github实现引言针......
  • 鸿蒙——数据持久化存储(AppStorage、PersitentStoreage、数据库、首选项)
    Localstorage-内存化存储-局部可用AppStorage-内存化存储-全局可用PersitentStoreage-写入磁盘(沙箱)全局可用首选项-写入磁盘-全局可用关系型数据库-写入磁盘1.用户首选项:获取Preferences实例、保存/更新数据、获取数据用户首选项为应用提供Key-Value键值型的数据处......