首页 > 其他分享 >使用UMAP降维可视化RAG嵌入

使用UMAP降维可视化RAG嵌入

时间:2024-02-11 10:33:22浏览次数:28  
标签:RAG 片段 嵌入 降维 查询 UMAP 可视化 文档

大型语言模型(LLMs)如 GPT-4 已经展示了出色的文本理解和生成能力。但它们在处理领域特定信息方面面临挑战,比如当查询超出训练数据范围时,它们会产生错误的答案。LLMs 的推理过程也缺乏透明度,使用户难以理解达成结论的方式。

检索增强生成(RAG)在 LLMS 的工作流程中添加了一个检索步骤,使其能够在响应查询时从其他来源(如私人文本文档)中查询相关数据。这些文档事先分成小段,然后使用embedding的 ML 模型生成嵌入。具有相似内容的段将具有相似的嵌入。当 RAG 应用程序收到一个问题时,它使用查询检索相关文档片段。然后 LLMS 使用这些文档片段作为上下文来回答问题。这种方法可以提供回答查询所需的信息,并通过展示使用的片段来增加回答的透明度。

对于RAG来说,可视化嵌入空间是一个非常重要的方法,因为RAG应用程序使用该空间来查找相关信息。查询的结果与文档片空间息息相关,所以可以使用像UMAP这样的可视化方法,将高维嵌入减少到更易于展示的2D进行可视化。虽然高维嵌入被简化为两个分量,但问题及其相关文档片段在嵌入空间中形成簇,仍然是可以被识别出来,尤其是这时肉眼可见的,所以这有助于深入了解数据的本质。

 

在本文中,我们将使用HTML格式的Wikipedia中的f1数据集,使用嵌入模型将它们转换为紧凑的矢量表示,并存储到ChromaDB中。使用LangChain构建RAG应用,并在2D中可视化嵌入,分析查询和文档片段之间的关系和接近度。

https://avoid.overfit.cn/post/31e45d66ef1547e397bbbef2ebcf38c8

标签:RAG,片段,嵌入,降维,查询,UMAP,可视化,文档
From: https://www.cnblogs.com/deephub/p/18013205

相关文章

  • RAPTOR:递归摘要与树形检索的结合,提升RAG检索性能
    RAPTOR:递归摘要与树形检索的结合,提升RAG检索性能来源:ICLR'24https://arxiv.org/pdf/2401.18059.pdf随着LLM技术的发展,RAG的价值也来越明显,可以视作LLM应用、落地的一个主要方向。RAG通过结合检索系统和生成模型,在生成回答时先从外部知识库种检索相关信息,辅助LLM进行更......
  • ESXi升级RAID驱动和安装CIM Provider和MegaRAID Storage Management
    一:首先ESXi中要装磁盘阵列卡的专用驱动Provider,比如戴尔的驱动Provider可以在http://www.piis.cn/news/new935.asp下载,安装方法也可以借鉴它,这里就不详细说安装方法了二:ESXI中要设置按F2后输入root和密码到配置界面--选择"ConfigureManagementNetwork"·中的1、“DNSConf......
  • 解决terraform部署storage account management policy问题
    承接上文TerraformAzurediagnosticsetting升级,之前说到azurerm_monitor_diagnostic_setting里的retentionpolicy已经deprecated了,需要用azurerm_storage_management_policy替换以recoveryservicevault的诊断设置为例,对应的azurerm_storage_management_policy可以参考下边的代......
  • Amazon Bedrock 知识库现可提供完全托管的 RAG 体验
    AmazonBedrock知识库预览版已于9月问世。从今天开始,AmazonBedrock知识库正式全面发布。正式推出。借助知识库,可安全地将 AmazonBedrock 中的基础模型(FM)连接到贵公司的数据,供检索增强生成(RAG)使用。模型生成的响应更具相关性、更加特定于上下文以及更准确;访问其他数......
  • 12个RAG常见痛点及解决方案
    Barnett等人的论文《SevenFailurePointsWhenEngineeringaRetrievalAugmentedGenerationSystem》介绍了RAG的七个痛点,我们将其延申扩展再补充开发RAG流程中常遇到的另外五个常见问题。并且将深入研究这些RAG痛点的解决方案,这样我们能够更好地在日常的RAG开发中避免和解决......
  • 检索增强生成RAG
    什么是RAG检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在LLM本就强大的功能基础上,RAG将其扩展为能访问特定......
  • vue3+elementplus+vuedraggable插件,实现左右拖拽移入,和上下拖拽排序
    先看目标效果(gif由迅捷gif工具制作,使用vscode可以打开gif,进行预览)效果分析1.左右区域,支持拖拽。左侧选项,拖入右边。可以新建大模块,也可以给模块新增一项。2.模块内部,支持拖拽排序,并按照排序,生成一个简单的层级。3.模块名字支持编辑。同时增加表单校验,名字不存在,则无法保存。......
  • UniMS-RAG:用于个性化对话的统一多源RAG框架
    RAG领域已经取得了相当大的发展,这篇论文的是如何分解RAG过程,加入多文件检索、记忆和个人信息等定制化的元素。大型语言模型(llm)在自然语言任务中表现出色,但在对话系统中的个性化和上下文方面面临挑战。这个研究提出了一个统一的多源检索-增强生成系统(UniMS-RAG),通过将任务分解......
  • 【每周一读】Optimize your RAG pt.1 - Data ingestion
    今天与其说是阅读笔记更像是摘录与翻译...本来都用了引用块,但格式不太好看就还是改成正文了。以下英文部分全是原文引用。原文......
  • Js存储数据到LocalStorage并设置过期时间
    setLocal=function(key,val){varprefix="project_list_";key=prefix+key;varexpires=600;val=JSON.stringify({'val':val,'expires':newDate().getTime()+expires*1000});......