首页 > 其他分享 >​RAG与LLM原理及实践(7)--- Chroma query应用层策略及实现原理

​RAG与LLM原理及实践(7)--- Chroma query应用层策略及实现原理

时间:2024-07-01 15:30:37浏览次数:18  
标签:RAG Similarity Chroma LLM query 原理 应用层

背景

Chroma query 底层查询的 query 思想是相同的,甚至在vector db 的世界中,都大同小异。如果你有看前面写的   RAG与LLM原理及实践(5)--- Chroma query 源码分析

应该比较清楚query的运作原理,说直白就是在memory或是disk中通过暴力查询比较与HNSW算法(NSW算法的变种,分层可导航小世界)进行分析得到。

其中向量比较的几种方式,如果你看了前面写的   RAG与LLM原理及实践(4)--- 语义相似度距离衡量的三种方式chroma示例 应该也比较清楚,就是cosine,l2,ip 几种比较方式。

这是底层运作的基本思想。但是站在应用层的角度,query可以有所不同。下面的内容聚焦在站在应用层的角度,从chroma源码进行分析,彻底理解 query 在应用层上的调用及使用场景。在开始说明具体问题之前,你需要了解在词句评估时,几个比较重要的概念。

Similarity & Redundancy

相似度 (Similarity) 与 冗余度 (Redundancy)是两个不同概念,它们用于在选择嵌入时评估嵌入与查询之间的关系以及已选集合之间的关系。

相似度 (Similarity)

标签:RAG,Similarity,Chroma,LLM,query,原理,应用层
From: https://blog.csdn.net/talentyiyy/article/details/140099911

相关文章

  • RAG与LLM原理及实践(6)--- Chroma collection及存储逻辑分析
     背景在chromavectordb的世界中,除了对query的理解,另外就是需要深入理解chroma的运行模式,chroma运行时,提供了 local模式,server-client模式,这些在应用中固然重要,但从实现原理上说,其实就是通过http服务,在固定端口如11344上请求数据。但是在这之前,需要深入了解并理解coll......
  • RAG与LLM原理及实践(4)--- 语义相似度距离衡量的三种方式chroma示例
    语义相似度的计算是一个比较复杂的过程。今天打算先比较详细的介绍下几个相似度的距离衡量算法。相似度的排名衡量,在向量数据库vectordb的query中,被大量使用。还是直接上干货,理解下背后的逻辑和概念比较重要,后面看看源码 chromavectordb是怎么处理这个过程的。1)co......
  • BeanFactoryAware原理机制
    BeanFactoryAware是Spring框架中的一个接口,它允许一个bean在其初始化时感知到其所在的BeanFactory。这通常用于在bean内部进行一些高级配置或访问Spring容器中的其他bean。简单使用当你实现BeanFactoryAware接口时,你需要实现setBeanFactory(BeanFactoryb......
  • 降维 (Dimensionality Reduction) 原理与代码实例讲解
    降维(DimensionalityReduction)原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:降维技术,数据可视化,特征选择,PCA,t-SNE,SVD,机器学习1.背景介绍1.1问题的由来在数据分析和机器学习领域,面对高维度的数据集是一个普遍且......
  • 量子机器学习原理与代码实战案例讲解
    量子机器学习原理与代码实战案例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:量子机器学习,QML,量子计算,量子算法,机器学习,Python编程,TensorFlowQuantum库1.背景介绍1.1问题的由来随着数据量的爆炸增长以及对更高效决......
  • 最大熵模型原理与代码实战案例讲解
    最大熵模型原理与代码实战案例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:最大熵模型(MaximumEntropyModel),信息理论,概率建模,NLP,机器学习1.背景介绍1.1问题的由来在自然语言处理(NaturalLanguageProcessing,NLP)以及......
  • PageRank原理与代码实例讲解
    PageRank原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:PageRank算法、搜索引擎排名、链接分析、随机游走理论、网页重要性衡量1.背景介绍1.1问题的由来在互联网的早期,搜索引擎面临了一个关键挑战:如何为用户提供相......
  • Optimization Algorithms 原理与代码实战案例讲解
    OptimizationAlgorithms原理与代码实战案例讲解1.背景介绍1.1问题的由来优化算法是计算机科学、工程和数学中的一个核心领域,主要用于寻找满足特定约束条件下的最佳解决方案。在现实世界中,无论是最小化成本、最大化收益、提高效率还是解决问题的不确定性,优化算法都能......
  • Oozie原理与代码实例讲解
    Oozie原理与代码实例讲解1.背景介绍1.1问题的由来随着大数据和云计算的快速发展,企业级应用程序需要处理的作业量激增,同时,对于作业调度、监控和故障恢复的需求也日益迫切。传统的方法往往依赖于脚本编程或者手动配置,这种方式难以适应大规模、跨平台以及高可用性的需求。......
  • 数据预处理与特征工程原理与代码实战案例讲解
    数据预处理与特征工程原理与代码实战案例讲解1.背景介绍1.1问题的由来在数据科学和机器学习领域,数据是基础,而有效的数据预处理与特征工程则是提升模型性能的关键。数据通常来源于多种渠道,包括传感器、社交媒体、在线平台等,这些数据可能包含噪声、缺失值、异常值以及不......