首页 > 其他分享 >faiss用于大数据量的向量检索

faiss用于大数据量的向量检索

时间:2024-11-04 14:48:10浏览次数:3  
标签:检索 index 768 group 内存 数据量 faiss

背景:10亿(Billion级别)的数据应该是一个很大的数据了,尤其是维度在768+级别(还有1024,1536等),这个数据量我做了一个实验,shape为(1kw,768)的array(numpy)占内存为30G(float32格式),如果能降低为float16更好不过,但似乎faiss没有这种方法或者精度有所损失。

那么对于5亿级别的数据(vectors),占内存则为1500G,我相信目前似乎没有这么大的机器,我只见过500G,700G,甚至900G的机器,而且是8卡GPU的服务器才有的内存。这已经超出了一般的数据量了。

当然也可采用ES集群部署,但是感觉有点费资源。维护也是需要的,可能会宕机。

愿我们终有重逢之时,而你还记得我们曾经讨论的话题。

Q group 868373192

Q second group 277356808

下面是代码分享:

import faiss                   # make faiss available
index = faiss.IndexFlatL2(d)   # build the index, d=size of vec

标签:检索,index,768,group,内存,数据量,faiss
From: https://blog.csdn.net/SPESEG/article/details/143482959

相关文章

  • Ei数据库检索证明开具
    Pre:以EI收录的会议论文为例。1.进入Ei数据库https://www.engineeringvillage.com/home.url?redir=t点击Checkaccess进入登陆(需要学校等组织认证访问)2.输入需要开具检索的论文Title3.找到你的论文(以kaiming大神的ResNet为例)导出为PDF文件即可。参考He,Kaiming,et......
  • 达梦DM-统计用户下每个表的行数和数据量大小
    1,统计用户下每个表的行数和数据量大小–创建一张临时表,用来记录每张表的数据量情况createtabletable_count(ownervarchar(100),table_namevarchar(100),cntint);–执行存储过程统计指定模式每张表数据条数模式名改为要查询的对应的模式即可declarev_ownerVARCHAR2(100)......
  • Github上的十大RAG(信息检索增强生成)框架
    信息检索增强生成(Retrieval-AugmentedGeneration,简称RAG)是一种强大的技术,能够显著提升大型语言模型的性能。RAG框架巧妙地结合了基于检索的系统和生成模型的优势,可以生成更加准确、符合上下文、实时更新的响应。随着对先进人工智能解决方案需求的不断增长,GitHub上涌现出众......
  • 基于模型内部的检索增强型生成答案归属方法:MIRAGE
    人工智能咨询培训老师叶梓转载标明出处在自然语言处理(NLP)中,确保模型生成答案的可验证性是一个重要挑战。特别是在检索增强型生成(RAG)用于问答(QA)领域时,如何验证模型答案是否忠实于检索到的来源是一个关键问题。近期一种名为自引用提示的方法被提出,以使大型语言模型(LLMs)在生成答......
  • 基于node.js+vue基于Android的罗宾逊R22零部件图纸检索系统(开题+程序+论文)计算机毕业
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容选题背景在航空领域,罗宾逊R22直升机是一款广泛应用的机型。关于飞机零部件图纸的管理与检索方面,现有研究多集中于大型客机或通用飞机整体的文档管理系统,专门针对罗宾......
  • 2025秋招LLM大模型多模态面试题(十三)- rag(检索增强生成)技术
    1.基本概念检索增强LLM(RetrievalAugmentedLLM),简单来说,就是给LLM提供外部数据库,对于用户问题(Query),通过一些信息检索(InformationRetrieval,IR)的技术,先从外部数据库中检索出和用户问题相关的信息,然后让LLM结合这些相关信息来生成结果。下图是一个检......
  • 法律智能助手:思通数科开源NLP系统助力文档分类与检索加速
    一、系统概述思通数科AI平台是一款融合了自然语言处理和多标签分类技术的开源智能文档分类工具,特别适用于法律行业。平台采用深度学习的BERT模型来进行特征提取与关系抽取,实现了精准的文档分类和检索。用户可以在线训练和标注数据,使系统持续学习,准确率、召回率等指标随着使用而......
  • SqlSugar 达梦数据库大数据量,长字符串添加,数据库为空
    SqlSugar实体添加数据时,发现字符串超过某个长度,在数据库中就空白,插入失败,原因如下:达梦Clob、Text类型用法版本需升级到5.1.4.92及以上版本//需在长字符串的属性中加入以下[SugarColumn(SqlParameterDbType=typeof(NClobPropertyConvert))]publicstringName{get;......
  • Milvus 与 Faiss:选择合适的向量数据库
    向量数据库Milvus和Faiss都是处理大规模向量数据的工具,尤其适用于需要相似性搜索的场景,比如推荐系统、图像检索和自然语言处理等。但它们各自的设计初衷和功能有所不同,适用于不同的使用场景。下面,我们从性能、功能特性、部署和使用难度、适用场景等方面对它们进行对比。......