首页 > 其他分享 >向量检索服务产品规格

向量检索服务产品规格

时间:2024-11-25 14:10:55浏览次数:4  
标签:副本 检索服务 产品规格 实例 试用 QPS 向量

本文介绍向量检索服务DashVector的产品规格,以帮助用户选择贴合自身业务场景的实例规格。

实例类型

向量检索服务DashVector当前支持三种四种实例(Cluster)类型,以支持不同的业务场景和需求:

  • 性能型 :适用于查询QPS高、查询延迟低的场景,同时性能型也是写入效率最高的实例类型。对于高并发、大流量、低延迟场景,或对写入效率有较高的要求的场景,可选择性能型实例。

  • 存储型(推荐) :存储型相对于性能型有5倍的存储容量优势,能够存储和管理更多的向量数据,适用于大规模数据量的场景。存储型实例同样也具备优秀的技术指标, 可满足大部分场景需求 ,同时也是 性价比最高 的实例类型,推荐用户选择使用。

  • Serverless型: 不限数据容量,基于用户数据自动扩缩,按实际请求收费,适用于低频QPS查询(QPS<2),延迟不敏感等场景。总体性能与存储型实例接近。

  • 免费试用 :适用于测试、体验场景, 请勿用于线上生产环境 。免费试用实例有效期为1个月,到期后可再次申请试用。免费实例有部分试用限制,详情可参考约束与限制。

重要

免费试用实例有效期为1个月,到期后免费试用实例将自动释放,实例中的数据将被全部删除并清空且不可恢复,为了保证实例可持续使用,请您于创建免费试用实例之后的30个自然日内将免费试用实例升级为付费实例。免费试用实例由于到期且没有升级为付费实例而导致的数据被删除的情况,阿里云将不承担相关责任。

实例规格

向量检索服务DashVector针对性能型和存储型实例提供不同档位的实例(Cluster)规格,不同规格的主要区别在于存储容量的不同。Serverless实例与已有性能型和存储型不同,无容量限制。

说明

若您有更高规格需求,或有任何反馈、期望获取更多技术支持,欢迎通过如下方式联系我们:

  • 官方钉钉群:25130022704

  • 技术支持邮箱:dashvector@service.aliyun.com

存储容量参考

重要

  1. 以上数据均已通过实际测试验证,但仅供参考!

  2. 上述用于容量测试的 Doc中不包含任何Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。大部分实际生产场景中,Fields是不可或缺的,Fields数据同样会占用存储空间,从而导致实际存储的Doc数低于上述表格。

检索性能参考

重要

  1. 以上数据为基于Cohere数据集实测结果,但由于不同数据集的数据分布对性能有影响,上述数据仅供参考。

  2. 上述用于性能测试的 Doc中不包含任何Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。

  3. 向量检索服务DashVector会定时在后台进行向量索引优化,通常在写入完成后4小时完成,届时性能达到最优状态。

  4. 不同规格在写满数据情况下,QPS与上述表格中保持一致或更高,不因数据量的增加而下降。如,P.2xlarge规格,在写满2百万768维FP32向量数据情况下,topk=100的QPS可达到600+。

副本数

向量检索服务DashVector支持调整副本数,可选范围为1-5。副本之间数据完全相同,副本数越大,可支持的QPS越高,呈线性关系。同时副本数越大,服务可用性越高, 建议对可用性有较高要求的生产环境选择>=2的副本数 。{#4d1b3cb1c1c9m}
说明

  • 需要注意,副本数的增加和减少不会影响存储容量,仅影响QPS和可用性。

  • Serverless实例无副本概念,由系统管理。

标签:副本,检索服务,产品规格,实例,试用,QPS,向量
From: https://www.cnblogs.com/DashVector/p/18567426

相关文章

  • 分组向量检索
    本文介绍如何在向量检索时将结果按照字段值进行分组返回。背景介绍在向量检索的实际应用中,有些场景需要将向量检索的结果分组返回。例如:在RAG中,一篇文档往往需要拆分为多个段落,每个段落生成一个向量存入DashVector。在向量检索时,为了结果的多样性,不希望所有结果都来自同一篇......
  • 线性分类器全解析:Logistic 回归、Softmax 回归、感知器和支持向量机
    引言在机器学习中,线性分类器是一种经典而高效的分类方法,能够在特征空间中寻找一条(或一个超平面)来区分不同类别的数据点。它是现代机器学习模型的基石,同时为许多复杂模型(如神经网络)奠定了理论基础。本文将详细解析四种常见的线性分类器——Logistic回归、Softmax回归、感知......
  • 全新向量数据库SQL Server 2025:带你迈入AI驱动的数据未来
    全新向量数据库SQLServer2025:带你迈入AI驱动的数据未来 全新向量数据库SQLServer2025:带你迈入AI驱动的数据未来  上次大家下单的《微软憋大招:SQLServer+Copilot=地表最强AI数据库!》抱怨迟迟没有发货,这次微软没有食言,终于发货!前言随着人工智能技术的普及,客户......
  • PostgreSQL 数据库向量化的核心:pgvector
    pgvector介绍pgvector是一款开源的向量搜索引擎,除了具备所有Postgres数据库的特性外,最主要的特点是能在Postgres数据库存储和检索向量数据,支持向量的精确检索和模糊检索。向量格式除了传统embedding模型的单精度浮点数外,还支持半精度浮点数,二元向量或者稀疏向量。安装Dockerdo......
  • 「深度解析」向量召回和字面召回用法和组合
        上面图中的5个问题,是每个使用大模型进行知识库搭建的时候都要遇到问题,这些问题基本上就决定了问答答案的准确性,本篇文章我们先不讨论上面五个问题的解决方案,我们今天重点讨论两种召回方式:字面召回和向量召回, 字面和向量召回都是搜索召回中的重要方法,如何更好地权......
  • 机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)
    机器学习面试笔试知识点-线性回归、逻辑回归LogisticsRegression和支持向量机SVM一、线性回归1.线性回归的假设函数2.线性回归的损失函数(LossFunction)两者区别3.简述岭回归与Lasso回归以及使用场景4.什么场景下用L1、L2正则化5.什么是ElasticNet回归6.ElasticNet回归......
  • [如何实现多向量索引策略提升检索精度:从理论到实战]
    如何实现多向量索引策略提升检索精度:从理论到实战引言在信息检索领域,检索精度往往是衡量系统性能的重要指标之一。多向量索引策略(Multi-VectorIndexingStrategy)是提高检索精度的有效方法之一。本文将详细介绍这种策略的实现方法,并通过具体的代码示例帮助读者在实际项目......
  • 更强的RAG:向量数据库和知识图谱的结合
    传统RAG的局限性经典的RAG架构以向量数据库(VectorDB)为核心来检索语义相似性上下文,让大语言模型(LLM)不需要重新训练就能够获取最新的知识,其工作流如下图所示:这一架构目前广泛应用于各类AI业务场景中,例如问答机器人、智能客服、私域知识库检索等等。虽然RAG通过知识增强一......
  • 《向量数据库指南》——向量数据库新纪元:跨越供应商锁定的
    在深入探讨供应商锁定对向量数据库领域非结构化数据迁移的影响时,我们不得不首先认识到,随着大数据和人工智能技术的飞速发展,向量数据库作为处理复杂、高维数据的有效工具,正逐渐成为企业数据架构中的关键组成部分。然而,这一领域的特殊性——尤其是向量数据的非结构化本质及其处理......
  • GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案
    “大模型技术的创新与应用扩展了向量数据库的应用场景,也凸显了向量数据库部署的必要性。通过携手英特尔,我们为用户提供了软硬件协同优化的向量数据库方案,能够帮助用户有效应对海量向量数据处理带来的性能压力,为大模型时代构建高性能的数据库基础设施。”—关连坡南大通用GBase8a......