首页 > 其他分享 >向量检索服务产品规格

向量检索服务产品规格

时间:2024-09-05 14:23:20浏览次数:11  
标签:检索服务 实例 产品规格 000 试用 QPS 数据 向量


实例类型

向量检索服务DashVector当前支持四种实例(Cluster)类型,以支持不同的业务场景和需求:

  • 性能型:适用于查询QPS高、查询延迟低的场景,同时性能型也是写入效率最高的实例类型。对于高并发、大流量、低延迟场景,或对写入效率有较高的要求的场景,可选择性能型实例。
  • 存储型(推荐):存储型相对于性能型有5倍的存储容量优势,能够存储和管理更多的向量数据,适用于大规模数据量的场景。存储型实例同样也具备优秀的技术指标,可满足大部分场景需求,同时也是性价比最高的实例类型,推荐用户选择使用。
  • Serverless型:不限数据容量,基于用户数据自动扩缩,按实际请求收费,适用于低频QPS查询(QPS<2),延迟不敏感等场景。总体性能与存储型实例接近。
  • 免费试用:适用于测试、体验场景,请勿用于线上生产环境。免费试用实例有效期为1个月,到期后可再次申请试用。免费实例有部分试用限制,详情可参考约束与限制

重要

免费试用实例有效期为1个月,到期后免费试用实例将自动释放,实例中的数据将被全部删除并清空且不可恢复,为了保证实例可持续使用,请您于创建免费试用实例之后的30个自然日内将免费试用实例升级为付费实例。免费试用实例由于到期且没有升级为付费实例而导致的数据被删除的情况,阿里云将不承担相关责任。


实例规格

向量检索服务DashVector针对性能型和存储型实例提供不同档位的实例(Cluster)规格,不同规格的主要区别在于存储容量的不同。Serverless实例与已有性能型和存储型不同,无容量限制。

说明

若您有更高规格需求,或有任何反馈、期望获取更多技术支持,欢迎通过如下方式联系我们:

存储容量参考

实例类型

实例规格

Doc容量参考(基于768维FP32向量数据)

Doc容量参考(基于1536维FP32向量数据)

性能型

P.small

500,000

250,000

P.large

1,000,000

500,000

P.2xlarge

2,000,000

1,000,000

P.4xlarge

4,000,000

2,000,000

P.8xlarge

8,000,000

4,000,000

P.16xlarge

16,000,000

8,000,000

存储型

S.small

2,500,000

1,250,000

S.large

5,000,000

2,500,000

S.2xlarge

10,000,000

5,000,000

S.4xlarge

20,000,000

10,000,000

S.8xlarge

40,000,000

20,000,000

S.16xlarge

80,000,000

40,000,000

Serverless型

Serverless

不限

不限

重要

  1. 以上数据均已通过实际测试验证,但仅供参考!
  2. 上述用于容量测试的Doc中不包含任何Fields,仅包含主键和向量数据,主键为从零开始自增正整数转字符串。大部分实际生产场景中,Fields是不可或缺的,Fields数据同样会占用存储空间,从而导致实际存储的Doc数低于上述表格。

检索性能参考


实例类型


实例规格

topk=10

topk=100

topk=250

topk=1000

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

性能型

P.large(基于1百万768维FP32向量数据)

962.6

<30ms

429.7

<30ms

387.5

<45ms

134.7

<250ms

存储型

S.large(基于5百万768维FP32向量数据)

297.6

<30ms

112.5

<30ms

107.4

<50ms

37.1

<300ms

重要

  1. 以上数据为基于Cohere数据集实测结果,但由于不同数据集的数据分布对性能有影响,上述数据仅供参考。
  2. 上述用于性能测试的Doc中不包含任何Fields,仅包含主键和向量数据,主键为从零开始自增正整数转字符串。
  3. 向量检索服务DashVector会定时在后台进行向量索引优化,通常在写入完成后4小时完成,届时性能达到最优状态。
  4. 不同规格在写满数据情况下,QPS与上述表格中保持一致或更高,不因数据量的增加而下降。如,P.2xlarge规格,在写满2百万768维FP32向量数据情况下,topk=100的QPS可达到600+。

副本数

向量检索服务DashVector支持调整副本数,可选范围为1-5。副本之间数据完全相同,副本数越大,可支持的QPS越高,呈线性关系。同时副本数越大,服务可用性越高,建议对可用性有较高要求的生产环境选择>=2的副本数

说明

  • 需要注意,副本数的增加和减少不会影响存储容量,仅影响QPS和可用性。
  • Serverless实例无副本概念,由系统管理。


标签:检索服务,实例,产品规格,000,试用,QPS,数据,向量
From: https://blog.51cto.com/u_16773655/11928043

相关文章

  • 狐狸算法(FOX)优化支持向量机原理及Matlab代码
    目录0引言1数学模型2优化方式3Maltab代码3.1伪代码3.2FOX主函数代码3.3FOX-SVM4视频讲解0引言狐狸算法(Foxoptimizer,FOX)是由HardiMohammed在2023年提出群智能算法,该算法模拟了自然界中狐狸在捕猎时的觅食。FOX基于测量狐狸和猎物之间的距离来执行有效的跳......
  • 【大模型】使用 Xinference 部署本地模型,从GPU服务器到本地知识库搭建Dify【LLM大语言
    基本介绍基础信息GPU服务器获取基础安装基础信息安装显卡驱动配置显卡检查下载禁用nouveau系统自带驱动显卡驱动安装安装nvidia-docker下载配置验证Xinference部署docker部署官方文档模型下载glm-4-9b-chatEmbedding(向量)模型Rerank模型模型部署Embedding(向量)模型......
  • 矩阵乘以向量 Python代码
    回顾矩阵与向量相乘设有一个矩阵A(2行3列),设有一个列向量(3个分量)不难发现,矩阵×列向量,就是把矩阵看做是n个行向量然后与被乘的向量进行点乘,点乘得到的数量,就构成了一个新的向量上面的计算过程如下:回顾:矩阵×列向量的必要前提并不是所有矩阵都可和任意列向量相乘,......
  • 【量化交易的数学基础】文科生也能搞懂的线性代数基础:矩阵和向量的那些事儿
    今天,我们继续来聊聊听起来有点可怕的线性代数,但其实,理解它并不需要你具备什么“数学天赋”。只需要一点点好奇心和一点点耐心。坐稳了,我们要启航了!1.矩阵和向量的基本概念和运算矩阵和向量是什么鬼?想象一下,矩阵就像一个表格,横竖排列了一堆数字,比如说我们有个3x3的方阵(对......
  • 小琳AI课堂:向量数据库
    大家好,这里是小琳AI课堂!今天我们将探讨向量数据库的精彩世界。......
  • 海马算法(SHO)优化支持向量机原理及Matlab代码
    目录0引言1数学模型2优化方式3Maltab代码3.1伪代码3.2SHO主函数代码3.3SHO-SVM4视频讲解0引言海马算法(SeaHorseOptimizer,SHO)是ShijieZhao于2023年基于自然界中海马的运动、捕食和繁殖行为提出的群体智能算法。SHO算法两个阶段,SHO分别模拟了海马的不同运......
  • 非洲秃鹫算法(AVOA)优化支持向量机原理及Matlab代码
    目录0引言1 数学模型2优化方式3Matlab代码3.1伪代码3.2AVOA主函数代码3.3AVOA-SVM4视频讲解0引言非洲秃鹫算法(Africanvulturesoptimizationalgorithm,AVOA)是BenyaminAbdollahzadeh等人于2021年提出的群智能算法,该算法通过模拟非洲秃鹫典型的领导者-追随......
  • [全网独家原创]FVIM-XGBoost多输出回归 基于四向量优化算法优化XGBoost多输出回归多输
    [全网独家原创]FVIM-XGBoost多输出回归基于四向量优化算法优化XGBoost多输出回归Matlab代码(多输入多输出)每个输出都有以下线性拟合图等四张图!!!具体看图,独家图像!!!程序已经调试好,替换数据集根据输出个数修改outdim值即可运行!!!数据格式为excel!(如下)需要其他算法的都可以定制......
  • Godot向量的angle()返回值情况
    问题在Godot中需要进行一些几何运算时,常常忘记Godot里向量转成角度后用的坐标系是什么样的,角度是顺时针增大还是逆时针增大?特此记录我的测试结果,以便今后速查。代码简单打印出角度即可。顺便还能明确这些字面方向在Godot中具体是多少数值extendsNode2Dfunc_ready()......
  • 向量投影
    \(v_\parallel\)与\(n\)平行,\(v_\perp\)与\(n\)垂直,\(v\)可表示为\(v=v_\parallel+v_\perp\)由观察可得\(v_\parallel=\lVertv_\parallel\rVert\frac{n}{\lVertn\rVert}\)(1)\(\cos\......