首页 > 数据库 >GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案

GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案

时间:2024-09-25 11:52:12浏览次数:3  
标签:南大 英特尔 数据库 性能 用户 GCVD GBASE 向量

“大模型技术的创新与应用扩展了向量数据库的应用场景,也凸显了向量数据库部署的必要性。通过携手英特尔,我们为用户提供了软硬件协同优化的向量数据库方案,能够帮助用户有效应对海量向量数据处理带来的性能压力,为大模型时代构建高性能的数据库基础设施。”

— 关连坡

南大通用GBase 8a产品经营部总经理


“向量数据库和多模态数据处理等创新技术意味着,数据库领域正在发生更多的变革,带来更高的复杂性,以及对于多元算力的苛刻要求。英特尔正在利用创新的软硬件技术组合,推进基础设施的重构及优化,以构建新一代的数据库解决方案,帮助用户充分释放硬件潜力,加速数字化、智能化转型。”

——唐炯

  英特尔(中国)软件技术合作事业部总经理


人工智能 (AI)、深度学习等技术的发展,催生了向量数据库的繁荣。通过向量数据库,用户能够像处理结构化数据一样地高效地处理海量的非结构化数据,赋能检索、推荐等应用。与此同时,向量数据库由于涉及到向量数据的索引、检索、生成,需要大量的矩阵计算,对于数据库的性能也带来考验。

在此背景下,GBASE南大通用推出了基于第五代英特尔®至强®可扩展处理器的向量数据库系统 (GBase 8a MPP Cluster,GCVD),该方案具备向量数据库的高维度支持、相似度搜索、支持多个向量字段、快速插入和更新、多模型联合分析、与大模型结合、易扩展、稳定可靠等特性,并能够利用内置的英特尔®高级矩阵扩展(英特尔® AMX)加速引擎,提升向量检索中矩阵计算的性能,实现了超过2倍的数据库整体性能提升。

向量数据库是一种专为管理向量数据而设计的数据库系统,其核心功能是理解和处理高维数据的相似性。通过向量数据库,用户能够更好地对图片、视频等非结构化数据进行分析,赋能检索、内容推荐等应用。而伴随着大模型等AI技术的崛起,企业对于向量数据库的需求显著提升,其作为典型AI系统的重要组成,得到了场景化落地。向量数据库的关键场景包括:

检索增强生成(RAG)

在向量数据库中进行相似性搜索,并获得返回的top-K个与用户问题最相似的结果。最后,合并返回结果与原始问题,以便大模型给出更准确的回答。

推荐系统

通过使用向量数据库进行向量相似性搜索,比较和计算用户向量和产品向量之间的距离,从而召回 Top-K个最相关的结果,为用户推荐匹配度更高的产品。

多模态检索

使用向量数据库可以实现多种不同模态的数据(如文本、视频、音频、图片等)进行联合相似性搜索。

此外,向量数据库的发展在推动AI等应用创新的同时,也为数据库基础设施带来了巨大挑战,这些挑战包括:

数据库性能出现瓶颈

由于向量数据规模的快速增长以及对实时性需求的日益凸显,企业对向量数据库的处理性能期望也越来越高,但其性能往往受到CPU性能、数据库架构等方面的严重制约。

数据库总体拥有成本 (TCO) 压力

为了应对日益增长的数据压力,企业往往需要在向量数据库基础设施建设、运维和实施等领域进行大量投资,带来了巨大的TCO压力。

基于第五代英特尔®至强®可扩展处理器的向量数据库GCVD

南大通用向量数据库系统GCVD在GBase 8a MPP Cluster架构基础上实现了向量数据库的功能,是继承了集群高可用、高可扩展性、高安全性以及运维管理能力的分布式向量数据库。GCVD通过存储数据向量并使用向量的相似度度量,实现高效、准确的数据搜索和分析,适用于各类 AI 驱动的应用场景,包括图片检索、视频分析、自然语言处理、推荐系统、定向广告、个性化搜索、智能客服、欺诈预防、基因检测等。


GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案_数据库

 GCVD 架构图

GCVD 采用存算分离架构,各层均可独立扩展。整个分布式集群系统能够同时支持业务智能、报表分析、决策支持等传统分析业务和图像处理、推荐系统、自然语言处理、机器学习等向量数据业务,并具备高纬度支持、相似度搜索、多向量字段支持、快速插入及更新、多模型联合分析、大模型调优、易拓展、性能稳定等特性。 


采用第五代英特尔®至强®可扩展处理器提升数据库性能

GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案_GBASE_02

 第五代英特尔®至强®可扩展处理器

为化解性能瓶颈,GCVD采用了拥有更可靠的性能、更出色的能效的第五代英特尔®至强®可扩展处理器。在实现工作负载显著每瓦性能增益的同时,提供更高的算力和更快的内存,并完全兼容上一代适配的软硬件,大幅减少测试和验证工作。

此外,GCVD充分利用处理器内置的英特尔® AMX加速器加速矩阵计算,高效地处理各类 AI任务所需的大量矩阵乘法运算,提升其在训练和推理时的工作效能。

GBASE南大通用携手英特尔发布面向大模型未来的向量数据库解决方案_GBASE_03

英特尔®AMX 架构及GCVD 优化前后的性能

GBASE南大通用与英特尔携手在三节点集群上,验证了GCVD在使用英特尔® AMX 优化前后的性能表现。测试数据显示,使用英特尔® AMX优化后,GCVD的检索性能提升高达2.44倍。

用户收益

GBASE南大通用基于第五代英特尔®至强®可扩展处理器的向量数据库GCVD能够为用户带来如下收益:

加速数据库运行,为推荐系统、大模型、多模态检索等应用赋能:有效地化解了高性能向量数据库的CPU性能瓶颈,结合软件优化措施,在性能上有优秀的表现,能够应对海量业务带来的压力。

降低 TCO,提升向量数据库系统的投资回报率:支持用户以更低的服务器规模实现目标性能,这有助于降低相应的服务器扩展、能耗、数据中心空间等成本,提升投资回报率。


未来展望

大模型等AI技术的应用将驱动着向量数据库的不断落地、壮大,也凸显了化解性能瓶颈的重要性。GBASE南大通用携手英特尔为用户提供了高性能的向量数据库方案,能够帮助用户在保护基础设施投资的同时,更好地利用向量数据库在处理高维数据方面的优势,拓展大模型等新型业务场景。面向未来,双方将进一步深化合作,探索更多软硬协同的联合解决方案,为企业用户的数字化转型提供支持。


标签:南大,英特尔,数据库,性能,用户,GCVD,GBASE,向量
From: https://blog.51cto.com/u_16565911/12108186

相关文章

  • GBASE南大通用GBase 8s数据库Pivot函数
    摘要Summary作为一款企业级的数据库产品,南大通用GBase8s数据库具备杰出的数据处理能力。日常数据处理中,无论是报表制作还是数据分析,我们经常会遇到将行数据转换为列数据的需求。Pivot函数的存在完美解决这一问题,轻松实现行数据到列数据的转换,帮助我们从不同的角度审视数据。本文将......
  • 什么情况!高通欲收购英特尔?
    KlipC报道:近日,有消息称,高通公司近日对英特尔公司发起了收购要约。交易仍远,还没有确定。据KlipC了解,这是本月第二次有消息称高通有兴趣收购英特尔。此前,有报道称,高通管理层正在考虑收购英特尔的芯片设计业务,以充实自身产品组合,同时也在考虑收购英特尔的服务器等其他业务。华尔街分......
  • 英特尔®以太网网络适配器E810-CQDA1 / E810-CQDA2 网卡 规格书 e810 网卡 规格书 Int
    英特尔®以太网800系列网络适配器英特尔®以太网网络适配器E810-CQDA1/CQDA2在10到100Gbps的以太网速度下实现高效的工作负载优化性能关键特性•单、双端口QSFP28•应用设备队列(ADQ)•PCIExpress(PCIe)4.0x16•动态设备个性化(DDP)•以太网端口配置工具(EPCT)......
  • GBase 8c 兼容模式使用说明
    为应对同构/异构数据库迁移通常面临的挑战,GBase8c从数据库自身兼容性、配套工具兼容性等多方面进行设计优化,在内核本身的适配能力和性能基础上,兼容Oracle,PostgreSQL,MySQL,Teradata等多种关系型数据库,并且提供完善的SQL支持和丰富的函数库。下面以常用关系型数据库的相关语法做简单......
  • GBase 8c NUMA绑核调优实操
    NUMA优化技术是针对数据库在NUMA架构CPU上运行时出现的资源消耗不均、并发场景下远端Node时延较高等问题进行优化的技术。GBase8c数据库通过设置执行线程与Node节点的亲和度,可以将线程绑定在指定的CPU核心运行,从而避免跨Node调度,降低远端访问时延,提升数据库对外处理性能。同时,线程......
  • 南大通用GBase 8s 集群网络交互信息概述(上)
    在当今数据驱动的商业环境中,数据库的性能和可靠性是企业成功的关键。GBase8s作为一款的国产数据库系统,其SSC集群架构通过优化网络交互,显著提升了性能和可用性。本文将分两部分聚焦于GBase8sSSC集群的网络交互信息概述和网络吞吐量计算。在GBase 8sSSC集群中,主节点向从节点只传......
  • 南大通用GBase 8s 集群网络交互信息概述(下)
    在上篇文章中,我们了解了GBase8sSSC集群的网络交互机制。本文将聚焦于网络吞吐量的计算,分析SSC集群在不同业务场景下的表现,并与HAC和RHAC集群进行对比。一、无业务场景下的网络吞吐量在无业务时,网络上只有每秒发送的心跳包和心跳包的ACK,则网络吞吐量极低,具体为(114+86)/(1024*1024......
  • GBase8c使用wal2json逻辑复制槽
    1. 参数设置要想使用wal2json逻辑复制,要设置以下参数:wal_level=logicalenable_slot_log=onwal_level设置为logical,表示WAL日志支持逻辑复制。如果需要进行备机解码,要在对应的主机上设置enable_slot_log为on。 2. 逻辑复制槽的使用2.1 创建逻辑复制槽下面来创建一个逻辑复制......
  • 南大通用GBase 8s HAC集群搭建部署指南(下)
    在上篇文章中,我们完成了GBase8sHAC集群搭建的初步配置。本文将重点介绍如何配置主节点和辅节点之间的互信关系,以及如何搭建并验证HAC集群的状态。1、配置互信互信是集群节点间通信的基础。我们可以通过配置.rhosts文件或使用REMOTE_SERVER_CFG参数两种方式来实现互信。根据企业的......
  • 基于Rose HA的GBase 8a高可用方案
    方案背景  随着计算机应用的不断深入,企业对计算机系统的依赖程度也日渐增加。在一些关键应用中,后台数据库是否可以提供及时、可靠的信息和服务是必不可少的,甚至会成为影响公司业务的关键因素。  计算机硬件与操作系统都不可避免地会发生故障,这些故障有可能给企业带来极大的......