首页 > 其他分享 >Databend 的算力可扩展性

Databend 的算力可扩展性

时间:2024-01-04 18:03:03浏览次数:37  
标签:591.6 可扩展性 million Databend GiB 45.18 算力

作者:尚卓燃(PsiACE)

澳门科技大学在读硕士,Databend 研发工程师实习生

Apache OpenDAL(Incubating) Committer

https://github.com/PsiACE

对于大规模分布式数据处理系统,为了更好应对数据、流量、和复杂性的增长,需要对系统的可扩展性加以重视。可拓展性代表一种预期,即在现有软件和硬件水平无法满足工作负载的时候,通过扩展系统可以进一步满足工作负载的需要。

Databend 是一款现代化的云原生数据仓库,旨在通过弹性和可扩展的架构提供高效的数据分析能力。Databend 具有高效的资源利用能力和分布式扩展能力,可以解决传统数据仓库在处理大数据集时遇到的性能和可扩展性问题。

Databend Cloud 基于开源的 Databend 发展而来,能够帮助您托管 Databend 实例,并提供 Serverless 的部署模式,不仅可以降低成本,还可以提高系统的弹性和可靠性。Databend Cloud 将廉价的云存储作为主要存储,并提供快捷高效的分析性能,已帮助很多客户实现了数仓、行为日志等场景的降本增效,并广受好评。通过使用 Databend Cloud,用户可以轻松构建低成本、高性能的数据仓库,并专注于分析而非基础架构的维护。

可扩展性概念与因素

系统的可扩展性涉及到多个维度,除了系统本身的管理的资源、软件设计的优化和数据与计算的有效管理之外,还包括系统需要处理的数据量、用户数量、查询复杂性等。

可扩展性与系统性能

线性可扩展性意味着资源的增加能够直接转化为系统性能的提升。线性可扩展性隐含的保证是当工作负载扩大一倍时,系统的计算资源(如CPU、内存、存储等)也扩大一倍,算力变为原来的两倍,从而获得与之前相当的处理速度。

可扩展性背后的数学

但是,除非系统完全无状态,否则只能将其扩展到通用可扩展性定律(Universal Scalibility Law,红色线条)所描述的程度,之后即便添加更多资源,最终也只会因为并发、争用和相关性延迟导致系统整体性能降低。

即使在几乎不存在相关性延迟并且充分并行化的最佳情况下,最终也会受到阿姆达尔定律(Amdahl’ Law,绿色线条)的限制,这仍然无法达到线性可扩展性。

毫无疑问线性可扩展性(蓝色线条)只是理想情况下的表述。 在 Contention, Coherency, and Math Behind Software (上面图片的出处)一文中介绍了可扩展性背后的一些数学,也推荐大家阅读。

水平扩展和垂直扩展

两种常见的扩展方式是垂直扩展和水平扩展:

  • 垂直扩展(纵向扩展)则是提高单个节点的能力,如升级硬件或改善系统架构。
  • 水平扩展(横向扩展)指的是增加更多节点到现有的系统集群中,例如添加更多的服务器。

垂直扩展是改善系统性能的一个有效方式,但是垂直扩展面临着一个致命不足:单机性能总是有极限的。由于单机往往不能胜任大数据分析的需要,所以相关系统通常会强调架构各层的水平可扩展性以及水平扩展带来的性能增长。

Databend 的架构可扩展性

Databend 的架构设计考虑了可扩展性的多个方面,使其在云环境中能够灵活地扩展资源和处理能力。

Share-Nothing V.S. Share-Storage

传统数仓往往采用 Share-Nothing 架构,存储、计算一体化设计,弹性相对较弱。而且由于调度上采用资源固定(Fixed-Set)式调度策略,资源控制粒度粗,也会带来更多的成本消耗。Databend 使用共享存储架构(Share-Storage),底层可以使用对象存储,真正做到存储、计算分离,资源控制粒度更细。计算节点可以根据需求弹性扩展,而不受存储容量的限制。

Databend 架构全景图

得益于列式存储模型和向量化计算,Databend 可以充分利用现代硬件系统的潜力;此外,Databend 还对数据存储格式、数据缓存、和系统吞吐量进行了充分优化,以达到性能的最佳释放。

由于采用共享存储的架构,并且 Query 节点采用无状态设计,只在 Meta 节点保留必要的状态信息,使得 Query 节点能够轻松支持实时弹性扩容和缩容以及资源按需(Workload-Based)式调度。计算资源可以根据实际的工作负载自动扩展,提供按需计算能力,这进一步提高了系统的可扩展性和资源的使用效率。

### 性能评估:Databend Cloud 的算力可扩展性​

为了评估 Databend 的性能和可扩展性,可以运行 TPC-H 基准测试。TPC-H是一套针对数据库决策支持能力的测试基准,通过模拟数据库中与业务相关的复杂查询和并行的数据修改操作考察数据库的综合处理能力。

通过在 Databend Cloud上针对不同计算集群规模进行 TPC-H 查询的性能测试,我们可以观察到系统扩展资源时的性能变化。这些结果可以帮助我们了解在增加计算节点(水平扩展)和/或升级现有节点(垂直扩展)时,Databend 的查询处理能力如何改变。

使用 BendSQL 执行 TPC-H Q1

下面的数据展现了 Databend Cloud 上不同规模实例在执行 TPC-H 测试 Q1 时的性能变化。其中 XSmall 和 Small 都是单计算实例,对应垂直扩展模型;而从 Small 到 Large 的计算实例数量不断增长,对应水平扩展模型。

Instance Type vCPUs Compute Instances Rows Read (Avg) Time (Avg) Rows Processed Data Processed Rows/s (Avg) Data/s (Avg)
XSmall 8 1 4 14.109 sec 591.6 million 45.18 GiB 41.93 million 3.20 GiB
XSmall 8 1 4 13.676 sec 591.6 million 45.18 GiB 43.26 million 3.30 GiB
XSmall 8 1 4 13.799 sec 591.6 million 45.18 GiB 42.87 million 3.27 GiB
Small 16 1 4 13.241 sec 591.6 million 45.18 GiB 44.68 million 3.41 GiB
Small 16 1 4 11.571 sec 591.6 million 45.18 GiB 51.13 million 3.90 GiB
Small 16 1 4 11.734 sec 591.6 million 45.18 GiB 50.42 million 3.85 GiB
Medium 32 2 4 9.392 sec 591.6 million 45.18 GiB 62.99 million 4.81 GiB
Medium 32 2 4 8.279 sec 591.6 million 45.18 GiB 71.46 million 5.46 GiB
Medium 32 2 4 8.341 sec 591.6 million 45.18 GiB 70.93 million 5.42 GiB
Large 64 4 4 8.536 sec 591.6 million 45.18 GiB 69.31 million 5.29 GiB
Large 64 4 4 7.096 sec 591.6 million 45.18 GiB 83.37 million 6.37 GiB
Large 64 4 4 7.841 sec 591.6 million 45.18 GiB 75.45 million 5.76 GiB
XLarge 128 8 4 7.123 sec 591.6 million 45.18 GiB 83.05 million 6.34 GiB
XLarge 128 8 4 5.753 sec 591.6 million 45.18 GiB 102.83 million 7.85 GiB
XLarge 128 8 4 5.767 sec 591.6 million 45.18 GiB 102.59 million 7.83 GiB

可以看到,随着系统规模的扩大,查询响应时间缩短,而处理吞吐量也随之增加。这些测试结果直观展示了不同规模的 Databend Cloud 在同一工作负载下的处理能力变化。

Databend 的设计哲学、架构以及 Databend Cloud 的性能表现,体现了其作为一款现代大规模分布式数据处理系统的算力可扩展性。

除了私有化部署 Databend 和使用 Databend Cloud 之外,我们也提供混合云支持。可以帮助用户实现适应规模和成本的算力最大化调度,为未来数据处理需求的多样性和不断增长的挑战提供最佳应对方案。

标签:591.6,可扩展性,million,Databend,GiB,45.18,算力
From: https://blog.51cto.com/u_15491149/9103218

相关文章

  • 思腾23大事记 | AI+算力,引领AIGC元宇宙奇点变革
    ......
  • 浪潮信息首提“高质量算力” ! 从五大特征来定义
    12月26日,由清华大学全球产业研究院主办的“算力高质量发展与应用高端论坛”在京举办。工业和信息化部原副部长、中国数字经济百人会专家委员会主任杨学山,清华大学全球产业研究院副院长李东红,中国信通院产业与规划研究所副总工程师王青,浪潮元脑首席技术官张东及众多行业CIO等算力产......
  • Databend 部署与运维概要:本地部署 Meta 服务并利用 Kubernetes 管理 Query 服务
    本指南旨在介绍如何部署和运维Databend,并且采用结合本地部署Meta服务和使用K8s管理Query服务的形式,以平衡元数据管理持久化和计算资源弹性调度的需求。由于Databend的部署逻辑在单机模式和集群模式下的一致性,部署模式可以从单机轻松拓展到多节点集群,所以本指南中只基于......
  • 科技云报道:至简至强,新一代服务器的算力美学
    在这个时代,数据和计算的边界正在迅速扩张。随着云计算、物联网和人工智能的日益成熟,对算力的需求已经突破了传统的限制,进入了一个全新的阶段。在这个阶段,不仅是算力的量级发生了变化,其性质和应用也在经历着根本性的转变。这也对算力背后的服务器提出了更高的要求。在这其中,能够有效......
  • 浪潮信息G7服务器打造高效智慧算力,全新支持第五代英特尔®至强®可扩展处理器
    近日,浪潮信息多款G7服务器创新升级,全面支持英特尔最新发布的第五代至强®可扩展处理器并完成适配,通过系统架构、硬件、固件和散热等方面的创新设计,以及AI加速功能引入,G7服务器的通用计算性能提升23%,在客户工作负载中每瓦特性能提升超36%,尤其是在AI推理场景下性能提升高达 42%,实现......
  • 算力强劲!中兴通讯R5300 G5服务器开箱!
    2023年,以ChatGPT、文心一言为代表的AIGC大模型全面崛起,成为整个社会热议的话题。这些大模型,上知天文,下知地理,既能写文章,又能编代码,甚至还能吟诗作对,彻底颠覆了人们的认知。AIGC的崛起,说白了,是人类算力技术发展到一定阶段的产物。我们经过数十年的努力,拥有了性能强劲的芯片,建设了大......
  • 加速计算,为何会成为 AI 时代的计算力“新宠” 审核中
    随着科技的发展,处理大量数据和进行复杂计算的需求越来越高,人工智能、大数据和物联网等领域更是如此,传统的计算方式已经无法满足这些需求。因此,加速计算作为一种现代计算方式,成了必要的手段。加速计算具有前所未有的处理能力,在云基础设施中发挥着核心作用,因为它有助于更高效、更有......
  • Databend 开源社区上榜 2023 年度 OSCHINA 优秀开源技术团队
    2023年12月8日,OSCHINA对其平台上众多认证的官方技术团队和开源社区进行了全面评估,并颁发了“2023年度优秀开源技术团队”奖项,以表彰各团队在推动中国开源生态系统发展方面所展现的创新能力和显著贡献。在这一评选中,Databend开源社区有幸获得了2023年度优秀开源技术团......
  • 极智一周 | AI 算力国产化、通义开源、Gemini、鸿蒙、蔚来 And so on
    欢迎关注我的公众号[极智视界],获取我的更多技术分享大家好,我是极智视界,带来本周的[极智一周],关键词:AI算力国产化、通义开源、Gemini、鸿蒙、蔚来Andsoon。极智视界本周热点文章回顾,(1)AI算力国产化系列本周续写解读国产AI算力系列,输出六章。璧仞芯片禁令焦点,摩尔线程显卡......
  • 中电金信:金融电子化 | 打磨算力基础设施,赋能金融业数字化转型
    10月8日,工信部、人民银行等六部门联合印发《算力基础设施高质量发展行动计划》(以下简称《行动计划》),在行业和产业界吸引了信息产业和相关应用行业的广泛关注。作为引领我国算力基础设施建设的重要指南,《行动计划》为我国信息产业带来哪些深远影响?对金融业算力基础设施建设会带来......