首页 > 其他分享 >聚焦数仓极致降本,火山引擎ByteHouse升级解决方案

聚焦数仓极致降本,火山引擎ByteHouse升级解决方案

时间:2024-10-30 10:33:05浏览次数:7  
标签:数仓 存储 架构 查询 抖音 极致 ByteHouse 成本

随着数据量的爆炸性增长,现代企业在数据存储、处理与分析上面临巨大挑战。作为面向实时数据处理的工具,OLAP(联机分析处理)系统能帮助企业充分挖掘数据价值、辅助决策。然而,OLAP在追求高效数据分析的同时,往往难以平衡成本与效率矛盾。   快节奏的商业环境要求OLAP系统在保证数据准确性的前提下,尽可能缩短数据处理和分析的时间。但高效的数据处理往往伴随着更复杂的系统架构和更高的资源消耗,企业需要投入高昂的计算资源、服务器、存储资源等硬件成本以及大量算法优化、运维、迁移等软性成本。   在近期线上直播中,火山引擎ByteHouse则从“降本增效”角度出发,总结了自身服务抖音集团内部以及金融、游戏等外部行业经验,为企业实现效率、成本双赢提供全新解决方案。     据火山引擎ByteHouse资深产品经理介绍:“ ByteHouse已在抖音集团内部经过多年打磨,在企业降本增效大背景下,我们也通过架构、技术、生态、一体化能力升级,将一系列能力对外输出,为企业带去‘四大红利’,期望在保障查询性能基础上,尽可能降低资源成本。”   首先,“架构红利”,这也是ByteHouse极致降本的重要基石。作为一款聚焦于大规模数据分析设计的云原生数据仓库,ByteHouse通过其独特的存算分离架构,实现了资源的高效利用和灵活扩展。该架构的引入,有效解决了传统数据仓库在计算和存储资源上的紧耦合问题,使得企业可以根据实际需求独立扩展计算或存储资源,避免资源浪费。   基于存算分离架构,ByteHouse将计算资源 Shared-Nothing 和存储资源 Shared-Disk 独立扩展,用户只需根据实际业务需求灵活调整计算资源配置,无需受限于存储限制。另外,ByteHouse采用弹性计费、自动启停策略,当 VW 空闲超过 5 分钟时,自动启停 会自动关闭集群,VW在关闭期间不会产生任何费用,能帮助用户节省至少20%成本。   其次,计算和存储的独创设计,为企业带去双重“技术红利”。在计算层面,ByteHouse自研的查询优化器提升了多表查询性能,同时其点查优化技术,提升了整体系统的并发性能。据性能测试显示,ByteHouse的性能比开源ClickHouse提升了40%-50%,这意味着在相同的查询单位算力下,ByteHouse能够显著减少计算节点数量,从而降低企业的硬件成本。在存储层面,ByteHouse共享对象存储、存储分级、数据压缩等极致优化,进一步压缩了存储成本。   除了技术层面优势,ByteHouse在生态兼容性方面也表现出色。一方面,ByteHouse 支持丰富的上下游生态,包括Flink、Spark、DataX、DataSail等数据导入、加工工具; Airflow,DophinScheduler等调度工具; Superset、Tableau、FineBI、DataWind等BI工具以及语言Driver、开发工具等。另一方面,ByteHouse与ClickHouse、MySQL生态完全兼容,降低用户数据迁移门槛和迁移额外成本。   最后,ByteHouse还具备强大的“融合红利”。立足于All in One的理念,ByteHouse融合了实时查询、聚合查询、人群圈选、文本检索等各类场景,不仅简化了企业的技术栈管理,降低运维成本,还为企业提供了更加丰富和一体化的使用体验。从数据上看,以抖音集团内部举例,仅仅5个 SRE 工程师就能运维近 2 万台 ByteHouse 服务器。   值得一提的是,在湖仓融合方面,ByteHouse支持业界常见数据湖的外表连接方式,能实现多种外表和ByteHouse内表的联邦查询。同时,通过Zero-ETL技术,ByteHouse可以将数据湖中的数据自动同步到数仓中,不仅提高了分析效率,减少数据不一致问题,还降低了数据的冗余存储和转换成本。   ByteHouse极致降本的能力也在抖音集团内部以及游戏等外部场景中得到充分检验和应用。目前,抖音集团超过80%业务都基于ByteHouse部署,在存算分离架构上,ByteHouse对象存储能减少抖音集团上层软件层的副本需求,在QPS提升35%的基础上,成本降低60%。除此之外,在某头部游戏公司的应用中,ByteHouse高并发点查能力也帮助该公司在服务器核数减少30% 情况下,并发性能提升2倍。     凭借创新的OLAP架构、卓越的技术创新、广泛的生态兼容性以及强大的融合优势,ByteHouse为企业级数仓降本增效提供了有力支持,进一步助力企业加速数字化转型,实现数据驱动下的业务增长。

标签:数仓,存储,架构,查询,抖音,极致,ByteHouse,成本
From: https://www.cnblogs.com/bytedata/p/18515301

相关文章

  • 重工业数字化转型创新实践:某国家特大型钢铁企业如何快速落地基于实时数仓的数据分析平
    使用TapData,化繁为简,摆脱手动搭建、维护数据管道的诸多烦扰,轻量替代OGG,Kettle等同步工具,以及基于Kafka的ETL解决方案,「CDC+流处理+数据集成」组合拳,加速仓内数据流转,帮助企业将真正具有业务价值的数据作用到实处,将“实时数仓”方法论落进现实。TapData持续迭代产品......
  • 降本提效 60%,ProtonBase 助力新兴企业精简架构与实时数仓转型的实践
    导读:在IoT物联网场景,随着传感器和物联网技术的大量应用,海量IoT设备生产了大量的数据,比如制造业工厂生产线、新能源汽车、城市安防监控摄像头和各类机器人应用场景等。这类场景的共同特点是数据生成频繁,数据规模大,可能轻易能达到数百TB甚至PB级别。当前大部分企业内对于大数......
  • ByteHouse直播预告:揭秘基于OLAP降本增效的四大硬招
    在数字化转型浪潮中,企业数据量正以惊人的速度增长,随之而来的数据存储、处理与分析挑战也日益严峻。在这一背景下,如何既保障查询性能,又尽可能降低资源成本,已成为企业亟需解决的核心问题。 为此,ByteHouse将于10月23日19:00举办线上直播活动,围绕“降本增效”话题,深入探讨企业如何......
  • 数仓模型规范设计
    模型架构设计数仓架构一般从宏观上分为三层:操作数据层ODS、公共维度模型层CDM和数据应用层ADS。其中CDM又包含明细数据层DWD、汇总数据层DWS,维度层DIM、根据生产经验这里可在加入数据临时层TMP。架构图如下:ODS把操作系统的数据几乎无处理地存放在数据仓库系统中。支持......
  • 【优选算法篇】踏入算法的深邃乐章:滑动窗口的极致探秘
    文章目录C++滑动窗口详解:进阶题解与思维分析前言第二章:进阶挑战2.1水果成篮解法一:滑动窗口解法二:滑动窗口+数组模拟哈希表复杂度分析:图解分析:示例:滑动窗口执行过程图解:详细说明:2.2找到字符串中所有字母异位词解法:滑动窗口+哈希表复杂度分析:图解分析:滑动窗口执......
  • 落地ZeroETL 轻量化架构,ByteHouse推出“四个一体化”战略
    在数字化转型的浪潮中,数据仓库作为企业的核心数据资产,其重要性日益凸显。随着业务范围扩大,企业也会使用不同的数据仓库来管理、维护相关数据。研发人员需要花费大量时间和精力,从中导出数据,然后进行手动整理、转换格式,再导入到分析工具中完成数据分析。该过程不仅繁琐,还容易出错。......
  • 数仓开发理论(二)数仓构建分层概念
    数仓建模的好处好的数据仓库能够支持复杂数据分析和决策,能够提供高性能查询,能够做到数据的通用集成和保持数据的一致性,可以说得上是面向业务分析的数据库数仓功能本质就是通过建模来达成对复杂业务的抽象,清晰准确完整的刻画业务场景,以便用户通过业务视角便捷的获取所需数据,完成......
  • 数仓开发理论(一)概念总览
    数据仓库概念可以把数据仓库认为是一个国道汇总到高速的一个高速中转站,负责收集这些不同地方来源的数据,统一归纳整理好再放到高速上去用,达到高效数据中转的效果数据仓库的目的就是为了统筹集中所有可以使用的数据,构建面向分析的集成数据环境,通过最终数据分析结果为企业提供决策......
  • GIS、向量、文字检索... 火山引擎 ByteHouse 集成全场景分析能力
    企业业务场景增多、规模扩大,对于底层数据架构来说,可能也会愈加复杂。 比如,某企业因自身业务发展,需要引入向量检索能力,但前期选型的技术架构并不能直接支持,只能重新引入向量数据库。这意味着,研发团队要维护多个组件,让底层架构非常复杂,不仅带来数据冗余,也给数据运维带来压力,造成......
  • 小米13T Pro系统合集:性能与摄影的极致融合,值得你升级的系统ROM
    小米13TPro是一款性能卓越、设计精美的旗舰机型,具备多项领先配置,且在与前一代产品及友商机型的对比中优势明显,值得深入探讨。性能提升小米13TPro搭载了最新的天玑9200+处理器,相较于前一代(小米12TPro)的骁龙8+Gen1,在性能和能效表现上均有显著提升。天玑9200+的A......