首页 > 其他分享 >助力降本增效,ByteHouse 打造新一代云原生数据仓库

助力降本增效,ByteHouse 打造新一代云原生数据仓库

时间:2024-09-26 11:24:57浏览次数:13  
标签:原生 场景 数据仓库 营销 降本增效 引擎 ByteHouse 数据

随着数据量的爆炸式增长、企业上云速度加快以及数据实时性需求加强,云原生数仓市场迎来了快速发展机遇。

据 IDC、Gartner 研究机构数据显示,到 2025 年,企业 50% 数据预计为云存储,75% 数据库都将运行在云上,全球数据处理预计有 30% 为实时数据处理,80% 数据预计为非结构化数据,这将驱使云原生数仓愈加受到企业青睐。

近期,火山引擎云原生数据仓库 ByteHouse 产品负责人李群受邀出席“CSDI summit 中国软件研发创新科技峰会”,围绕“新一代云原生数仓 ByteHouse 关键技术与最佳实践”主题,从云数仓历史和前沿出发,介绍 ByteHouse 整体架构、关键亮点、性能突破、存算分离的关键设计,以及 ByteHouse 在抖音集团内外多样化场景中的业务实践。

助力降本增效,ByteHouse 打造新一代云原生数据仓库_数据仓库

基于 ByteHouse 在金融、游戏、泛互联网等多行业的经验总结,李群首先介绍了云原生数据仓库目前面临的难点和挑战。高性能、高并发、高吞吐写入,已经是当今企业对云数仓的基础需求。随着互联网不断发展,数据增长迅速,特别是埋点日志类数据,一些较为活跃的 APP,每天数据达到百亿甚至千亿级别,大规模杀手级应用每天更是产生数千亿事件量。这要求数据平台不仅要支持高吞吐写入、实时去重,面对业务请求还要达到毫秒级响应。

除此之外,企业还面临数据架构复杂、灵活性欠缺、成本控制难的问题。例如,为了实现一个数据分析功能,企业可能需要引入三、四个甚至更多的组件来构建,导致扩容较难、运维压力大,人力维护成本高。

为了解决以上问题,ByteHouse 首先在性能上实现突破。在复杂查询上,ByteHouse 从 RBO(基于规则的优化能力)、CBO(基于代价的优化能力)、分布式计划生成方面推出了自研优化器,能够准确的计算出效率最大化执行路径,大幅度降低用户查询时间。除此之外,ByteHouse 还从 Exchange、Runtime Filter 以及并行化重构等方向进行了优化。针对实时吞吐慢、BI 报表慢、离/在线复杂分析慢、湖+仓联邦分析慢、人群圈选慢、以图搜图慢六大场景,ByteHouse 都推出了定制解决方案,并在客户实际场景中产生实效。

在提升效率同时,ByteHouse 也专注于帮助用户节省成本。基于 ByteHouse 弹性伸缩能力,用户只需基于时间、资源负载等条件就能进行扩容、缩容配置,减轻手动管理的负担,提升资源利用率。在存储层面, ByteHouse 采用 Serverless 架构,具有低成本、无限扩展的能力。在计算层面,ByteHouse 则基于 PaaS 模式,通过容器化实现无状态或弱状态,将整个计算组包装成租户和应用呈现给用户,保证租户之间不会发生资源征用冲突或性能劣化,让计算资源在秒级内实现弹性拉起和弹性扩缩容。

最后,为了给用户提供更便捷的使用体验,ByteHouse 也在一体化、生态兼容性以及全场景引擎方面进一步提升易用性。以全场景引擎为例,ByteHouse 通过构建统一的平台为用户提供更丰富的数据分析能力,实现数据效能最大化,已经推出了全文检索引擎、GIS 引擎、Vector 引擎,让用户在享受 OLAP 极致性能的同时,无需引入其他架构,就能使用文字检索、地理空间分析、向量检索能力。

在应用场景方面,李群则从实时数仓、企业级 OLAP 中台、广告精准营销三个场景,带来 ByteHouse 最佳实践分享。

以广告精准营销场景为例,随着移动互联网的流量红利消退,精细化营销模式随之跃迁为主流。从数以亿计的人群中,优选出最具潜力的目标受众,是精细营销的题中之义,也是作为基础引擎的数据仓库能力所面临的挑战。

从 ByteHouse 曾服务的某个短剧广告营销公司来看,一方面,该公司投放在业务上需要实时调整策略,要求数据分析、更新时效性在 3s 内,并发 QPS 达到 2000;另一方面,在营销场景中,海量数据实时更新会产生大量数据碎片,拉低查询性能、浪费存储空间。

助力降本增效,ByteHouse 打造新一代云原生数据仓库_olap_02

通过引入 ByteHouse、连山云、巨量引擎联合解决方案,该广告营销公司搭建了一套 ”一键实时同步、极简架构、低门槛技术” 的短剧行业通用解决方案,提升广告数据处理效率与投放 ROI。

在效果上,通过多级索引,如排序键索引、分区键优化、跳跃索引等,ByteHouse 有效减少了广告营销查询时扫描的数据量,在每天千万查询量的情况下,数据返回时效也能保障在秒级,较之前 5 倍提升。在计算组隔离策略中,ByteHouse 为广告营销场景中的数据读、写分别构建独立的计算资源,再通过灵活的 SQL 分发机制,已可以支持超过 2000 QPS 的查询高并发。

据介绍,ByteHouse 还与中国地震台网中心、莉莉丝游戏、极客邦科技等诸多行业企业达成了深度合作,凭借新一代的云原生架构,高效方便的运维模式,以及高性能更灵活的实时查询能力,为企业抓稳数字化机遇建立了夯实的地基,推动企业的数智化转型升级。

标签:原生,场景,数据仓库,营销,降本增效,引擎,ByteHouse,数据
From: https://blog.51cto.com/bytedata/12118056

相关文章

  • 助力降本增效,ByteHouse打造新一代云原生数据仓库
    随着数据量的爆炸式增长、企业上云速度加快以及数据实时性需求加强,云原生数仓市场迎来了快速发展机遇。据IDC、Gartner研究机构数据显示,到2025年,企业50%数据预计为云存储,75%数据库都将运行在云上,全球数据处理预计有30%为实时数据处理,80%数据预计为非结构化数据,这将驱使云......
  • 数据技术进化史:从数据仓库到数据中台再到数据飞轮
    随着数字经济的快速发展,数据的价值变得越来越重要,数据技术也在不断升级,从数据仓库到数据中台,再到如今的数据飞轮,每个阶段的技术进步都对企业的数据管理和业务运营产生了深远的影响。本文将探讨这些技术的演变过程,并分析数据仓库、数据中台和数据飞轮之间的联系与区别。数据仓库:数据......
  • ByteHouse新一代云数仓关键技术及最佳实践
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群今日解读:ByteHouse视角下的新一代云数仓。主要内容包括:ByteHouse简介、云数仓核心能力解析以及最佳实践。ByteHouse简介ByteHouse是火山引擎数智平台VeDI旗下的一款云原生数仓产品,以ClickHouse......
  • 数据驱动再升级:从数据仓库到数据中台,再到制造业数据飞轮
    在当今的数据驱动时代,制造业已经经历了从初级数据采集到利用数据驱动决策的转变。数据仓库、数据中台、和数据飞轮的概念顺序演进,反映了对数据价值深层次挖掘的追求和实践。本文将探讨这些技术是如何在制造业中被应用,以及它们对业务模式带来的革命性变化。数据仓库:基础数据聚合的......
  • 你必须要知道的:从数据仓库到数据中台再到数据飞轮:数据技术进化史的个人见证!
    前言在数字化转型浪潮席卷全球的时代,数据作为“新石油”的重要性日益凸显。企业依赖于数据驱动的决策模式,而支撑这一切的正是不断演进的数据技术。回顾这些年数据技术的革新,从最初的数据仓库到后来的数据中台,再到如今的“数据飞轮”概念,每一步的演进都展现了技术如何赋能业务、如......
  • ByteHouse新一代云数仓关键技术及最佳实践
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 今日解读:ByteHouse视角下的新一代云数仓。主要内容包括:ByteHouse简介、云数仓核心能力解析以及最佳实践。 ByteHouse简介ByteHouse是火山引擎数智平台VeDI旗下的一款云原生数仓产品,以......
  • 数据飞轮:从数据仓库到数据中台的技术革新视角
    在当前的商业环境中,数据不只是支持决策的工具,它已经变成驱动业务增长的核心资产。从数据仓库的集中式存储、管理到数据中台的统筹调度再到数据飞轮的自我增强,每一个步骤不仅仅是技术的跃进,更是企业战略的演变。自动化营销:数据驱动的新途径在自动化营销场景中,企业通过分析用户行为......
  • 数据飞轮:从数据仓库到数据中台的演变与实践
    在今天的竞争激烈的商业环境中,管理和利用数据已经成为企业获取竞争优势的关键。数据技术的发展使得企业不仅需要存储大量数据,更要从数据中提取价值,推动业务成长。本文将探讨数据仓库如何演进为数据中台,最终形成数据飞轮,特别是在智能推荐和产品优化的业务场景中,如何通过技术手段实现......
  • 从数据仓库到数据中台再到数据飞轮,我了解的数据技术进化史
    从数据仓库到数据中台再到数据飞轮,数据技术的进化史展现了企业在数据管理和使用上的需求从基础的存储、查询向更高效、更智能的方向发展的过程。以下是对这一技术进化史的详细阐述:一、数据仓库(DataWarehouse)概念与起源:数据仓库的概念最早可追溯至20世纪80年代末,由BillInmon在其著......
  • 社交行业中的数据进化故事:从数据仓库到数据飞轮的技术变革
    在当今数字化时代,数据技术的进化不仅推动了商业模式的革新,还重塑了用户体验。社交行业,作为数据密集和技术驱动的领先行业之一,见证了从简单的数据仓库到动态的数据中台,再到数据飞轮的技术演变。本文将探讨这一行业中数据飞轮如何赋能自动化营销、新用户激励以及全链路营销等业务场景......