首页 > 其他分享 >「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database元数据管理

「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database元数据管理

时间:2023-12-02 11:06:42浏览次数:32  
标签:OpenPie Database 实现 PieCloudDB 数据库 key 数据 分布式

10月24日程序员节,拓数派(Openpie)发布了云原生数据库PieCloudDB 。PieCloudDB 以云计算架构为设计基础, 实现云上存算分离,打造了“元数据-计算-存储”分离三层架构。

传统MPP数据库的元数据与用户数据是紧密耦合的,元数据与用户数据解耦合是PieCloudDB 作为一款云原生数据库的重要特征。PieCloudDB 在架构上创建了独立的元数据服务层,保证了元数据的高可用性和独立伸缩性。

本文整理自拓数派(OpenPie)2022产品发布会的演讲,将为大家着重介绍PieCloudDB Database的元数据管理。

 

PieCloudDB数据库的两个重要设计目标是多集群和高可用。多集群是指在一个数据集上,用户可以启动多个集群,进行数据的增删查改操作。在这个过程中,需要保证数据的ACID特性,分别是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。高可用是指在损失一个或多个节点的情况下,集群能够继续提供服务。这两个设计目标都要求数据库具备多个主节点的特性,也就是在多集群的情况下每个集群拥有多个coordinator,每个coordinator 都具有执行数据库所有功能的能力,包括 DML 和 DDL。

 



mStore:PieCloudDB上的Catalog服务

PieCloudDB实现了两个基本模块:一是实现一个分布式的数据存储模块,这个模块需要实现多级并发访问,并实现多版本在内的所有存储特性;二是实现分布式的锁。这个新的分布式云数据库的存储被称为mStore,我们选择FoundationDB作为mStore的存储介质。

FoundationDB是一款由苹果公司开源的分布式的Key-Value 存储,经过大量商业验证,具有良好的扩展性和完备的事务一致性。mStore的数据存储方式以元组为单位存储在KV中,使用tuple id作为key,并使用和堆表相同的机制实现MVCC。

PieCloudDB是一款OLAP(分析型)数据库,但对于元数据的访问高度近似于OLTP的模式,因此我们需要实现索引。我们将参与索引的字段编译成二进制 key的一部分,这样就可以利用FoundationDB Key的排序特性实现与B-tree特性类似的索引。在这个索引的加持下,用户就可以高效而且低成本的访问元数据。

从下图上可以看到,在索引由多个字段组成的情况下,PieCloudDB database将每个字段按照顺序编译成定长的二进制key,然后由这些二进制Key组成索引的key-value中的key,让索引中key的排序与index保持一致。从而实现了与B-tree 类似的功能。

「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database元数据管理_数据库

这种排序方式要求我们将所有的key编译成定长的key。如果Index Key是变长的 需要将其转化为定长的key。此时,Index会混入一些多余的数据,通过re-check即可将其去除掉,从而实现一个与原有Postgres B-tree index 完全相同的Index。

 



基于FoundationDB的分布式锁

PieCloudDB 元数据的多级并发访问功能使用等待的方式来实现多用户并发访问。这种模式的好处是,在大负载和长事务的情况下可以避免回滚。由于PieCloudDB为多主模式,即多个主节点会分布在多台物理机上,导致原本以内存为基础的锁变得不可用。因此,PieCloudDB 设计并实现了新的分布式锁。分布式锁以key-value的形式存储在FoundationDB中,使用FoundationDB的事务来保证锁操作的原子性,并使用watcher机制来实现锁的等待和唤醒。

「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database元数据管理_数据库_02

PieCloudDB Database的元数据层为计算集群提供了统一的元数据管理服务,保证了计算集群的一致性,实现了对使用资源的有效管理。此外,PieCloudDB 智能化云原生平台为用户提供可视化界面,降低用户的管理门槛,帮助用户更便捷的使用PieCloudDB database。

 



关于PieCloudDB

 PieCloudDB是一款全新eMPP分布式技术云原生分析型数据库。通过重新打造云上的数据库内核,突破了PC时代计算平台的限制,实现云上存算分离。旨在为企业提供包含实时处理、秒级扩缩容、弹性计算、集成数据分析等强大功能的云上数据存储和计算引擎。在云上,计算资源可按需启动,对计算模型以更低成本提供指数级的存储和计算资源,帮助企业的业务模型发现新洞察或者提高精准度,从而建立竞争壁垒。目前,PieCloudDB在金融,医疗,汽车及制造等行业积累了一批种子用户,产品备受业界及用户的高度关注及认可。

标签:OpenPie,Database,实现,PieCloudDB,数据库,key,数据,分布式
From: https://blog.51cto.com/u_16396625/8654057

相关文章

  • 「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database分布式引擎
    10月24日程序员节,拓数派发布了云原生数据库PieCloudDB社区版与商业版。本文整理自拓数派「OpenPie」2022发布会的演讲,将从PieCloudDBDatabase的计算、存储、事务三个方面来介绍分布式引擎模块。计算首先为大家介绍的方面是计算。PieCloudDB通过重新打造云上的数据库内核,突破......
  • 「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database 新一代云原生存储引擎
    10月24日程序员节,拓数派「OpenPie」发布了云原生数据库PieCloudDBDatabase社区版与企业版。通过重新打造云上的数据库内核,突破了PC时代计算平台的限制,实现云上存算分离。PieCloudDB基于云的基础设施,专为云平台打造。本文整理自拓数派「OpenPie」2022发布会的演讲,将为大家着重介......
  • 「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database优化器
    10月24日程序员节,拓数派(Openpie)发布了云原生数据库PieCloudDB。PieCloudDB以云计算架构为设计基础,实现云上存算分离,打造了“元数据-计算-存储”分离三层架构。在计算层,PieCloudDB设计了高效的查询优化器和执行器,实现了预计算、聚集下推等多种查询优化策略,保证查询的高效运行,减......
  • 「拓数派(OpenPie)2022发布会实录 」PieCloudDB Database智能化云原生平台
    作为一款云原生eMPP数据库,PieCloudDBDatabase的部署和管控也是云原生的。PieCloudDB为用户提供了智能化云原生平台,提供数据洞察、元数据浏览、用户管理、权限管理、SQL执行、ETL管理等功能,可视化管理平台界面使用户得以更方便地在网页端进行管理。本文整理自拓数派「OpenPie」202......
  • 再度上榜丨冯雷荣登“2022年度智造中国商业领袖” OpenPie
    近日,由数商传媒《数字商业时代》举办的2022年度“智造中国高峰论坛”圆满落幕。拓数派创始人兼CEO冯雷荣登“2022年度智造中国商业领袖”,其曾于2018年,时任PaaS云第一股Pivotal中国公司常务董事、研发中心总经理时,凭借Pivotal中国的成就获此殊荣。时隔四年,如今,冯雷作为一家中国本土......
  • 【DTCC 2022】云原生数据库PieCloudDB全新eMPP架构是如何炼成的
    12月14-16日,第十三届中国数据库技术大会(DTCC2022)在线上隆重召开。拓数派赞助并参与了数据库盛会DTCC,在会议中,拓数派CTO郭罡分享了《云原生数据库PieCloudDB eMPP架构设计与实现》的主题演讲。在演讲中,郭罡分析了传统分布式MPP架构的痛点,介绍了云原生数据库PieCloudDB的eMPP架......
  • 拓数派云原生数据库PieCloudDB与XSKY产品完成兼容性互认证
    数据库作为数字经济建设的基础,是产业数字化、释放数据价值的基石。而良好的生态建设是数据库发展的重要一环。 拓数派的云原生eMPP数据库产品PieCloudDBDatabase原生兼容PostgreSQL/Greenplum生态组件,兼容包括开源空间数据管理组件PostGIS,Apache开源机器学习库Madlib、开源查......
  • PieCloudDB Database 云上商业智能的最佳实践
    「商业智能(BusinessIntelligence,BI)」这个概念最早是Gartner在上个世纪九十年代提出的,它认为从功能上来说,商业智能是一种解决方案,其关键是处理企业来自多个来源的各种数据,提取有用的数据并清理,然后经过抽取(Extraction)、转换(Transformation)和加载(Load),即ETL过程,合并到一个企业级......
  • 『Postgres.Live 技术沙龙回顾』揭秘 PieCloudDB Database eMPP 架构设计
    2月1日,拓数派参与了由开源软件联盟PostgreSQL分会组织的Postgres.Live线上系列沙龙活动。拓数派产品及推广总监吴疆发表主题演讲《PieCloudDB:eMPP云原生数据库》。相关视频回放欢迎访问拓数派B站链接,PPT欢迎前往官网链接获取。本文由演讲内容整理而成。随着计算机技术的发展,”云......
  • OpenPie 和 ChatGPT 聊聊云上数据计算的那些事儿
    要说时下科技圈最火的新技术话题,那就非ChatGPT莫属了。由它引发的各类“人工智能(AI)能否取代人工”的讨论狂飙不停,抛开法律和道德层面的争议,ChatGPT确实可以准确地回答用户大部分的通用知识问题。那么大家是否会好奇,ChatGPT是依靠什么获得了这样“无所不知”的超能力呢?   ......