「拓数派（OpenPie）2022发布会实录」PieCloudDB Database元数据管理

时间：2023-12-02 11:06:42浏览次数：45

标签：OpenPie Database 实现 PieCloudDB 数据库 key 数据分布式

10月24日程序员节，拓数派（Openpie）发布了云原生数据库PieCloudDB 。PieCloudDB 以云计算架构为设计基础，实现云上存算分离，打造了“元数据-计算-存储”分离三层架构。

传统MPP数据库的元数据与用户数据是紧密耦合的，元数据与用户数据解耦合是PieCloudDB 作为一款云原生数据库的重要特征。PieCloudDB 在架构上创建了独立的元数据服务层，保证了元数据的高可用性和独立伸缩性。

本文整理自拓数派（OpenPie）2022产品发布会的演讲，将为大家着重介绍PieCloudDB Database的元数据管理。

PieCloudDB数据库的两个重要设计目标是多集群和高可用。多集群是指在一个数据集上，用户可以启动多个集群，进行数据的增删查改操作。在这个过程中，需要保证数据的ACID特性，分别是原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。高可用是指在损失一个或多个节点的情况下，集群能够继续提供服务。这两个设计目标都要求数据库具备多个主节点的特性，也就是在多集群的情况下每个集群拥有多个coordinator，每个coordinator 都具有执行数据库所有功能的能力，包括 DML 和 DDL。

mStore:PieCloudDB上的Catalog服务

PieCloudDB实现了两个基本模块：一是实现一个分布式的数据存储模块，这个模块需要实现多级并发访问，并实现多版本在内的所有存储特性；二是实现分布式的锁。这个新的分布式云数据库的存储被称为mStore，我们选择FoundationDB作为mStore的存储介质。

FoundationDB是一款由苹果公司开源的分布式的Key-Value 存储，经过大量商业验证，具有良好的扩展性和完备的事务一致性。mStore的数据存储方式以元组为单位存储在KV中，使用tuple id作为key，并使用和堆表相同的机制实现MVCC。

PieCloudDB是一款OLAP（分析型）数据库，但对于元数据的访问高度近似于OLTP的模式，因此我们需要实现索引。我们将参与索引的字段编译成二进制 key的一部分，这样就可以利用FoundationDB Key的排序特性实现与B-tree特性类似的索引。在这个索引的加持下，用户就可以高效而且低成本的访问元数据。

从下图上可以看到，在索引由多个字段组成的情况下，PieCloudDB database将每个字段按照顺序编译成定长的二进制key，然后由这些二进制Key组成索引的key-value中的key，让索引中key的排序与index保持一致。从而实现了与B-tree 类似的功能。

「拓数派（OpenPie）2022发布会实录」PieCloudDB Database元数据管理_数据库

这种排序方式要求我们将所有的key编译成定长的key。如果Index Key是变长的需要将其转化为定长的key。此时，Index会混入一些多余的数据，通过re-check即可将其去除掉，从而实现一个与原有Postgres B-tree index 完全相同的Index。

基于FoundationDB的分布式锁

PieCloudDB 元数据的多级并发访问功能使用等待的方式来实现多用户并发访问。这种模式的好处是，在大负载和长事务的情况下可以避免回滚。由于PieCloudDB为多主模式，即多个主节点会分布在多台物理机上，导致原本以内存为基础的锁变得不可用。因此，PieCloudDB 设计并实现了新的分布式锁。分布式锁以key-value的形式存储在FoundationDB中，使用FoundationDB的事务来保证锁操作的原子性，并使用watcher机制来实现锁的等待和唤醒。

「拓数派（OpenPie）2022发布会实录」PieCloudDB Database元数据管理_数据库_02

PieCloudDB Database的元数据层为计算集群提供了统一的元数据管理服务，保证了计算集群的一致性，实现了对使用资源的有效管理。此外，PieCloudDB 智能化云原生平台为用户提供可视化界面，降低用户的管理门槛，帮助用户更便捷的使用PieCloudDB database。

关于PieCloudDB

PieCloudDB是一款全新eMPP分布式技术云原生分析型数据库。通过重新打造云上的数据库内核，突破了PC时代计算平台的限制，实现云上存算分离。旨在为企业提供包含实时处理、秒级扩缩容、弹性计算、集成数据分析等强大功能的云上数据存储和计算引擎。在云上，计算资源可按需启动，对计算模型以更低成本提供指数级的存储和计算资源，帮助企业的业务模型发现新洞察或者提高精准度，从而建立竞争壁垒。目前，PieCloudDB在金融，医疗，汽车及制造等行业积累了一批种子用户，产品备受业界及用户的高度关注及认可。

标签：OpenPie,Database,实现,PieCloudDB,数据库,key,数据,分布式
From： https://blog.51cto.com/u_16396625/8654057

「拓数派（OpenPie）2022发布会实录」PieCloudDB Database分布式引擎
10月24日程序员节，拓数派发布了云原生数据库PieCloudDB社区版与商业版。本文整理自拓数派「OpenPie」2022发布会的演讲，将从PieCloudDBDatabase的计算、存储、事务三个方面来介绍分布式引擎模块。计算首先为大家介绍的方面是计算。PieCloudDB通过重新打造云上的数据库内核，突破......
「拓数派（OpenPie）2022发布会实录」PieCloudDB Database 新一代云原生存储引擎
10月24日程序员节，拓数派「OpenPie」发布了云原生数据库PieCloudDBDatabase社区版与企业版。通过重新打造云上的数据库内核，突破了PC时代计算平台的限制，实现云上存算分离。PieCloudDB基于云的基础设施，专为云平台打造。本文整理自拓数派「OpenPie」2022发布会的演讲，将为大家着重介......
「拓数派（OpenPie）2022发布会实录」PieCloudDB Database优化器
10月24日程序员节，拓数派（Openpie）发布了云原生数据库PieCloudDB。PieCloudDB以云计算架构为设计基础，实现云上存算分离，打造了“元数据-计算-存储”分离三层架构。在计算层，PieCloudDB设计了高效的查询优化器和执行器，实现了预计算、聚集下推等多种查询优化策略，保证查询的高效运行，减......
「拓数派（OpenPie）2022发布会实录」PieCloudDB Database智能化云原生平台
作为一款云原生eMPP数据库，PieCloudDBDatabase的部署和管控也是云原生的。PieCloudDB为用户提供了智能化云原生平台，提供数据洞察、元数据浏览、用户管理、权限管理、SQL执行、ETL管理等功能，可视化管理平台界面使用户得以更方便地在网页端进行管理。本文整理自拓数派「OpenPie」202......
再度上榜丨冯雷荣登“2022年度智造中国商业领袖” OpenPie
近日，由数商传媒《数字商业时代》举办的2022年度“智造中国高峰论坛”圆满落幕。拓数派创始人兼CEO冯雷荣登“2022年度智造中国商业领袖”，其曾于2018年，时任PaaS云第一股Pivotal中国公司常务董事、研发中心总经理时，凭借Pivotal中国的成就获此殊荣。时隔四年，如今，冯雷作为一家中国本土......
【DTCC 2022】云原生数据库PieCloudDB全新eMPP架构是如何炼成的
12月14-16日，第十三届中国数据库技术大会（DTCC2022）在线上隆重召开。拓数派赞助并参与了数据库盛会DTCC，在会议中，拓数派CTO郭罡分享了《云原生数据库PieCloudDB eMPP架构设计与实现》的主题演讲。在演讲中，郭罡分析了传统分布式MPP架构的痛点，介绍了云原生数据库PieCloudDB的eMPP架......
拓数派云原生数据库PieCloudDB与XSKY产品完成兼容性互认证
数据库作为数字经济建设的基础，是产业数字化、释放数据价值的基石。而良好的生态建设是数据库发展的重要一环。拓数派的云原生eMPP数据库产品PieCloudDBDatabase原生兼容PostgreSQL/Greenplum生态组件，兼容包括开源空间数据管理组件PostGIS，Apache开源机器学习库Madlib、开源查......
PieCloudDB Database 云上商业智能的最佳实践
「商业智能（BusinessIntelligence，BI）」这个概念最早是Gartner在上个世纪九十年代提出的，它认为从功能上来说，商业智能是一种解决方案，其关键是处理企业来自多个来源的各种数据，提取有用的数据并清理，然后经过抽取（Extraction）、转换（Transformation）和加载（Load），即ETL过程，合并到一个企业级......
『Postgres.Live 技术沙龙回顾』揭秘 PieCloudDB Database eMPP 架构设计
2月1日，拓数派参与了由开源软件联盟PostgreSQL分会组织的Postgres.Live线上系列沙龙活动。拓数派产品及推广总监吴疆发表主题演讲《PieCloudDB：eMPP云原生数据库》。相关视频回放欢迎访问拓数派B站链接，PPT欢迎前往官网链接获取。本文由演讲内容整理而成。随着计算机技术的发展，”云......
OpenPie 和 ChatGPT 聊聊云上数据计算的那些事儿
要说时下科技圈最火的新技术话题，那就非ChatGPT莫属了。由它引发的各类“人工智能（AI）能否取代人工”的讨论狂飙不停，抛开法律和道德层面的争议，ChatGPT确实可以准确地回答用户大部分的通用知识问题。那么大家是否会好奇，ChatGPT是依靠什么获得了这样“无所不知”的超能力呢？ ......

「拓数派（OpenPie）2022发布会实录」PieCloudDB Database元数据管理

mStore:PieCloudDB上的Catalog服务

基于FoundationDB的分布式锁

关于PieCloudDB

相关文章

赞助商

阅读排行

「拓数派（OpenPie）2022发布会实录 」PieCloudDB Database元数据管理

mStore:PieCloudDB上的Catalog服务

基于FoundationDB的分布式锁

关于PieCloudDB

相关文章

赞助商

阅读排行

「拓数派（OpenPie）2022发布会实录」PieCloudDB Database元数据管理