Greenplum数据库是一种大规模并行处理(MPP)数据库服务器,其架构特别针对管理大规模分析型数据仓库以及商业智能工作负载而设计。
MPP(也被称为shared nothing架构)指有两个或者更多个处理器协同执行一个操作的系统,每一个处理器都有其自己的内存、操作系统和磁盘。Greenplum使用这种高性能系统架构来分布数T字节数据仓库的负载并且能够使用系统的所有资源并行处理一个查询。
Greenplum数据库是基于PGSQL开源技术的。它本质上是多个PG面向磁盘的数据库实例一起工作形成的一个紧密结合的数据库管理系统(DBMS)。
GP数据库可以使用追加优化的存储格式来批量装载和读取数据,并且能够提供HEAP表上的性能优势。追加优化的存储为数据保护、压缩和行/列方向提供了校验和。行式或者列式追加优化的表都可以被压缩。
Greenplum数据库可以选用列式存储,数据在逻辑上还是组织成一个表,但其中的行和列在物理上是存储在一种面向列的格式中,而不是存储成行。列式存储只能和追加优化表一起使用。列式·存储是可压缩的
Greenplum数据库通过将数据和处理负载分布在多个服务器或者主机上来存储和处理大量的数据。Greenplum数据库是一个由基于PGSQL 8.3的数据库组成的阵列,阵列中的数据库工作在一起呈现了一个单一数据库的景象。
master是Greenplum数据库系统的入口。客户端会连接到这个数据库实例并且提交sql语句。master会协调与系统中其他称为Segment的数据库实例一起工作,Segment负责存储和处理数据。
LAN(局域网)
关于Greenplum数据库的Master是整个Greenplum数据库系统的入口,它接受连接和SQL查询并且把工作分布到Segment实例上。
关于Greenplum的Segmen实例是独立的PG数据库,每一个都存储了数据的一部分并且执行查询处理的主要部分。
关于Greenplum的Interconnect是Greenplum数据库架构中的网络层。指的是Segment之间的进程间通信以及这种通信所依赖的网络基础设施。
标签:存储,列式,GreenPlum,数据库,实例,关于,构架,Segment,Greenplum From: https://www.cnblogs.com/xiao-wang-tong-xue/p/16609298.html