初识GaussDB——GaussDB的发展历程、部署方式和企业案例
姜殿斌2020-02-17 34311. GaussDB的命名和品牌
GaussDB 的热点话题
- 名字的由来:GaussDB是华为数据库产品品牌名,致敬数学家高斯(Gauss)
- GaussDB 的品类:GaussDB T 和 GaussDB A
GaussDB T 的里程碑
- 发布时间:2019年5月15日正式发布;
- 公开发布时间:预计 2020年3月;
- 开源时间:预计2020年6月;(注:开源的是单机版)
GaussDB系列数据库的缘起
-
GaussDB T (OLTP) - 前身是GaussDB 100,华为公司自主研发的分布式数据库,基于华为公司在2007年开始研发并在电信计费领域规模商用的自研内存数据库全面改造,支持x86和华为Kunpeng硬件架构,基于创新性数据库内核。
-
GaussDB A (OLAP) - 前身是GaussDB 200,一款具备分析及混合负载能力的分布式数据库,从2011年开始,基于PostgreSQL 9.2.4的基础上自主研发,支持x86和华为Kunpeng硬件架构,支持行存储与列存储,提供PB(Petabyte)级数据分析能力、多模分析能力和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景。
2. GaussDB的发展历程
GaussDB T 是一款全透明分布式数据库,支持x86和Kunpeng硬件架构,基于创新性数据库内核,提供高并发事务实时处理能力、两地三中心金融级高可用能力和分布式高扩展能力,用于支撑金融、政府、电信等行业核心关键系统。
华为在数据库方面的投入是持续的,自 2002 年的探索,最终厚积薄发而出GaussDB T。
3. GaussDB的部署方式
GaussDB T 支持多种部署方式,支持单机、主备 和分布式部署。
单机部署
- 低成本部署形式
- 针对测试环境,或可靠性要求较低场景
主备部署
- 1+1(最大可用)或1+2(最大保护)主备
- 基于数据库日志复制的热备
- 单机性能可满足需求的情况下,提供高可用
全分布式部署
- 分布式高扩展:数据按shard划分,读写负载准线性扩展,满足大规模业务量场景
- 分布式高可用:支持两地三中心高可用部署
4. GaussDB的架构组件和案例
CN(Coordinator Node):负责接收来自应用的访问请求,并向客户端返回执行结果;负责分解任务,并调度任务分片在各DN上并行执行。
DN(Database Node):数据库核心组件,提供数据查询和数据存储能力;
CM(Cluster Manager):集群管理,管理和监控分布式系统中各个功能单元和物理资源运行情况,确保整个系统稳定运行;
OM(Operation Manager):工具和命令集,提供日常运维、备份、配置、监控等管理结构和工具链;
DM(Database Manager):图形化运维入口,提供丰富的图形化运维管理功能;
DT(Developer Tools):开发工具,Data Studio(DS)SQL图形化开发工具;
数据迁移工具,提供离线、在线等多种数据迁移方案;
GaussDB案例:
1、招商银行零售银行。使用GaussDB分布式OLTP数据库后,其综合交易流水平台、风险预警平台和重资产营销平台管理数据的容量提升10倍,AI的故障恢复速度提升30倍,相较其它产品30秒的RTO时间,GaussDB可以做到1秒以内。
2、某大型银行智慧银行项目。使用GaussDB分布式OLAP数据库后,其分析师平台、数据仓库和数据集市的数据分析效率大幅提升,相较友商产品TPC-DSBenchmark 2.68M的成绩,GaussDB能达到4.03M,提升达到50%。
3、中国民生银行。使用GaussDB分布式HTAP数据库后,一套架构能够支持流数据库、图数据库、空间数据、文本数据库和关系数据库五种类型数据的混合负载,在解决扩展性和性能瓶颈问题的同时,可有效分散风险,提升业务连续性。
总结
GaussDB 具备灵活的部署方式,领先的数据库智能特性,高度的兼容性,结合行业落地案例,具备广泛的应用场景,值得行业企业和从业DBA关注跟踪。