摘要
架构师在工作中经常会遇到数据库存储选型的问题,而市面上数据库产品众多,往往会无从下手,甚至有时候从业务开发到上线运维过程中会多次更换底层数据库,给整个研发中心带来不必要的额外工作。结合业务场景做数据库存储选型的时候,可以综合以下几个维度去考虑:
一、技术选型维度
1.1 业务是否需要保证ACID事务?
事务具有4个特征,分别是原子性、一致性、隔离性和持久性
需要ACID | MySQL、pg(PostgreSQL)等 |
不需要ACID | MongoDB、hbase、cassandra等 |
1.2 要求低延迟
对性能要求极致,不担心数据丢失的选择 | memcache |
数据生命周期短,数据量相对小,性能要求高,需要存储灵活的数据结构: | Redis |
一般scylladb>canssdra>hbase |
1.3 是否高并发写入,随机读多于范围读?
需要支持高并发写入,随机读多于范围读? | hbase、cassandra,hbase范围读更优。 |
1.4 海量数据存储,支持水平扩展,分布式容错?
需要支持海量数据存储,支持水平扩展,分布式容错 | NOSQL 如:resis、hbase、Cassandra、mongodb |
1.5 需要全文搜索?
支持全文搜索 | 海量数据用Elasticsearch |
支持全文搜索 | 数据量可控用pg GIST索引。 |
1.6 存储复杂数据模型?
支持存储复杂数据模型 | 文档数据库mongodb |
1.7 OLTP OR OLAP OR离线分析?
OLTP(联机事务处理) | 行存数据库 mysql 、pg |
OLAP(联机分析处理) | 列存数据库高压缩 gp 、clickhouse |
离线分析 | :hbase |
1.8 金融级要求高可用、数据不丢
支持数据不丢 | oceanbase、阿里云mysql金融版、mysql group replication |
1.9 需要事务而且海量数据存储
分库分表 | drds、sharding-jdbc+关系型数据库 |
newsql | TiDB |
1.10 CAP权衡
CAP: 一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)。
保证CA | 关系型数据库 |
保证CP | hbase、redis、mongodb |
保证AP | cassandra、riak 、couchdb |
1.11 特殊业务场景
地理信息系统GIS | PG>ES>Mongodb |
时序 | TaosDB>influxdb>opentsdb |
1.12 开发角度,业务迭代快,需要schema free
对开发友好:关系型数据库都行。另外就是MongoDB,不过也有两面性,不如关系型数据库有严格的约束,将任意类型的任意值插入任意集合,有时候会带来负面作用。
1.13 运维角度
易运维 | cassandra>hbase |
标签:架构设计,存储,海量,数据库,支持,选型,hbase From: https://blog.51cto.com/u_13643065/6046966