大数据存储架构的特点

时间：2022-11-25 19:00:43浏览次数：50

大数据平台用于处理低价值海量结构化数据、半结构化与结构化数据；其与数据仓库协同，支撑数据应用系统，弥补数据仓库的不足。从控制架构复杂度的角度考虑，应用系统应选择其主要数据源作为数据整合者，不同时与两者直接交互数据。

传统数据仓库架构制约了数据存储能力和计算能力，为了应对这些问题，基于 Hadoop 的分布式数据仓库已经成为数据存储中广泛采用的事实标准。但 Hadoop 在 SQL 兼容性和复杂逻辑即时查询的情况下还不能完全替代传统数据仓库，所以一般在传统数据仓库的场景下，使用前期共存后期逐步替代关系，即传统应用继续基于传统数据仓库技术，大数据相关的新应用采用大数据平台（大数据应用指需要做混合数据处理和传统数据仓库在规模、成本、效率方面都无法满足的应用）。数据仓库承载及时性、准确性要求高的核心事务型关键应用，大数据应用开发平台承载数据仓库痛点业务迁移和大数据创新业务，这两者都会通过这种混搭架构实现。

在企业业务方面，企业中存在各种各样的数据类型，例如结构化、半结构化和非结构化数据，针对不同的数据类型，大数据平台有针对性地采用了不同的存储组件，存储层架构示例如图1所示。

大数据存储架构的特点_结构化

图1存储层架构

架构中对于不同的数据类型规划了四种存储进行分别存储。其中最底层的存储组件为HDFS（Hadoop分布式文件系统），Hive、HBase和Solr为上层存储组件，其存储的数据最终也保存在HDFS中。分布式存储（HDFS）作为基本的存储组件，HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问，非常适合在大规模数据集上应用。

标签：HDFS,存储,架构,数据仓库,结构化,特点,数据
From： https://blog.51cto.com/u_15735635/5887429

大数据架构设计的核心要素
建设一个高价值的大数据平台，让平台有更好的扩展性和开放性，使企业级应用系统共享大数据平台的能力，来帮助企业整个IT平台拥有一个质的飞跃。结合大数据平台设计和实施的项目......
iOS 系统架构及常用框架
1.iOS基于UNIX系统，因此从系统的稳定性上来说它要比其他操作系统的产品好很多2.iOS的系统架构分为四层，由上到下一次为：可触摸层（CocoaTouchlayer）、媒体层（Medialayer）、核心......
简述五种开源NAS存储服务器--转
存储对于公司来说是必不可少的：数据必须被存储、检索、共享和保护。下面小编为大家介绍一下5款开源的NAS存储服务器一、云计算云计算正在蓬勃发展，比任何云存储系统都要快......
03-3-淘宝每秒100W请求的秒杀架构体系(1)
......
从软件搬砖师到软件架构师，程序员的成长之路
"IT有得聊”是机械工业出版社旗下IT专业资讯和服务平台，致力于帮助读者在广义的IT领域里，掌握更专业、实用的知识与技能，快速提升职场竞争力。对工作多年的程序员而言，职业发......
直播预告丨中高频多因子库存储的最佳实践
因子挖掘是量化交易的基础。随着历史交易数据日益增多，交易市场量化竞赛的不断升级和进化，量化投研团队开始面对数据频率高、因子数量多的场景，以10分钟线10000个因子5000个股......
ThinkSystem DS系列存储FC端口连接Windows主机基本配置
知识点分析:本文以ThinkSystemDS4200存储通过FC端口连接到WindowsServer2016操作系统主机为例，介绍ThinkSystemDS系列存储首次部署的基本配置操作，包括：登陆DS存储......
ThinkSystem DS系列存储iSCSI端口连接Windows主机基本配置
知识点分析：本文以ThinkSystemDS4200存储通过iSCSI端口连接到WindowsServer2016操作系统主机为例，介绍ThinkSystemDS系列存储首次部署的基本配置操作，包括：登陆DS存储......
【iOS-Cocos2d游戏开发之十九】游戏数据存储的四种常用方式NSKeyedArchiver/NSUserDef
李华明Himi 原创,转载务必在明显处注明 OK，今天Himi介绍游戏存储这一块，在Android游戏开发中Himi介绍了好几种保存的方式和形式，那么在iOS中也有......
分布式架构演进与图解
分布式系统（distributedsystem）是建立在网络之上的软件系统。内聚性：是指每一个数据库分布节点高度自治，有本地的数据库管理系统。透明性：是指每一个数据库分布节点对用户的......

大数据存储架构的特点

相关文章

赞助商

阅读排行