首页 > 其他分享 >大数据存储架构的特点

大数据存储架构的特点

时间:2022-11-25 19:00:43浏览次数:50  
标签:HDFS 存储 架构 数据仓库 结构化 特点 数据


大数据平台用于处理低价值海量结构化数据、半结构化与结构化数据;其与数据仓库协同,支撑数据应用系统,弥补数据仓库的不足。从控制架构复杂度的角度考虑,应用系统应选择其主要数据源作为数据整合者,不同时与两者直接交互数据。

传统数据仓库架构制约了数据存储能力和计算能力,为了应对这些问题,基于 Hadoop 的分布式数据仓库已经成为数据存储中广泛采用的事实标准。但 Hadoop 在 SQL 兼容性和复杂逻辑即时查询的情况下还不能完全替代传统数据仓库,所以一般在传统数据仓库的场景下,使用前期共存后期逐步替代关系,即传统应用继续基于传统数据仓库技术,大数据相关的新应用采用大数据平台(大数据应用指需要做混合数据处理和传统数据仓库在规模、成本、效率方面都无法满足的应用)。数据仓库承载及时性、准确性要求高的核心事务型关键应用,大数据应用开发平台承载数据仓库痛点业务迁移和大数据创新业务,这两者都会通过这种混搭架构实现。

在企业业务方面,企业中存在各种各样的数据类型,例如结构化、半结构化和非结构化数据,针对不同的数据类型,大数据平台有针对性地采用了不同的存储组件,存储层架构示例如图1所示。

大数据存储架构的特点_结构化

图1存储层架构

架构中对于不同的数据类型规划了四种存储进行分别存储。其中最底层的存储组件为HDFS(Hadoop分布式文件系统),Hive、HBase和Solr为上层存储组件,其存储的数据最终也保存在HDFS中。分布式存储(HDFS)作为基本的存储组件,HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合在大规模数据集上应用。

标签:HDFS,存储,架构,数据仓库,结构化,特点,数据
From: https://blog.51cto.com/u_15735635/5887429

相关文章

  • 大数据架构设计的核心要素
    建设一个高价值的大数据平台,让平台有更好的扩展性和开放性,使企业级应用系统共享大数据平台的能力,来帮助企业整个IT平台拥有一个质的飞跃。结合大数据平台设计和实施的项目......
  • iOS 系统架构及常用框架
    1.iOS基于UNIX系统,因此从系统的稳定性上来说它要比其他操作系统的产品好很多2.iOS的系统架构分为四层,由上到下一次为:可触摸层(CocoaTouchlayer)、媒体层(Medialayer)、核心......
  • 简述五种开源NAS存储服务器--转
    存储对于公司来说是必不可少的:数据必须被存储、检索、共享和保护。下面小编为大家介绍一下5款开源的NAS存储服务器一、云计算云计算正在蓬勃发展,比任何云存储系统都要快......
  • 03-3-淘宝每秒100W请求的秒杀架构体系(1)
                                           ......
  • 从软件搬砖师到软件架构师,程序员的成长之路
    "IT有得聊”是机械工业出版社旗下IT专业资讯和服务平台,致力于帮助读者在广义的IT领域里,掌握更专业、实用的知识与技能,快速提升职场竞争力。 对工作多年的程序员而言,职业发......
  • 直播预告丨中高频多因子库存储的最佳实践
    因子挖掘是量化交易的基础。随着历史交易数据日益增多,交易市场量化竞赛的不断升级和进化,量化投研团队开始面对数据频率高、因子数量多的场景,以10分钟线10000个因子5000个股......
  • ThinkSystem DS系列存储FC端口连接Windows主机基本配置
    知识点分析:本文以ThinkSystemDS4200存储通过FC端口连接到WindowsServer2016操作系统主机为例,介绍ThinkSystemDS系列存储首次部署的基本配置操作,包括: 登陆DS存储......
  • ThinkSystem DS系列存储iSCSI端口连接Windows主机基本配置
    知识点分析:本文以ThinkSystemDS4200存储通过iSCSI端口连接到WindowsServer2016操作系统主机为例,介绍ThinkSystemDS系列存储首次部署的基本配置操作,包括: 登陆DS存储......
  • 【iOS-Cocos2d游戏开发之十九】游戏数据存储的四种常用方式NSKeyedArchiver/NSUserDef
    ​​ 李华明Himi ​​​原创,转载务必在明显处注明      OK,今天Himi介绍游戏存储这一块,在Android游戏开发中Himi介绍了好几种保存的方式和形式,那么在iOS中也有......
  • 分布式架构演进与图解
    分布式系统(distributedsystem) 是建立在网络之上的软件系统。 内聚性:是指每一个数据库分布节点高度自治,有本地的数据库管理系统。透明性:是指每一个数据库分布节点对用户的......