首页 > 其他分享 >Hadoop分布式系统架构

Hadoop分布式系统架构

时间:2024-10-27 19:20:09浏览次数:3  
标签:结构化 架构 要么 存储 Hadoop 分布式系统 Spark 数据

Hadoop分布式系统架构
Hadoop 已经非常火了,Greenplum 的开源跟它也是脱不了关系的。它有着高可靠性、高扩展性、高效性、高容错性的口碑。在互联网领域有着非常广泛的运用,雅虎、Facebook、百度、淘宝、京东等都在使用Hadoop。Hadoop 生态体系非常庞大,各公司基于Hadoop 所实现的也不仅限于数据平台,还包括数据分析、机器学习、数据挖掘、实时系统等。
当企业数据规模达到一定的量级时,Hadoop 应该是各大企业的首选方案。到达这样一个层次的时候,企业所要解决的不仅是性能问题,还包括时效问题、更复杂的分析挖掘功能的实现等。非常典型的实时计算体系也与Hadoop 这一生态体系有着紧密的联系,比如Spark。近些年来,Hadoop 的易用性有了很大的提升,SQL-on-Hadoop 技术大量涌现,包括Hive、Impala、Spark SQL 等。尽管其处理方式不同,但相比于原始的MapReduce 模式,无论是性能还是易用性都有所提高。因此,对MPP产品的市场产生了压力。对于企业构建数据平台来说,Hadoop 的优势与劣势非常明显:优势是它的大数据处理能
力、高可靠性、高容错性、开源性以及低成本(处理同样规模的数据,换其他方案试试就知道了);劣势是它的体系复杂,技术门槛较高(能搞定Hadoop 的公司规模一般都不小)。关于Hadoop的优缺点,对于公司的数据平台选型来说,影响已经不大了。需要使用Hadoop的时候,也没什么其他的方案可选择(要么太贵,要么不行),没达到这个数据量的时候,也没人愿意碰它。总之,不要为了大数据而大数据。Hadoop 生态圈提供海量数据的存储和计算平台,包括以下几种。

结构化数据:海量数据的查询、统计、更新等操作。
非结构化数据:图片、视频、Word、PDF、PPT 等文件的存储和查询。
半结构化数据:要么转换为结构化数据存储,要么按照非结构化存储。
Hadoop 的解决方案如下。
存储:HDFS、HBase、Hive 等。
并行计算:MapReduce 技术。
流计算:Storm、Spark。

标签:结构化,架构,要么,存储,Hadoop,分布式系统,Spark,数据
From: https://blog.csdn.net/workflower/article/details/143255520

相关文章

  • PHP架构师要具备哪些技能
    ###PHP架构师要具备哪些技能在探讨PHP架构师必须具备的技能时,我们可以直接指出三个核心要素:深入理解PHP语言核心、掌握设计模式与软件架构原理、熟练运用数据库和缓存系统。深入理解PHP语言核心不仅仅意味着对PHP语法的熟练掌握,更重要的是对PHP内部机制、性能优化以及安全机制......
  • 【英特尔IA-32架构软件开发者开发手册第3卷:系统编程指南】2001年版翻译,2-2
    文件下载与邀请翻译者学习英特尔开发手册,最好手里这个手册文件。原版是PDF文件。点击下方链接了解下载方法。讲解下载英特尔开发手册的文章翻译英特尔开发手册,会是一件耗时费力的工作。如果有愿意和我一起来做这件事的,那么,欢迎你的加入。另外,我不仅仅是打算翻译这一种手册,......
  • 【英特尔IA-32架构软件开发者开发手册第3卷:系统编程指南】2001年版翻译,2-3
    文件下载与邀请翻译者学习英特尔开发手册,最好手里这个手册文件。原版是PDF文件。点击下方链接了解下载方法。讲解下载英特尔开发手册的文章翻译英特尔开发手册,会是一件耗时费力的工作。如果有愿意和我一起来做这件事的,那么,欢迎你的加入。另外,我不仅仅是打算翻译这一种手册,......
  • 十一、软件架构风格
        软件架构风格,也叫软件体系结构风格,是描述某一特定应用领域中系统组织方式的惯用模式,一个体系结构定义一个词汇表和一组约束。体系结构反映了领域中众多系统所共有的结构和语义特性,并指导如何将各个子模块和子系统有效地组织成一个完整的系统。一、数据流体系风格......
  • 十二、信息系统架构设计理论与实践
    一、概念1、概念    信息系统架构(InformationSystemArchitecture,ISA)是一种体系结构,反映了一个政府、企业或事业单位信息系统的各个组成部分之间的关系,以及信息系统与相关业务,信息系统与相关技术之间的关系。        信息系统架构(InformationSystemArc......
  • 十五、面向服务架构设计理论与实践
             SOA(Service-OrientedArchitecture)面向服务的体系结构,将应用程序的不同功能单元(即服务),通过这些服务之间定义良好的接口和契约联系起来。一、协议介绍 1、BPEL(BusinessProcessExecutionLanguageForWebService)面向Web服务的业务流程执行语言。用户......
  • 电子电器架构 --- 瞎聊下一代软件定义汽车的新解决方案
    我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师:屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明自己,无利益不试图说服别人,是精神上的节能减排。无......
  • 计算机毕业设计-基于Java+Springboot架构的流浪动物管理系统项目开发实战(附源码+论文
    大家好!我是职场程序猿,感谢您阅读本文,欢迎一键三连哦。......
  • 计算机毕业设计-基于Java+Springboot架构的鲜牛奶订购系统项目开发实战(附源码+论文)
    大家好!我是职场程序猿,感谢您阅读本文,欢迎一键三连哦。......
  • 系统架构设计师教程 第2章 2.6 计算机语言 笔记
    2.6计算机语言★★★★☆2.6.1计算机语言的组成计算机语言(ComputerLanguage)是指用于人与计算机之间交流的一种语言,是人与计算机之间传递信息的媒介。计算机语言主要由一套指令组成,指令一般包括表达式、流程控制和集合三大部分内容。表达式又包含变量、常量、字面......