首页 > 其他分享 >Hadoop初识

Hadoop初识

时间:2022-12-14 15:47:16浏览次数:36  
标签:工程师 处理 离线 Hadoop 初识 开发 数据

什么是大数据

大数据(BIGDATA),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程 优化能力的海量、高增长率和多样化的信息资产。

单位换算

  • 1Byte = 8bit
  • 1K=1024KByte
  • 1MB = 1024K
  • 1G = 1024MB
  • 1T =1024G
  • 1PB = 1024TB

大数据的特征

  • 容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息;
  • 种类(Variety):数据类型的多样性;
  • 速度(Velocity):指获得数据的速度;
  • 可变性(Variability):妨碍了处理和有效地管理数据的过程。
  • 真实性(Veracity):数据的质量
  • 复杂性(Complexity):数据量巨大,来源多渠道
  • 价值(value):合理运用大数据,以低成本创造高价值

学习路线

  • JAVA 面向对象编程语言
  • Linux 类Unix操作系统
  • Hadoop生态圈
    • HDFS 解决存储问题
    • MapReduce 解决计算问题
    • Yarn 资源协调者
    • Zookeeper 分布式应用程序协调服务
    • Flume 日志收集系统
    • Hive 基于Hadoop的数仓工具
    • HBase 分布式、面向列的开源数据库
    • Sqoop 数据传递工具
  • Scala 多范式编程语言、面向对象和函数式编程的特性
  • Spark 目前企业常用的批处理离线/实时计算引擎
  • Flink 目前最火的流处理框架、既支持流处理、也支持批处理
  • Elasticsearch 大数据分布式弹性搜索引擎
  • 离线/实时项目

专业技能

就业大数据岗位

  • 大数据开发工程师
  • 大数据清洗开发工程师
  • 大数据仓库开发工程师
  • 大数据运维开发工程师
  • 大数据平台开发工程师

 

标签:工程师,处理,离线,Hadoop,初识,开发,数据
From: https://www.cnblogs.com/xfeiyun/p/16982337.html

相关文章

  • 《Redis DevOps》一:初识Redis
    初识Redis简介Redis(REmoteDictionaryServer)是一种基于键值对的NoSQL数据库,主要有string/hash/list/set/zset5种基本数据结构,字符串演变出bitmaps位图和HyperLogLog,3.2......
  • 初识 docker
    docker基本命令使用显示所有正在运行的容器,一个容器只管理一个服务,即使容器挂掉也不会影响其他容器的服务,做到业务之间不影响。dockerps停止一个容器。dockers......
  • 1.初识FreeRTOS
    1.1为何学习RTOS裸机不满足项目需要 为以后深入学习做准备RTOS(RealTimeROperationSystem实时操作系统)常用的RTOS有国外的FreeRTOS、uC/0S、RTX和国内的RT-Thre......
  • ElasticSearch-8.0初识
    Elastic版本更迭历史发布日期版本号时间间隔2010-05-14V0.72014-02-14V1.01372天2015-10-28V2.0621天2016-10-26V5.0364天2017-11-14......
  • day3-2022.12.12-flex布局初识
    一、完成以下布局。二、代码如下:<template><div><divclass="title">MYFirstFlexLearn</div><divclass="box"><divclass="item">......
  • 初识c语言(补)
    第一次学习c语言,并且打出了自己第一个代码#include<stdio.h>intmain(){printf("你好世界");return0;}......
  • 初识小程序
    小程序如何创建小程序项目微信开发者工具的使用、appID的获取小程序项目的基本组成结构app.js、app.json、app.wxss、pages文件夹小程序页面由几部分组成w......
  • 初识超分重建——如何让女神更清晰,我的白月光【ICCV, 2021 超分重建之 BSRGAN】
    ❤️【深度学习入门项目】❤️之【超分重建】❤️原创:墨理学AI❤️声明:这是一个【大话超分重建】的博文,非专业技术文章,请大佬轻踩❤️【带你了解】❤️????俘获芳心小技巧===......
  • 初识C语言(4)
    指针初步应用intmain(){inta=10;//向内存申请了4个字节空间,a是变量,类型是int&a;printf("%p\n",&a);//地址是存在的int*p=&a;//p是指针变量,类型是(*),int*也说......
  • Hadoop如何保证自己的江湖地位?Yarn功不可没
    前言任何计算任务的运行都离不开计算资源,比如CPU、内存等,那么如何对于计算资源的管理调度就成为了一个重点。大数据领域中的Hadoop之所以一家独大,深受市场的欢迎,和他们设......