首页 > 其他分享 >大数据相关认识,大数据、物联网和云计算之间的关系,hadoop简介

大数据相关认识,大数据、物联网和云计算之间的关系,hadoop简介

时间:2023-01-17 19:36:09浏览次数:37  
标签:数据量 简介 hadoop Hadoop 计算 联网 数据 分布式


大数据相关认识

说道大数据,谷咕咕就很烦了,因为大学期间,做过爬虫,数据抓取,安装过Hadoop和hive,但是都不知道干嘛的,起码爬虫还知道,通过正则表达式将网页中的有效信息爬取下来。但是Hadoop和Hive一直是在Ubuntu上安装,不同什么意思,以至于后来看到,别人说Hadoop和Hive的时候就很尴尬,装过竟然不知道什么用。
所今天就稍微的记录一下。

大数据的特点

在网上常常听到4v,说的就是大数据的特点四个英文单词的首字母。

  • Volume(数据量大)
  • Velocity(数据速度快)
  • Variety(数据类型繁多)
  • Value(数据价值密度低)
    之前看文章时候5v的,他多了一个Veracity(真实性)

大数据的关键技术

数据采集:
利用轻量级的数据库手法客户端的数据,进行初步的查询和处理。
问题:是高并发。
工具:MySQL、Oracle
数据分析:
将数据快速导入到一个集中的分布式数据库或者,分布式存储集群,利用分布式技术存储大量数据,进行查询和分类汇总。
问题:导入数据量大,查询数据量大,查询请求多。
工具:Hadoop、hive
数据挖掘:
基于前面的数据进行数据挖掘、来满足高级别的数据分析需求。
问题:算法复杂,并涉及的数据量和计算量都大。
工具:R、Hadoop mahout

Hadoop

Hadoop是分布式批量处理系统,对大型数据集进行扫描,以产生其结果。
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
Hadoop让用户也可以不用知道分布式算法下,根据MapReduce的规则定义好的接口方法。
Hadoop将1PB的数据导入HDFS中,然后编程人员定义好map和reduce,定义好key和value,然后正则匹配成功,将结果通过reduce聚合起来返回,Hadoop就会吧这个程序分布到不同的结点并行处理。

云计算

云计算实现了分布式的计算能力,用户只要通过网络接入就可以获得所需的资源。
云计算的关键技术:
虚拟化、分布式存储、分布式计算、多租户。
云计算数据中心为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供支撑环境。

物联网

物联网是物物相连的互联网,利用互联网吧传感器、控制器、机器、人员和物联在一起。实现信息化管理。
物联网关键技术
识别和感知结束(二维码、传感器)、网络与通信技术、数据挖掘与融合技术
物联网的应用
智能交通、只会医疗、智能家居等

大数据、云计算、物联网之间的关系

云计算为大数据提供技术基础。
云计算为物联网提供海量数据存储能力。
物联网是大数据重要来源。
大数据为物联网数据分析提供支撑。


标签:数据量,简介,hadoop,Hadoop,计算,联网,数据,分布式
From: https://blog.51cto.com/u_15601494/6017783

相关文章

  • jdbc连接mysql简单实例,在java项目中添加数据库驱动包
    傻瓜式教学从创建项目,到数据库建立,访问一步到位打开eclipse,newjavaProject创建一个普通的java项目右击刚才新建的项目,选择BuildPath—>ConfigureBuilePath选择addExte......
  • 谈谈对数据库中索引的理解
    索引的作用:因为数据的记录很多,为了方便查找,提高查询的效率。索引是对数据库表中一个或多个列的值进行排序的数据结构,以协助快速查询、更新数据库表中数据。索引的原理:把要......
  • 数据库系统
    数据库系统:数据库应用软件数据库管理系统操作系统计算机硬件数据库系统的三个阶段:人工管理阶段文件系统阶段-数据库系统阶段数据库系统的三级模式概念模式组成的数据库叫......
  • 数据库笔试、面试常见问题
    数据库笔试、面试常见问题1.常见的关系型数据库和非关系型数据库?关系型数据库(需要表结构):sqllite、db2、oracle、access、SQLserver、MySQL非关系型数据库(key-value结构......
  • Data too long for column 'id' at row 1,代码正确,数据库无法插入。
    1.可能是数据库里的表谁知的字符集不相同。解决:altertable​​​cms_activity_test​​​converttocharactersetgbkcollategbk_chinese_ci;(单独修改指定表的字......
  • java 基本数据类型 各占多少字节 有效位数
    逻辑类型:boolean整数类型:byte、short、int、long字符类型:char浮点类型:float、doubleint类型4个字节,一个字节8个bit(比特),取值范围:-2^31~(2^31)-1byte类型1个字节取值范围:-2......
  • java,导出excel,控制数据垂直还是水平遍历,使用easyExcel
    java,导出excel,控制数据垂直还是水平遍历​​java导出excel,使用easyExcel,按指定格式导出,按模板导出,自定义表头导出​​这里的前提是,你用的easyExcel,就算你没有用,也可以试试......
  • JVM:运行时数据区-PC寄存器(程序计数器)
    JVM:运行时数据区1.什么是pc寄存器:JVM的pc寄存器也叫程序计数器,是对物理pc寄存器的一种抽象虚拟。用来存储指向一下条指令的地址,即将要执行的指令代码,由执行引擎读取下一......
  • JVM :运行时数据区-虚拟机栈
    2.2虚拟机栈2.1.1概述优点:跨平台,指令集小,编译器容易实现缺点:性能下降实现同样的工能需要更多的指令集栈是运行时的单位,而堆是存储的单元是什么?每个线程在创建是辉创建一个虚......
  • 提供源码:java获取节假日、工作日,存入数据库,查找指定日期前一天,后一天。
    提供源码:java获取节假日、工作日,存入数据库,查找指定日期前一天,后一天。码云地址:​​​https://gitee.com/guyuanman/holiday​​业务场景:好多公司的业务在处理的时候,会面......