首页 > 其他分享 >大数据的演进历史

大数据的演进历史

时间:2024-12-17 14:01:03浏览次数:7  
标签:历史 Google 20 演进 技术 70 90 数据

早期探索阶段(19世纪末至20世纪70年代)

  • 数据处理自动化的开端:1887年至1890年间,美国统计学家赫尔曼·霍尔瑞斯为统计1890年的人口普查数据发明了一台电动读取设备,极大地提升了数据处理效率。
  • 数据存储技术的初步发展:20世纪50年代至70年代,磁带和磁盘等数据存储介质相继出现。磁带容量大、成本低,但读写速度慢、不便于随机访问;磁盘读写速度快、可靠性高、便于随机访问,但容量小、成本高。

数据分析起步阶段(20世纪70年代至90年代)

  • 数据仓库出现:20世纪70年代至90年代,数据仓库作为一种用于支持决策的数据集成和分析系统出现。它利用多维模型存储和操作数据,能够提供历史和全面的数据视图,支持复杂和多维的数据分析。
  • 数据挖掘与可视化技术萌芽:数据挖掘技术开始萌芽,它利用统计、机器学习、人工智能等方法从大量数据中发现有用信息和知识。同时,数据可视化技术也开始发展,将数据转换为图形或图像进行展示和交互。

大数据概念形成阶段(20世纪90年代至21世纪初)

  • 互联网推动数据增长:20世纪90年代,互联网的普及使得数据量开始呈爆炸式增长,信息交流日益频繁,数据来源更加广泛,包括网站点击流、电子邮件、在线交易等。
  • 大数据概念提出:1980年,未来学家阿尔文·托夫勒在《第三次浪潮》中首次提出“大数据”概念。2001年,Gartner的道格·莱尼提出了描述大数据的“3V”模型,即数据量(Volume)、速度(Velocity)和多样性(Variety)。

技术快速发展阶段(2003年至2012年)

  • Google技术引领:2003年,Google引入了Google File System(GFS),解决了传统文件系统处理大规模数据的瓶颈问题。2004年,Google推出了MapReduce,有效支持了大数据集的并行处理。
  • 开源框架兴起:2005年,Hadoop诞生,它是基于GFS和MapReduce的开源软件框架,用于分布式处理大数据。2008年,Yahoo!推出了高级数据流语言Pig Latin,同年Facebook推出了Hive数据仓库系统。

成熟与应用拓展阶段(2012年至今)

  • 技术不断完善:2012年,Apache发布了Hadoop 2.0,引入了YARN作为新一代资源管理框架。同年,Apache Spark被引入,其核心特点是数据能在内存中处理,大大提高了处理速度。
  • 应用领域拓展:大数据技术在金融、医疗、教育、交通等众多领域得到广泛应用,如金融领域的风险评估和欺诈检测、医疗领域的疾病预测和药物研发、交通领域的智能交通规划和拥堵预测等。
  • 与新兴技术融合:随着人工智能、机器学习、深度学习等技术的发展,大数据与这些技术不断融合,如利用深度学习算法对大数据进行深度挖掘和分析,实现更精准的预测和决策。

标签:历史,Google,20,演进,技术,70,90,数据
From: https://www.cnblogs.com/java-note/p/18612238

相关文章

  • YOLO 数据增强 Python 脚本(可选次数,无限随机增强)- 一键执行搞定,自动化提升训练集质量
    前言往往在准备需要训练一个模型的时候,很多人苦于找不到合适的数据集,自己标注又耗时耗力,而数据增强正好解决了这个问题,因此对于数据增强这个概念是非常有必要的,本文将提供一个数据增强脚本,你无需理解代码,只需懂得如何使用即可达到你要的效果。背景近期我在一直寻找冲沟相关......
  • 推荐几个不错的数据库设计工具
    推荐几个不错的数据库设计工具 思维导航前言PowerDesignerdrawDBPDManer程序员常用的工具软件前言在当今信息化高速发展的时代,数据库设计成为了软件开发过程中不可或缺的一环。一个优秀的数据库设计工具,不仅能够提高开发效率,还能确保数据库结构的合理性。今天大......
  • 防数据泄露
    数据分类分级数据分类:对企业或组织内的数据进行梳理,根据数据的类型,如客户数据、财务数据、技术文档、业务流程数据等进行分类。以金融机构为例,客户数据可细分为个人身份信息、账户交易信息、信用记录等。通过这种分类,可以明确不同类型数据的重要性和敏感性。依据数据的来源......
  • 震惊!Doris和Hive竟然能这样玩?数据分析的松弛感拉满
    震惊!Doris和Hive竟然能这样玩?数据分析的松弛感拉满Doris与Hive的完美邂逅Doris-HiveCatalog核心特性多样化的存储支持智能的元数据管理企业级安全特性凌晨三点,办公室里只剩下屏幕的幽光。数据工程师小明正在和两个"大家伙"较劲——Doris和Hive。“导出、清洗、......
  • 要在 C# 6.0 中连接 PostgreSQL 数据库
    要在C#6.0中连接PostgreSQL数据库,你可以使用Npgsql库。Npgsql是一个开源的.NET数据提供程序,专门用于与PostgreSQL数据库进行交互。以下是详细步骤和示例代码,帮助你在C#6.0项目中连接和操作PostgreSQL数据库。步骤1:安装Npgsql包首先,你需要在你的C#项......
  • SQL Server的数据库备份与还原
    数据库备份分类备份分类完全备份:(常用方式)备份整个数据库,包含用户表、系统表、索引、视图和存储过程等所有数据库对象。因而,占用不少时间和空间,这种方式不建议太频繁,一般一周一次。差异备份:也叫增量备份。它不使用事务日志,相反,它使用整个数据库的一种新映象。它比最初......
  • 支持数据撤销的模型成员推理攻击工具箱
    支持数据撤销的模型成员推理攻击工具箱本项目是一个支持数据撤销的成员推理攻击工具,支持mnist、cifar10、cifar100、cinic10等多种数据集,可实现针对LeNet、RNN、ResNet、RL等多种模型的成员推理攻击,并给用户一个详细的使用文档。环境Python3.9PyTorch>=1.10.0项目地址......
  • 火狐浏览器Firefox历史版本官方下载地址
    <divid="cnblogs_post_body"class="blogpost-bodyblogpost-body-html"><p>火狐浏览器Firefox历史版本官方下载地址:</p><p><ahref="https://ftp.mozilla.org/pub/firefox/releases/"rel="noopenernofollow">htt......
  • 力矩传感器数据通信——ROS话题通讯的方式
    目录1.创建工作空间2.设置tasks.json文件3.创建功能包4.修改c_cpp_properties.json文件5.修改内部的CMakeLists.txt文件6.创建.launch.h .c .cpp文件 6.1创建launch文件6.2创建.h源文件6.3.创建src源文件7.Ctrl+Shift+B编译项目8.连接力矩传感器9.启......
  • 【数据处理】re 正则表达式
    【re.compile】 是Python中 re(正则表达式)模块的一个函数,它用于将一个字符串形式的正则表达式编译成一个Pattern对象。这样做的好处是可以提高正则表达式的匹配效率,尤其是当你需要多次使用同一个正则表达式时。当你调用 re.compile 时,你传递一个字符串作为参数,这个字符串......