大数据的计算模式

时间：2024-10-23 13:19:52浏览次数：8

大数据的计算模式可以分为批量计算（batch computing）和流式计算（stream computing）
两种形态。批量计算首先进行数据的存储，然后对存储的静态数据进行集中计算。Hadoop 是典型的大数据批量计算架构，由HDFS 分布式文件系统负责静态数据的存储，并通过MapReduce 将计算逻辑分配到各数据节点进行数据计算和价值发现。

在流式计算中，无法确定数据的到来时刻和到来顺序，也无法将全部数据存储起来。因此，不再进行流式数据的存储，而是当流动的数据到来后，在内存中直接进行数据的实时计算。例如Twitter 的Storm、Yahoo 的S4 就是典型的流式数据计算架构，数据在任务拓扑中被计算，并输出有价值的信息。

流式计算和批量计算分别适用于不同的大数据应用场景。对于先存储后计算，实时性要求不高，同时数据的准确性、全面性更为重要的应用场景，批量计算模式更合适；对于无须先存储，可以直接进行数据计算，实时性要求很严格，但数据的精确度要求稍微宽松的应用场景，流式计算具有明显优势。流式计算中，数据往往是最近一个时间窗口内的，因此数据延迟往往较短，实时性较强，但数据的精确程度往往较低。流式计算和批量计算具有明显的优劣互补特征，在多种应用场合下可以将两者结合起来使用。通过发挥流式计算的实时性优势和批量计算的精度优势，满足多种应用场景在不同阶段的数据计算要求。
目前，关于大数据批量计算相关技术的研究相对成熟，形成了以谷歌的MapReduce 编程模型、开源的Hadoop 计算系统为代表的高效、稳定的批量计算系统，在理论上和实践中均取得了显著成果。现有的大数据流式计算系统实例有Storm 系统、Kafka 系统、Spark 系统等。

标签：实时性,存储,批量,流式,模式,计算,数据
From： https://blog.csdn.net/workflower/article/details/143162668

大数据的误区
大数据的误区大数据有不少的误区。我们先看看大数据不是什么。（1）大数据≠拥有数据很多人觉得拥有数据，特别是拥有大量的数据，就是大数据了，这肯定是不对的，数据量大不是大数据，比如气象数据很大，如果仅仅用于气象预测，只要计算能力跟上就行，还远远没有发挥它的价值。但是保险公司根据......
计算机视觉库supervision学习-day(1)-图像检测和标记
supervision库是一款由roboflow开发的计算机视觉库提供了一系列方便的工具和功能，用于可视化和处理各种计算机视觉任务。它的目标是简化深度学习模型的可视化和后处理步骤，尤其适用于对象检测、图像分割、关键点检测等任务。一、下载supervision库1.在3.8版本及以上的python，使用pi......
一文彻底搞定Redis与MySQL的数据同步
Redis和MySQL一致性问题是企业级应用中常见的挑战之一，特别是在高并发、高可用的场景下。由于Redis是内存型数据库，具备极高的读写速度，而MySQL作为持久化数据库，通常用于数据的可靠存储，如何保证两者数据的一致性需要具体业务场景的设计与优化。下面我们将结合几个典型的业务......
就是这个样的粗爆，手搓一个计算器：排卵计算器
作为程序员，没有合适的工具，就得手搓一个，PC端，移动端均可适用。废话不多说，直接上代码。HTML:<divclass="container"><divclass="calculator"><labelfor="last-period">上次月经开始日期:</label><inputid="last-period"type="d......
修改chrome用户数据的路径
1.打开chrome，地址栏输入：chrome://version，查看用户数据文件路径 2.运行CMD，删除原用户数据文件夹C:\Users\Administrator>rmdir/s "C:\Users\Administrator\AppData\Local\Google\Chrome\UserData\Default"C:\Users\Administrator\AppData\Local\Google\Chrom......
SqlServer查询数据改动历史记录
原文链接：https://blog.csdn.net/qq_40763549/article/details/122229169selecttop1000[QS].[creation_time],substring([ST].[text],([QS].[statement_start_offset]/2)+1,(......
springboot优质鸭梨的培育管理系统-计算机毕业设计源码92834
目录摘要1绪论1.1选题背景与意义1.2国内外研究现状1.3论文结构与章节安排2系统分析2.1可行性分析2.2系统流程分析2.2.1数据流程2.2.2业务流程2.3 系统功能分析2.3.1功能性分析2.3.2非功能性分析2.4 系统用例分析2.5本章小结3 系统......
2024.7:HOOPS Exchange SDK Crack-CAD 数据转换
领先的CAD导入和导出库使用HOOPSExchangeSDK进行CAD数据转换，将30多种CAD文件格式导入您的应用程序，通过单一API即可快速准确地读取和写入2D和3DCAD文件格式，包括CATIA®、SOLIDWORKS®、Inventor™、Revit™、Creo®、NX™、SolidEdge®等。快速准确的C......
springboot献血管理平台-计算机毕业设计源码94158
摘要随着社会的快速发展和医疗技术的不断进步，献血作为一种重要的公益行为，对于保障医疗用血的需求和挽救生命具有不可替代的作用。然而，传统的献血管理方式往往存在着效率低下、信息不透明、数据难以统计等问题。为了解决这些问题，提高献血管理的效率和质量，基于Java编程语言，设......
springboot二手汽车交易平台-计算机毕业设计源码82053
目录1绪论1.1研究背景1.2研究意义1.3国内外研究现状2 二手汽车交易平台系统分析2.1可行性分析2.2系统流程分析2.3 功能需求分析2.4性能需求分析3二手汽车交易平台概要设计3.1 系统体系结构设计3.2总体功设计3.3子模块设计设计3.4数据库......

大数据的计算模式

相关文章

赞助商

阅读排行