首页 > 其他分享 >什么是Lambda架构?

什么是Lambda架构?

时间:2023-10-17 11:58:10浏览次数:33  
标签:架构 批处理 什么 视图 速度 数据 Lambda

一、简介

Lambda架构(Lambda Architecture)是由Twitter工程师南森·马茨(Nathan Marz)提出的大数据处理架构。

这一架构的提出基于马茨在BackType和Twitter上的分布式数据处理系统的经验。

Lambda架构使开发人员能够构建大规模分布式数据处理系统。它具有很好的灵活性和可扩展性,也对硬件故障和人为失误有很好的容错性。

Lambda 架构总共由三层系统组成:批处理层(Batch Layer),速度处理层(Speed Layer),以及用于响应查询的服务层(Serving Layer)。

 

1.  Lambda架构定义了一套面向大数据应用的模式和准则。更重要的是,它允许同时查询历史数据和实时新增的数据,并且获得期望的分析视图。

2. 处理历史数据(批处理)和实时数据。

3. 技术无关和通用性。Lambda架构是一种通用的模式,完全不依赖于任何技术,而且任何技术只要能满足需求,都可以在 Lambda架构中应用。

4. Lambda架构清楚地把责任划分到不同的功能模块/层中。它按照层来划分职责,完美地遵循了设计模式中的关注点分离原则。

5. 与领域无关。作为一种通用的模式, Lambda架构可以应用于不同的业务领域。

 

二、Lambda的命名由来

我们通常认为这个希腊字母与这一模式相关联是因为数据来自两个地方。

批量数据和快速的流式数据代表Lambda符号的弯曲部分,然后通过服务层(线段与曲线部分合并)合并,如图所示。

 

三、详细介绍

在 Lambda 架构中,每层都有自己所肩负的任务。 1、批处理层 存储管理主数据集(不可变的数据集)和预先批处理计算好的视图。 批处理层使用可处理大量数据的分布式处理系统预先计算结果。 它通过处理所有的已有历史数据来实现数据的准确性。 这意味着它是基于完整的数据集来重新计算的,能够修复任何错误,然后更新现有的数据视图。 输出通常存储在只读数据库中,更新则完全取代现有的预先计算好的视图。   2、速度处理层 会实时处理新来的大数据。 速度层通过提供最新数据的实时视图来最小化延迟。 速度层所生成的数据视图可能不如批处理层最终生成的视图那样准确或完整,但它们几乎在收到数据后立即可用。 而当同样的数据在批处理层处理完成后,在速度层的数据就可以被替代掉了。 本质上,速度层弥补了批处理层所导致的数据视图滞后。 比如说,批处理层的每个任务都需要 1 个小时才能完成,而在这 1 个小时里,我们是无法获取批处理层中最新任务给出的数据视图的。 而速度层因为能够实时处理数据给出结果,就弥补了这 1 个小时的滞后。   3、服务层 所有在批处理层和速度层处理完的结果都输出存储在服务层中,服务层通过返回预先计算的数据视图或从速度层处理构建好数据视图来响应查询。     原文链接:https://cloud.tencent.com/developer/article/2103250

标签:架构,批处理,什么,视图,速度,数据,Lambda
From: https://www.cnblogs.com/robots2/p/17769341.html

相关文章

  • 神经网络入门篇:神经网络到底是什么东西
    神经网络到底是什么东西我们常常用深度学习这个术语来指训练神经网络的过程。有时它指的是特别大规模的神经网络训练。那么神经网络究竟是什么呢?举例说明-通俗易懂第一个例子从一个房价预测的例子开始讲起。假设你有一个数据集,它包含了六栋房子的信息。所以,你知道房屋的面......
  • 黑客可以厉害到什么程度?
    前言知乎上有一个提问:黑客可以厉害到什么程度?                  ↓↓↓今天,我们就这个话题,一起来做个讨论。对于大多数人来说,黑客给我们的印象一般都来自电影、媒体等信息。那种动不动入侵美国中央情报服务器;动不动在某些国家的政府网站......
  • 架构设计如何绘图?
    很多同学技术能力很强,架构设计也做得很好,但是在给别人讲解的时候,总感觉像是“茶壶里煮饺子,有货倒不出”。其实,在为新员工培训系统架构、给领导汇报技术规划、上技术大会做演讲或者向晋升评委介绍工作贡献的时候,如果你能画出一张优秀的 软件系统架构图,就可以大大提升自己的讲解......
  • 工作中学到了什么
    工作中学到了什么进入公司之前看比亚迪的公司文化视频,产业有哪些,企业文化是什么。其实也没了解什么。初步的印象就是好像什么都有,一个完整的工业园。但是实际去了就发现,一个超市离宿舍非常远,食堂也不怎么样。宿舍在1期,上班的地点却在2期。从这点可以看出,了解一个公司一定要从......
  • 一文带你了解自动化测试是什么?
    本章主要讲解自动化测试的含义、分类、项目使用,以及自动化测试工具的优势。一、自动化测试概述1、什么是自动化测试?自动化测试是软件测试活动中的一个重要分支和组成部分。随着软件产业的不断发展,市场对软件周期的要求越来越高,于是催生了各种开发模式,如大家熟知的敏捷开发,从而......
  • 虚拟机是什么
    简单地说,虚拟机(VirtualMachine)就是允许我们在当前操作系统中运行其他操作系统的软件,本质上和VS、QQ这些应用程序一样。所以,只要我们在电脑(PC或笔记本等)上安装好虚拟机软件,就可以模拟出来若干台相互独立的虚拟PC设备,每一个都如何一台真实的计算机。在此基础上,我们可以给每台虚......
  • 关于10月下做什么?
    考研这条路上,我觉得还是要多总结和反思的,应该坚持每半个月写一次半月报,距离考研,也不过就是写27次罢了这个月:这个月生活开始步入正轨,生活越来越正常,继续坚持。考研是需要全面发展的,不要偏科,这很重要,英语单词必须一直坚持,语言学习词汇量不够没有一点办法。所以每天得花三个小......
  • 什么是实时操作系统(RTOS)
    实时操作系统是保证在一定时间限制内完成特定功能的操作系统(执行时间的确定性是实时操作系统最根本的,其代价往往就是吞吐量低)。实时操作系统有硬实时和软实时之分,硬实时要求在规定的时间内必须完成操作,这是在操作系统设计时保证的;软实时则只要按照任务的优先级,尽可能快地完成操作......
  • 动态IP代理有什么作用?
    随着互联网的普及和发展,越来越多的人开始意识到网络安全和隐私保护的重要性。其中,动态IP代理成为了一种常见的解决方案,被广泛应用于各种场景中。本文将详细介绍动态IP代理的作用。首先,我们需要了解什么是动态IP代理。简单来说,动态IP代理是一种通过代理服务器实现的网络协议转换技术......
  • 日均数十亿访问,个推API网关如何架构?
    文章很长,且持续更新,建议收藏起来,慢慢读!疯狂创客圈总目录博客园版为您奉上珍贵的学习资源:免费赠送:《尼恩Java面试宝典》持续更新+史上最全+面试必备2000页+面试必备+大厂必备+涨薪必备免费赠送:《尼恩技术圣经+高并发系列PDF》,帮你实现技术自由,完成职业升级,薪......