首页 > 其他分享 >灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置

灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置

时间:2023-11-14 10:34:16浏览次数:31  
标签:优先级 EasyMR 管理 队列 应用程序 可视化 Yarn 资源

YARN(Yet Another Resource Negotiator)是 Hadoop 生态系统中的资源调度器,主要用于资源管理和作业调度。YARN 自身具备队列管理功能,通过对 YARN 资源队列进行配置和管理,实现集群资源的分配,以满足不同应用和用户的需求。YARN 的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

在大数据环境下,企业通常会有多个应用程序同时运行,这些应用程序可能具有不同的资源需求和优先级。为了合理分配和管理资源,避免资源争夺和冲突,需要对资源进行划分和调度。

本文将为大家介绍各类资源划分和队列管理方式,以及 EasyMR 新上线的 YARN 的队列管理功能,如何通过可视化界面管理,给广大用户带来更高效和便捷的队列管理体验。

资源划分方式

在大数据领域中,常见的资源划分方式通常有以下几种:

按照应用程序的类型或特性进行分类

例如,可以将 CPU 密集型的应用程序放置在一个队列中,将内存密集型的应用程序放置在另一个队列中。通过这种方式,可以确保不同类型的应用程序获得各自所需的资源,并避免资源浪费和不均衡的情况发生。

按照应用程序的优先级进行分类

对于一些重要的任务或紧急任务,可以为它们分配更高的资源配额和优先级,以保证它们能够得到及时响应和优先处理。而对于一些次要的任务或低优先级的任务,可以为它们分配较低的资源配额,以确保其他重要任务的执行效率和优先级。

按照部门或团队的需求进行分类

不同部门可能对资源有不同的需求,通过为不同部门分配独立的资源队列,可以确保每个部门能够独立管理和分配自己的资源,不会相互干扰或影响。

虽然 YARN 自身具备队列管理功能,但在实际使用中,YARN 只能通过配置文件进行资源队列的管理,这种方式相对繁琐且需要一定的技术知识。

灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置_可视化

CDH & HDP

业界首选的基础开源数据平台要数基于 Hadoop 分布式技术的 CDH 和 HDP。

CDH(Cloudear Manager)

● Fair Share 策略

CDH 的 Cloudear Manager 采用 Fair Share 策略,每个用户或组织的权重和优先级需要事先确定,需要管理者对系统的使用情况有较好的了解。如果这些设置不合理,可能会导致某些用户或组织长期不能获得足够的资源来执行任务。

● 调度效率影响

当有多个任务或作业同时提交时, Fair Share 的算法需要进行复杂的计算,导致调度效率下降。

HDP(Ambari)

● 管理复杂性

Ambari 采用可视化拖拽进行资源调整,操作简单。但是由于 Yarn 资源队列必须保证同一级队列资源之和等于100%,因此单一队列资源调整,必须调整其他队列资源保证队列资源之和等于100%,管理复杂度比较高。

● 资源配平

为保证同级队列资源之和等于100%,创建或者删除队列时,需要调整其他队列资源保证队列资源。

EasyMR 的 Yarn 资源队列管理功能

基于上述优缺点,为了改善队列管理体验,提供一个更直观、更详细的信息展示和简易明了的操作界面进行队列资源管理,EasyMR 上线了 Yarn 的队列管理功能进行可视化界面管理,提高其灵活性、可用性和可扩展性。

灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置_hadoop_02

EasyMR 的 Yarn 资源队列管理特点

● 容量策略

基于最大、最小资源容量策略,限制队列的资源使用,用户或部门可以根据自己业务需求创建属于自己的专属资源队列

● 队列独立

当调整队列资源大小或者创建删除队列时,无需调整其他队列资源大小,仅需保证同一父队列下所有子队列资源小于等于100%即可。

● 用户对接

支持对接 LDAP、OAuth 用户体系,通过对 Yarn 资源队列-叶子队列绑定用户、用户组,实现了基于用户和用户组的访问控制和资源分配,保障资源安全。

叶子队列:是指不能再分配子队列的队列,它可以直接用来分配资源给应用程序,在叶子队列中,可以直接运行应用程序或者将它们放置在默认分配队列中进行调度。

非叶子队列:可以再分配子队列,以进一步划分资源并进行资源管理,不支持应用程序和任务的提交。例如,可以将 CPU 密集型应用程序和内存密集型应用程序分别放置在不同的子队列中,并为它们分配不同的资源配额和优先级。

父队列:通常是一个非叶子队列,它包含多个子队列,并控制着这些子队列的资源分配和优先级等属性。例如,一个父队列可以包含多个子队列“memory”、“cpu”等,通过为不同的子队列设置不同的资源配额和优先级,可以更好地管理集群中的资源。

子队列:是父队列的一部分,它们继承了父队列的所有属性,并具有自己的资源配额和优先级等属性。在子队列中可以运行应用程序不支持再次划分子队列。

EasyMR 如何创建 Yarn 资源队列,在之前的文章《大数据计算引擎 EasyMR 如何简单高效管理 Yarn 资源队列》中进行了详细的介绍,请点击阅读。

未来,EasyMR 会持续优化 Yarn 资源队列管理,完善资源队列的安全审计与队列监控,通过将资源队列与需求背景进行对应,制定更优资源分配策略,以更好地满足企业在大数据环境下的资源管理和调度需求。


标签:优先级,EasyMR,管理,队列,应用程序,可视化,Yarn,资源
From: https://blog.51cto.com/u_15137832/8362734

相关文章

  • 数据可视化在IT运维中的应用
      数据可视化,这一将抽象复杂的数据转化为直观图形的技术,已逐渐成为现代IT运维的核心工具。在复杂的网络环境和庞大的数据洪流中,如何通过数据可视化技术为运维人员呈现清晰、直观的运行状态和性能指标,成为提升运维效率和准确性的关键所在。数据可视化的价值1.快速洞察问题:通过......
  • 编程最佳外挂:批量数据分析与可视化,CodeGeeX工具箱一键完成
    ChatGLM3代模型的CodeInterpreter能力,本周已经在VSCode里的CodeGeeX插件产品中,以开发者工具箱的产品形态上线。下图以VSCode插件为例:在CodeGeeX的侧边栏,和智能问答AskCodeGeeX并列出现的工具箱标签,用户登录后就可以直接打开使用。CodeInterpreter曾被称为ChatGPT最强外挂。现......
  • 基于Grafana+Flowcharting的基础设施监控可视化实践
    一概述基础设施监控对于确保系统的稳定性和性能至关重要。而要有效地监控和管理基础设施,可视化是一种强大的工具。本文将介绍如何使用Grafana和Flowcharting来实现基础设施监控的可视化,包括监控指标的收集、数据展示和报警通知等方面。通过合理的设计和配置,我们可以快速建立起一个......
  • 远程运维:数字孪生智慧海上风电场三维可视化运维平台
    前言风能是一种可持续的清洁能源,有可能帮助满足世界不断增长的能源需求,是世界上增长最快的可再生能源之一。风能对于实现“双碳”目标以及低碳能源体系转型至关重要。风电产业是我国的新兴产业之一,在政策和市场需求双重驱动下,全国风电产业实现了快速发展,已经成为我国新能源体系中......
  • 【数据可视化】matplotlib画图设置
    1.全局更改图表外观plt.style.use("ggplot") 2.全局更改图片内的字体/可每次画图都重新定义一下个性化plt.rc('font',family='TimesNewRoman',size=20) 3.画竖直排列的柱状图defvisualization(namelist,numlist,topath):fig,ax=plt.subplots(figsize=(30,......
  • TSINGSEE智慧冶金工厂可视化AI视频智能监管方案,助力安全生产
    一、背景与需求有色金属冶炼工艺复杂,推进互联网、大数据、人工智能、5G、边缘计算、虚拟现实等前沿技术在有色冶炼工厂的应用,建成全流程综合集成信息管控平台、实现全要素数据可视化在线监控,已经成为当前冶金企业升级转型的主要建设目标。《有色金属行业智能工厂(矿山)建设指南》指出......
  • TSINGSEE智慧冶金工厂可视化AI视频智能监管方案,助力安全生产
    一、背景与需求有色金属冶炼工艺复杂,推进互联网、大数据、人工智能、5G、边缘计算、虚拟现实等前沿技术在有色冶炼工厂的应用,建成全流程综合集成信息管控平台、实现全要素数据可视化在线监控,已经成为当前冶金企业升级转型的主要建设目标。《有色金属行业智能工厂(矿山)建设指南》......
  • Scala中编写多线程爬虫程序并做可视化处理
    在Scala中编写一个爬虫程序来爬取店铺商品并进行可视化处理,需要使用Selenium和Jsoup库来操作网页。在这个例子中,我们将使用多线程来提高爬取速度。1、首先,我们需要引入所需的库:importorg.openqa.selenium.Byimportorg.openqa.selenium.WebDriverimportorg.openqa.selenium.Web......
  • 【可视化】基于Matlab实现图表视化相关矩阵,相关值显示为左下角的热图,使用颜色渐变来指
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 空间数据可视化之Entity
    Cesium在空间数据可视化方面提供了两种类型的API,一种是面向图形开发人员的低级(原始)API,通过Primitive类实现,对于那些对计算机图形学知识很了解的同学可以采用PrimitiveAPI;另一种是用于数据驱动的高级(实体)API,通过Entity类实现,相对于PrimitiveAPI,EntityAPI实现起来更简单一些,特别......