首页 > 其他分享 >使用 AWS CLI 管理 EMR

使用 AWS CLI 管理 EMR

时间:2025-01-18 19:10:44浏览次数:1  
标签:CLI -- AWS EMR aws 集群 emr clusters

Amazon EMR (Elastic MapReduce) 是一种托管的大数据处理服务,使用户能够在云上便捷、快速地运行和管理大规模数据分析和处理任务。

创建 EMR 集群

  1. 创建默认 IAM 角色:

    aws emr create-default-roles
    
  2. 查询 EMR 版本:

    aws emr list-release-labels
    
  3. 创建 EMR 集群:

    aws emr create-cluster \
        --name "MyEMRCluster" \
        --release-label 'emr-7.3.0' \
        --applications 'Name=Hadoop' \
        --ec2-attributes KeyName='my-ssh-key' \
        --instance-type 'm5.xlarge' \
        --instance-count 3 \
        --use-default-roles
    

    查询集群状态,等 Status 变为 WAITING 了之后进行下一步:

    aws emr list-clusters
    

提交 MapReduce 作业

  1. 查询集群 ID:

    CLUSTER_ID=$(aws emr list-clusters --query 'Clusters[0].Id' --output text)
    
  2. 提交 MapReduce 作业:

    aws emr add-steps \
        --cluster-id $CLUSTER_ID \
        --steps 'Type=CUSTOM_JAR,Name=WordCount,ActionOnFailure=CONTINUE,Jar=s3://your-bucket-name/your-jar-file.jar,Args=[arg1,arg2,...]'
    

删除 EMR 集群

  1. 删除集群:
aws emr terminate-clusters --cluster-ids $CLUSTER_ID
  1. 检查集群:
aws emr list-clusters

标签:CLI,--,AWS,EMR,aws,集群,emr,clusters
From: https://www.cnblogs.com/Undefined443/p/18678726

相关文章

  • ClickHouse大数据准实时更新
    目录一、问题背景二、解决方案三、准实时更新Insert+xxxMergeTree+Optimize四、总结一、问题背景最近有一个项目需求,需要对日活跃的3万辆车的定位数据进行分析,并支持查询和统计分析结果。每辆车每天产生1条分析结果数据,要求能够查询过去一年内的所有分析结果。因......
  • ClickHouse
    1.简介ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。使用SIMD高效指令集,向量化执行引擎,列存储数据高效压缩1.1OLAP核心A:在线实时分析类型:关系型,多维,混合,空间。ck是关系型基本分析操作:上卷RollUp:相关数据聚合到一个变量来减少纬度下钻DrillDown:分离......
  • Conditional render 1 of 3 components on button click (react)
    题意:在按钮点击时有条件地渲染三个组件中的一个(React)问题背景:I'mnewtoreactandbeenstrugglingtofigureouthowtorenderthecomponentsinsidethecontainerdependingonwhichbuttonhasbeenclicked.我刚接触React,一直在努力弄明白如何根据点击了哪个按......
  • AWS设计和实现低空管理系统
    在AWS上设计和实现低空管理系统(LAMS)以规划、管理和监控低空空域涉及几个关键步骤。通过利用IoTCore、Lambda、Kinesis和SageMaker等AWS服务,您可以构建可扩展且强大的低海拔管理系统。该系统将提供实时监控、危险检测和警报功能,以确保低空空域的安全和秩序。提供......
  • rpm安装clickhouse(24.11.8.5单机)
    环境:OS:Centos7db:24.11.8.51.下载安装介质下载地址为:https://packagecloud.io/Altinity/clickhouse或是这里下载https://mirrors.tuna.tsinghua.edu.cn/clickhouse/rpm/stable/x86_64/我这里下载的是如下三个包clickhouse-client-24.8.11.5.noarch.rpmclickhouse-common-sta......
  • RestClient查询文档(*)
    match_all查询代码解读:第一步,创建SearchRequest对象,指定索引库名第二步,利用request.source()构建DSL,DSL中可以包含查询、分页、排序、高亮等query():代表查询条件,利用QueryBuilders.matchAllQuery()构建一个match_all查询的DSL第三步,利用client.search()发送请求,得到......
  • MODBUS RTU转CCLINK IE台达ME300变频器与三菱plc通讯案例
    你是否曾经遇到过需要将不同的工业设备连接到同一个网络?这是一个非常常见的问题,那么今天我将为大家介绍一种解决方案。捷米特JM-CCLKIE-RTU网关是一款通讯网关,可以将各种不同的工业设备连接到CCLINKIEFB网络中。它不仅可以将MODBUS-RTU/RS485/RS232设备接入到CCLINKIE......
  • [Babel] Intro Babel - 03. CLI
    CLI关于babel所提供的CLI,你可以在https://babeljs.io/docs/babel-cli看到所有所支持的CLI命令。要使用CLI命令,首先第一步是安装:pnpmadd--save-dev@babel/core@babel/cli注意在安装@babel/cli这个包的时候,需要同时安装@babel/core这个包,这个包是提供babel......
  • doris&clickhouse&spark的元数据解析
    1.元数据的核心作用-数据目录管理-权限管理-分片信息-版本控制-资源调度2.基本组成部分-表结构定义-分区信息-统计信息-依赖关系-访问控制3.各系统的特点Doris:-FE管理的表定义、分区等-分布式事务相关元数据ClickHouse:-ZK存储的集群......
  • cliproxy海外 IP 的应用场景
    在当今全球化与数字化深度交织的时代,海外IP扮演着愈发关键的角色,其应用场景广泛地渗透到诸多领域,为个人、企业乃至科研机构开辟了新的发展路径。一、跨境电商运营对于跨境电商从业者而言,海外IP堪称业务拓展的得力助手。一方面,在店铺注册环节,部分海外电商平台基于地域限制......