Spark on Yarn配置

时间：2023-04-06 16:44:26浏览次数：36

标签：配置 yarn Yarn conf HOME Spark spark

1、Spark on Yarn配置

1.)在搭建好的Spark上修改spark-env.sh文件：

# vim $SPARK_HOME/conf/spark-env.sh

添加以下配置：

export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export YARN_CONF_DIR=${HADOOP_HOME}/etc/hadoop

2.)在搭建好的Spark上修改spark-defaults.conf文件

# vim $SPARK_HOME/conf/spark-defaults.conf

添加以下配置：

spark.master                     yarn

yarn的capacity-scheduler.xml文件修改配置保证资源调度按照CPU + 内存模式：

<property> 
    <name>yarn.scheduler.capacity.resource-calculator</name> 
    <!-- <value>org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator</value> --> 
  <value>org.apache.hadoop.yarn.util.resource.DominantResourceCalculator</value> 
</property>

2、Spark on Yarn日志配置

在yarn-site.xml开启日志功能：
<property>
    <description>Whether to enable log aggregation</description>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<property>
    <name>yarn.log.server.url</name>
    <value>http://master:19888/jobhistory/logs</value>
</property>

修改mapred-site.xml:
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
 
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
</property>

修改spakr-defaults.conf文件：

spark.eventLog.dir=hdfs://bda1node01:8020/user/spark/applicationHistory
spark.eventLog.enabled=true
spark.yarn.historyServer.address=http://bda1node01:18018

修改spark-evn.sh环境变量：

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18018 -Dspark.history.fs.logDirectory=hdfs://bda1node01:8020/user/spark/applicationHistory"

yarn查看日志命令： yarn logs -applicationId <application_1590546538590_0017>

启动Hadoop和Spark历史服务器：

# mapred  --daemon start historyserver
# $SPARK_HOME/sbin/start-history-server.sh

标签：配置,yarn,Yarn,conf,HOME,Spark,spark
From： https://www.cnblogs.com/zyanrong/p/17293262.html

对Spark的那些【魔改】
前言这两年做streamingpro时，不可避免的需要对Spark做大量的增强。就如同我之前吐槽的，Spark大量使用了new进行对象的创建，导致里面的实现基本没有办法进行替换。比如SparkEnv里有个属性叫closureSerializer，是专门做任务的序列化反序列化的，当然也负责对函数闭包的序列化反序列化。我们......
通过 Homebrew 在 Mac OS X 上安装和配置 Redis
通过使用Homebrew，可以大大降低在MacOSX上设置和配置开发环境的成本。让我们安装Redis。$brewinstallredis安装后，我们将看到一些有关配置注意事项的通知。离开它并继续关注本文中的一些任务。开机自启动Redis$ln-sfv/usr/local/Cellar/redis/7.0.10/*.plist......
性能工具之Jmeter扩展配置元件插件
背景Jmeter有很多的配置元件可以定义变量值在测试过程中使用比如最常见的两个：用户自定义变量CSV数据文件设置配置元件主要是用于测试前配置，将配置转换为变量设置到Jmetercontext中。而Jmeter默认并没有配置文件(.properties)读取器，但由于Jmeter是开源的，我们自己可以自定义一个配置......
HomeBrew 安装 Maven 及其 IDEA 配置
Brew安装Mavenbrewsearchmaven#使用搜索工具去搜索maven包brewinfomaven#使用info查看maven包当前的信息情况，包括版本依赖描述等brewinstallmaven安装过程很顺利，这时候brew就已经帮我们做好了环境变量了。很多教程在这一步后会手动去生命maven的目录情况，我看了......
build.xml配置文件——调整格式2
<?xmlversion="1.0"encoding="UTF-8"?><projectname="ant-jmeter-test"default="run"basedir="."> <tstamp> <formatproperty="time"pattern="yyyyMMddhhmm"/......
Mac ｜ HomeBrew 安装 & 配置 MySQL
这个是我最新并且一直推崇的方法：1、安装：brewinstallmysql2、开启mysql：mysql.serverstart3、使用mysql的配置脚本：/usr/local/opt/mysql/bin/mysql_secure_installation//mysql提供的配置向导启动这个脚本后，即可根据如下命令提示进行初始化设置14:14:49withkoshkaaaain......
Rider-调试并配置本地IIS
项目部署到IISIIS：新建Web站点，路径指向Web应用程序根目录，端口默认80端口；应用程序池：".NetCLR版本"选择.NetCLR版本v4.0.30319，托管管道模式选择"集成"。 Web项目配置在Rider中选中Web项目，输入F4，打开csproj文件，添加如下配置。1<WebProjectProperties>2<U......
Git 配置 SSH，多个 Github 账号配置不同的 SSH key
前言首先做个说明生成一对默认的私钥公钥，私钥自己客户端留着用，公钥可以给多个平台用。多对私钥公钥，主要是应对一个平台多个账号的情况。当然你想每个平台使用不同的私钥公钥也是可以的。多次生成私钥公钥需要自己重新命名，否则会覆盖之前的。Git配置SSH一、查看是否已经生成过/是......
走进Java接口测试之读取配置文件
前言但在大部分用例开发环境下，添加额外配置是无所避免的，比如自定义应用端口号、服务地址、数据库的配置等，都或多或少的需要一些外部的配置项等。在前文中我们有详细介绍在接口测试框架中如何基于SpringBoot快速搭建多环境配置，本文将在原有的基础上介绍集成如何快速读取配置文件的......
Zabbix安装与配置
Zabbix简介Zabbix是一个企业级的开源分布式监控解决方案，由C语言编写而成的底层架构（server端和agent端），由一个国外的团队持续维护更新，软件可以自由下载使用，运作团队靠提供收费的技术支持赢利。Zabbix运行条件：Server：ZabbixServer需运行在LAMP（Linux+Nginx+Mysql+PHP）环境下，对硬件要......

Spark on Yarn配置

2、Spark on Yarn日志配置

相关文章

赞助商

阅读排行