Hadoop jobhistory服务

概述

当MR程序在YARN上运行，YARN不会永久记录MR作业的日志信息，在YARN集群重启之后日志信息会消失；
MR程序分布式执行也不利于日志的集中查看，开启jobhistory服务再配合YARN日志聚集功能可以实现集中查询日志
jobhistory用来记录已经完成的MapReduce程序运行日志，日志信息存放于HDFS目录中;
jobhistory默认情况下是没有开启，需要在mapred-site.xml中配置，并手动启动服务。

配置修改

MapReduce jobhistory

JobHistory用来记录已经finished的mapreduce运行日志，日志信息存放于HDFS目录中，默认情况下没有开启此功能，需要在mapred-site.xml中配置并手动启动。

cd /export/server/hadoop-3.3.0/etc/hadoop
vim mapred-site.xml

mapred-site.xml

vim mapred-site.xml

# MR JobHistory Server管理的日志的存放位置
<property>
	<name>mapreduce.jobhistory.address</name>
	<value>node1:10020</value>
</property>

# 查看历史服务器已经运行完的Mapreduce作业记录的web地址，需要启动该服务才行
<property>
	<name>mapreduce.jobhistory.webapp.address</name>
	<value>node1:19888</value>
</property>

注意：因为涉及配置文件修改，需要集群每台机器都修改，并且在重启后生效

scp /export/server/hadoop-3.3.0/etc/hadoop/mapred-site.xml node2:/export/server/hadoop-3.3.0/etc/hadoop/

scp /export/server/hadoop-3.3.0/etc/hadoop/mapred-site.xml node3:/export/server/hadoop-3.3.0/etc/hadoop/

yarn jobhistory

yarn的日志聚集功能：

yarn-site.xml

<!-- 开启日志聚集 -->
<property>
	<name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
    
<!-- 设置yarn历史服务器地址 -->
<property>
    <name>yarn.log.server.url</name>
    <value>http://node1:19888/jobhistory/logs</value>
</property>
    
<!-- 保存的时间7天 -->
    
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

修改集群中的每台机器：

scp /export/server/hadoop-3.3.0/etc/hadoop/yarn-site.xml node2:/export/server/hadoop-3.3.0/etc/hadoop/

scp /export/server/hadoop-3.3.0/etc/hadoop/yarn-site.xml node3:/export/server/hadoop-3.3.0/etc/hadoop/

jobhistory 服务启停

注意jobhistory服务并不受Hadoop集群启停命令控制，需要单独启动、单独关闭。

#hadoop2.x版本命令
mr-jobhistory-daemon.sh start|stop historyserver

#hadoop3.x版本命令
mapred --daemon start|stop historyserver

[root@node1 ~]# jps
13794 JobHistoryServer
13060 DataNode
12922 NameNode
13436 NodeManager
13836 Jps
13327 ResourceManager

标签：xml,服务,jobhistory,Hadoop,hadoop,server,export,site
From： https://www.cnblogs.com/luoluoange/p/18080243

广州腾讯云代理商：电脑怎么在腾讯云服务器上安装软件
目录广州腾讯云代理商：电脑怎么在腾讯云服务器上安装软件如何在腾讯云服务器上安装软件腾讯云的优势在腾讯云服务器上安装软件的步骤案例演示总结广州腾讯云代理商：电脑怎么在腾讯云服务器上安装软件简介：飞机@luotuoemo本文由（阿里云国际站代理商：【聚搜云】www.4526.......
微信小程序/公众号推送服务通知功能实现（公众号）
#微信小程序/公众号推送服务通知第一部分只介绍公众号，小程序的在第二部分再行介绍A、前期准备工作 1、准备好已经通审核及认证成功公众号 2、登录公众号平台 3、打开设置与开发中的基本配置 4、记录好开发者......
威联通(QNAP) TS-466C NAS 开箱评测，4盘位NAS，N6005，存储服务器
威联通(QNAP)TS-466C四盘位NAS(NetworkAttachedStorage:网络附属存储)开箱评测之前用的TS-551经过几轮系统升级后明显感觉性能跟不上了，变卡了，所以升级一下，换了TS-466C。威联通迁移NAS还挺方便的，只有将原先NAS里的硬盘取出来按顺序插入新NAS后直接开机就行，系统里的东......
Node+Vue毕设社区居家养老服务平台（程序+mysql+Express）
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义以上选题背景和意义内容是根据本选题撰写，非本作品实际的选题背景、意义或功能。各位童鞋可参考用于写开题选题和意义内容切勿直接引用。本成品的实际功能和技术以下......
服务器监控新利器：ServerBee带你看透服务器运行状态
近年来，随着互联网的飞速发展，服务器已经成为企业运营中不可或缺的一部分。然而，服务器出现故障或者性能下降可能会给企业带来巨大的损失。因此，如何及时有效地监控服务器状态成为了企业管理者关注的焦点之一。今天，我将向大家介绍一款强大的服务器监控工具——ServerBee。Serv......
python 服务自动生成 js 调用
python服务自动生成js调用原理接管请求分发过程;为每个command维护对应的handler;利用python动态特性,获得handler的参数;利用模版生成js代码;利用**kwargs获取所有参数传递给handler;Demo以Flask为例#main.pyfromflaskimportFlask,requestfro......
linux 服务器互信配置
[root@bre01opt]#catenv.csvippasswdhostname192.168.248.129123123bre01192.168.248.130123123bre02[root@bre01opt]#catenv.sh#!/bin/bashfunctionRSA(){echo"设置主机公钥">>./install_init.logrpm-qa|grepexpectif[$?-eq0]......
Linux 服务监控脚本
Linux服务监控脚本个人搭建的zabbix服务器因性能问题总是关闭，所以写了个脚本对zabbix-server服务进行监控。当服务停止时，脚本会自动拉起服务并记录日志，方面定位排查。[root@elttwl~]#vim/opt/scripts/zabbix-monitor.sh#!/bin/bashSERVICE=zabbix-serverwhiletruedo......
golang fasthttp服务端的简单实现
使用示例：packagemainimport("github.com/buaazp/fasthttprouter""github.com/valyala/fasthttp""log")funcmain(){//创建路由r:=fasthttprouter.New()r.GET("/",Index)iferr:=fasthttp.Listen......
window7系统 rabbitmq服务启动不了
问题描述：解决方案：1.检查win7是否是sp1版本桌面计算机鼠标右键属性，打开系统属性窗口，如下图所示：2.如果不是，下载windows6.1-kb976932-x64补丁安装，安装完成后重启电脑3.电脑重启后，下载vcredist_x64或者vcredist_x86软件安装（根据系统32位还是64位，下载不同的安装包安装），安装完成......

Hadoop jobhistory服务

Hadoop jobhistory服务

概述

配置修改

MapReduce jobhistory

yarn jobhistory

jobhistory 服务启停

相关文章

赞助商

阅读排行