hadoop集群搭建之测试集群，配置历史服务器，日志聚集，时间同步

时间：2022-08-22 22:46:35浏览次数：116

标签：site hadoop 集群 atguigu 日志 hadoop102

hadoop集群搭建之测试集群，配置历史服务器，日志聚集，时间同步
前期概要：我们完全分布式集群已经搭建完毕，并且还写了群启/群关的脚本，

接下来有必要来测试一遍集群，我们可以使用官方的案例，用它们在集群上跑一遍

运行官方wordcount案例
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput
1
思考，这里的/wcinput和/wcoutput目录是哪儿的？？

发现不是本地的，这是有core-site.xml中fs.defaultFS配置决定的，默认是本地，现在我们配置为了 hdfs://hadoop102:9820

配置历史服务器
历史服务器是针对MR程序执行的历史纪录

配置步骤：mapred-site.xml

[atguigu@hadoop102 hadoop]$ vim mapred-site.xml
[atguigu@hadoop102 hadoop]$ 添加如下配置
1
2

<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop102:10020</value>
</property>

<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop102:19888</value>
</property>
1
2
3
4
5
6
7
8
9
10
11
修改了配置分发一下

[atguigu@hadoop102 hadoop-3.1.3]$ my_rsync.sh etc/hadoop/mapred-site.xml
1
启动历史服务器

[atguigu@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
1

日志聚集功能
日志是针对MR程序运行时所产生的日志

目的：方便后期分析问题，有更好的执行过程的一句

配置步骤：yarn-site.xml

开启日志聚集功能

日志聚集概念：应用运行完成以后，将程序运行日志信息上传到HDFS系统上。

日志聚集功能好处：可以方便的查看到程序运行详情，方便开发调试。

[atguigu@hadoop102 hadoop]$ vim yarn-site.xml
[atguigu@hadoop102 hadoop]$ 添加如下配置
1
2

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<property>
<name>yarn.log.server.url</name>
<value>http://hadoop102:19888/jobhistory/logs</value>
</property>

<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 分发配置
[atguigu@hadoop102 hadoop-3.1.3]$ my_rsync.sh etc/hadoop/yarn-site.xml
1
2
启动集群

注意：开启日志聚集功能，需要重新启动NodeManager 、ResourceManager和HistoryServer。

再重新泡跑个job,然后查看日志聚集效果

集群时间同步
时间同步的方式：找一个机器，作为时间服务器，所有的机器与这台集群时间进行定时的同步，比如，每隔十分钟，同步一次时间。

————————————————
版权声明：本文为CSDN博主「倔强的耗子」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_44178366/article/details/120396407

搜索

复制

标签：site,hadoop,集群,atguigu,日志,hadoop102
From： https://www.cnblogs.com/stdxxd/p/16614501.html

hadoop day3-java实现hdfs
如何用javaApi的方式来操作hdfs 新建maven项目，然后建立一个子工程在父工程中引入依赖（maven中hadoophdfs，hadoopcommon和hadoopclient） <!--https://mvnrepository......
Hadoop的由来、Block切分、进程详解
Hadoop的由来、Block切分、进程详解一、hadoop的由来Google发布了三篇论文:GFS(GoogleFileSystem)MapReduce(数据计算方法)BigTable：HbaseDougcutting花费了两......
hadoop简介
一句话简述：Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。Hadoop的由来Google爬取全球的网站，然后计算页面的PageRank要解决网站的问题：a：这些网站怎么存......
二进制部署k8s集群v1.23.9版本-13-安装CoreDns插件
13.1、CoreDns概述简介：k8s的服务发现插件-CoreDnsCoreDns其实就是将service的名字和cluster-ip做一个自动关联部署k8s的内网资源配置清单http服务在192.168.1.200运......
linux中查找nginx指定时间范围内的日志信息
需求：在nginx中过滤出凌晨3:18-6:36的日志信息1、使用sed方式过滤注意：此方式开始和结束时间必须要在日志中真实存在，否则会匹配不到内容或匹配到末尾sed-n'/2022:03:18......
java springboot 初体验（六）添加统一的入参出参打印日志（使用切面）
上一篇javaspringboot初体验（五）对接apollohttps://www.cnblogs.com/zwjvzwj/p/16602858.htmlpom文件中添加依赖<dependency>......
[四、Xcode界面]21几种在控制台输出日志的方式
热烈欢迎，请直接点击！！！进入博主AppStore主页，下载使用各个作品！！！注：博主将坚持每月上线一个新app！！！......
docker快速搭建redis集群
采用三台主节点Docker部署，均采用默认端口，每台机器一台redis，可以视情况自行修改#清理环境，所有节点执行！注意会删除数据rm-rf/opt/redis/clustermkdir-p/opt/redi......
Hadoop 二十三
文件的更名和移动: 获取文件详细信息遇到的问题：不能直接在web上上传文件。权限问题：修改后即可正常创建参考：https:/......
Docker系列---【Docker中启动flowable查看流转日志时字体显示方框问题】
1.问题描述我用了flowable，在本地测试没问题，在linux环境也没问题，在docker中启动发现流程图字体显示有问题，显示方框。2.原因分析因为flowable返回的直接是图片，直......

hadoop集群搭建之测试集群，配置历史服务器，日志聚集，时间同步

相关文章

赞助商

阅读排行