首页 > 其他分享 >hadoop集群搭建之测试集群,配置历史服务器,日志聚集,时间同步

hadoop集群搭建之测试集群,配置历史服务器,日志聚集,时间同步

时间:2022-08-22 22:46:35浏览次数:99  
标签:site hadoop 集群 atguigu 日志 hadoop102

hadoop集群搭建之测试集群,配置历史服务器,日志聚集,时间同步
前期概要:我们完全分布式集群已经搭建完毕,并且还写了群启/群关的脚本,

接下来有必要来测试一遍集群,我们可以使用官方的案例,用它们在集群上跑一遍

运行官方wordcount案例
[atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput
1
思考,这里的/wcinput和/wcoutput目录是哪儿的??

发现不是本地的,这是有core-site.xml中fs.defaultFS配置决定的,默认是本地,现在我们配置为了 hdfs://hadoop102:9820

配置历史服务器
历史服务器是针对MR程序执行的历史纪录

配置步骤:mapred-site.xml

[atguigu@hadoop102 hadoop]$ vim mapred-site.xml
[atguigu@hadoop102 hadoop]$ 添加如下配置
1
2
<!-- 历史服务器端地址 -->
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop102:19888</value>
</property>
1
2
3
4
5
6
7
8
9
10
11
修改了配置分发一下

[atguigu@hadoop102 hadoop-3.1.3]$ my_rsync.sh etc/hadoop/mapred-site.xml
1
启动历史服务器

[atguigu@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
1


日志聚集功能
日志是针对MR程序运行时所产生的日志

目的:方便后期分析问题,有更好的 执行过程的一句

配置步骤:yarn-site.xml

开启日志聚集功能

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上。

日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。

[atguigu@hadoop102 hadoop]$ vim yarn-site.xml
[atguigu@hadoop102 hadoop]$ 添加如下配置
1
2
<!-- 开启日志聚集功能 -->
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>
<name>yarn.log.server.url</name>
<value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 分发配置
[atguigu@hadoop102 hadoop-3.1.3]$ my_rsync.sh etc/hadoop/yarn-site.xml
1
2
启动集群

注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer。

再重新泡跑个job,然后查看日志聚集效果

 

集群时间同步
时间同步的方式:找一个机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,比如,每隔十分钟,同步一次时间。

 

 

 

 


————————————————
版权声明:本文为CSDN博主「倔强的耗子」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44178366/article/details/120396407

搜索

复制

标签:site,hadoop,集群,atguigu,日志,hadoop102
From: https://www.cnblogs.com/stdxxd/p/16614501.html

相关文章

  • hadoop day3-java实现hdfs
    如何用javaApi的方式来操作hdfs 新建maven项目,然后建立一个子工程在父工程中引入依赖(maven中hadoophdfs,hadoopcommon和hadoopclient) <!--https://mvnrepository......
  • Hadoop的由来、Block切分、进程详解
    Hadoop的由来、Block切分、进程详解一、hadoop的由来Google发布了三篇论文:GFS(GoogleFileSystem)MapReduce(数据计算方法)BigTable:HbaseDougcutting花费了两......
  • hadoop简介
    一句话简述:Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。Hadoop的由来Google爬取全球的网站,然后计算页面的PageRank要解决网站的问题:a:这些网站怎么存......
  • 二进制部署k8s集群v1.23.9版本-13-安装CoreDns插件
    13.1、CoreDns概述简介:k8s的服务发现插件-CoreDnsCoreDns其实就是将service的名字和cluster-ip做一个自动关联部署k8s的内网资源配置清单http服务在192.168.1.200运......
  • linux中查找nginx指定时间范围内的日志信息
    需求:在nginx中过滤出凌晨3:18-6:36的日志信息1、使用sed方式过滤注意:此方式开始和结束时间必须要在日志中真实存在,否则会匹配不到内容或匹配到末尾sed-n'/2022:03:18......
  • java springboot 初体验 (六)添加统一的入参出参打印日志(使用切面)
    上一篇javaspringboot初体验(五)对接apollohttps://www.cnblogs.com/zwjvzwj/p/16602858.htmlpom文件中添加依赖<!--切面--><dependency>......
  • [四、Xcode界面]21几种在控制台输出日志的方式
    热烈欢迎,请直接点击!!!进入博主AppStore主页,下载使用各个作品!!!注:博主将坚持每月上线一个新app!!!......
  • docker快速搭建redis集群
    采用三台主节点Docker部署,均采用默认端口,每台机器一台redis,可以视情况自行修改#清理环境,所有节点执行!注意会删除数据rm-rf/opt/redis/clustermkdir-p/opt/redi......
  • Hadoop 二十三
    文件的更名和移动:    获取文件详细信息       遇到的问题:不能直接在web上上传文件。   权限问题:修改后即可正常创建  参考:https:/......
  • Docker系列---【Docker中启动flowable查看流转日志时字体显示方框问题】
    1.问题描述我用了flowable,在本地测试没问题,在linux环境也没问题,在docker中启动发现流程图字体显示有问题,显示方框。2.原因分析因为flowable返回的直接是图片,直......