首页 > 其他分享 >大数据学习初级入门教程(十六) —— Hadoop 3.x 完全分布式集群的安装、启动和测试

大数据学习初级入门教程(十六) —— Hadoop 3.x 完全分布式集群的安装、启动和测试

时间:2023-04-29 11:03:45浏览次数:35  
标签:HDFS hdfs 入门教程 Hadoop hadoop USER ERROR root 分布式


好久没用 Hadoop 集群了,参考以前写的《大数据学习初级入门教程(一) —— Hadoop 2.x 完全分布式集群的安装、启动和测试_孟郎郎的博客》和《大数据学习初级入门教程(十二) —— Hadoop 2.x 集群和 Zookeeper 3.x 集群做集成_孟郎郎的博客-》,下载了目前官网最新的版本 hadoop-3.3.5 再重温下集群部署。按步骤进行到格式化集群步骤时,发现不少和老版本不一致的地方,这里记录如下。

问题1)ERROR: Attempting to operate on *** as root

大数据学习初级入门教程(十六) —— Hadoop 3.x 完全分布式集群的安装、启动和测试_hadoop

[root@node111 hadoop]# start-dfs.sh 
Starting namenodes on [node111]
ERROR: Attempting to operate on hdfs namenode as root
ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting operation.
Starting datanodes
ERROR: Attempting to operate on hdfs datanode as root
ERROR: but there is no HDFS_DATANODE_USER defined. Aborting operation.
Starting secondary namenodes [node112]
ERROR: Attempting to operate on hdfs secondarynamenode as root
ERROR: but there is no HDFS_SECONDARYNAMENODE_USER defined. Aborting operation.

Starting journal nodes [node115 node114 node113]
ERROR: Attempting to operate on hdfs journalnode as root
ERROR: but there is no HDFS_JOURNALNODE_USER defined. Aborting operation.
Starting ZK Failover Controllers on NN hosts [node111 node112]
ERROR: Attempting to operate on hdfs zkfc as root
ERROR: but there is no HDFS_ZKFC_USER defined. Aborting operation.
[root@node111 hadoop]# 

查了下资料,解决方法是在环境变量配置中加上下面这些配置:

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

注意:添加完后,一定执行命令 source ~/.bash_profile 让配置立刻生效。

还有一种方式如下,稍微繁琐些,请自行尝试。


1)将start-dfs.sh,stop-dfs.sh(在hadoop安装目录的sbin里)两个文件顶部添加以下参数

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

2)将start-yarn.sh,stop-yarn.sh(在hadoop安装目录的sbin里)两个文件顶部添加以下参数

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

问题2)启动集群时,发现 Namenode 节点总是启动了 Datanode

每次启动集群后,Namenode节点总是启动了 Datanode,最后发现新的版本中配置 Datanode文件为 /etc/hadoop/workers,不需要和原来那样创建 /etc/hadoop/slaves 了。

问题3)启动 journalnode 节点命令

新版本启动 journalnode 节点的命令变更如下,原命令已废弃。

hdfs --daemon start journalnode

more /soft/hadoop/hadoop-3.3.5/logs/hadoop-root-journalnode-node115.log

hdfs --daemon stop journalnode

问题4)如果访问路径 http://192.168.220.19:50070/ 无法打开页面

启动后浏览器访问 namenode 节点的监控页面,访问路径为:http://192.168.220.19:50070/,结果页面打不开,看官网发现新版本把 namenode 端口变了,访问 9870 端口即可。

大数据学习初级入门教程(十六) —— Hadoop 3.x 完全分布式集群的安装、启动和测试_集群_02

问题5)测试集群高可用时,standby 无法切换为 active 状态

查看 standby 所在节点的日志,可以发现 Connection refused 错误,详细如下:

PATH=$PATH:/sbin:/usr/sbin fuser -v -k -n tcp 8020 via ssh: bash
: fuser: command not found

这是因为在 hdfs-site.xml 中配置了如下配置:

    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
    </property>

因为机器上没有 fuser 程序,导致无法进行 fence,安装 psmisc 即可解决问题。

yum install psmisc

以上是部署新版集群踩的一些坑,顺手记录一下。

Good Luck!

标签:HDFS,hdfs,入门教程,Hadoop,hadoop,USER,ERROR,root,分布式
From: https://blog.51cto.com/menglanglang/6236656

相关文章

  • Zabbix 3.0 alpha6企业级分布式监控系统发布
    Zabbix企业级分布式监控系统发布了3.0第六个alpha版本,目前Zabbix3.0还处在内测阶段,官方不建议大家慎重使用。BUT,目前我的alpha5版本运行良好。胆量大的同学不妨升级到最新版本。备注:zabbix升级是一个不可逆的过程,还请慎重!zabbix3.0alpha6如下更新:[ZBXNEXT-3073]实现公共与私有sc......
  • Hadoop启动集群报错:Starting namenodes on [hadoop01] hadoop01: root@hadoop01: Per
    搭建三个hadoop集群的时候,master没有启动namenode和datanode,报错:Startingnamenodeson[hadoop01]hadoop01:root@hadoop01:Permissiondenied(publickey,gssapi-keyex,gssapi-with-mic,password).Startingdatanodeshadoop01:root@hadoop01:Permissiondenied(publicke......
  • Hadoop概述
    Hadoop概述Hadoop是什么hadoop是一个由Apache基金会所开发的分布式系统基础框架其主要解决,海量数据的存储和海量数据的的分析计算问题广义上,Hadoop通常是指一个更加广泛的概念——Hadoop生态圈Hadoop的发展历史Hadoop创始人DougCutting,为了实现与Google类似的全......
  • 2-Hadoop集群配置-安装-启动
    1、流程说明在单机测试wordcount没问题后,开始配置集群模式说明:hadoop有几个功能​ ①hdfs存​ NameNode​ SecondNameNode​ DataNode​ ②yarn资源调度​ ResourceManager​ NodeManager​ ③mapreduce计算​ 有Job任务的时候才会有每台机器都有hd......
  • redisson 分布式锁
    @RequestMapping(value="/testLock",method=RequestMethod.POST)publicBaseResponse<Boolean>testLock(@RequestBodyTestLockRequesttestLockRequest){RLockrLock=null;booleanisLocked=false;try{......
  • 织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!
    近日,中国信息通信研究院(以下简称“中国信通院”)主办,混沌工程实验室承办的信息通信领域系统稳定性保障沙龙·北京站成功举办。沙龙以“共筑数字免疫韧性长城,助力信息通信行业稳定安全运行”为主题,旨在促进信息通信领域系统稳定性保障技术交流,推动信息通信领域稳定安全运行水平提升,......
  • Hadoop-HDFS压测】针对HDFS进行读写性能测试
    【Hadoop-HDFS压测】针对HDFS进行读写性能测试1)测试工具2)写入数据测试3)读取数据测试4)清除数据1)测试工具Hadoop自身集成的工具包:hadoop-mapreduce-client-jobclient-3.1.1.jar注意:1、如果是Apache版本安装的Hadoop默认在lib目录下,如果是CDH版本安装的Hadoop需要自己去对......
  • Hadoop集群搭建总结
    对这两天搭建Hadoop集群做个经验总结master节点:Ubuntu22.04,也就是我的台式机主机slave节点:Debian11,通过VMware虚拟出来(1)集群节点设置和角色分配master  namenode,datanode,resourcemanager,nodemanagerslave0  secondarynamenode,datanode,nodem......
  • 织密“安全云网”,天翼云探索构建分布式多场景云服务稳定性保障体系!
    近日,中国信息通信研究院(以下简称“中国信通院”)主办,混沌工程实验室承办的信息通信领域系统稳定性保障沙龙·北京站成功举办。沙龙以“共筑数字免疫韧性长城,助力信息通信行业稳定安全运行”为主题,旨在促进信息通信领域系统稳定性保障技术交流,推动信息通信领域稳定安全运行水平提升,加......
  • 从0-1_Hadoop安装
    1、流程说明本文参考尚硅谷大数据教程加以整理1、win10,安装好xshell/xftp/vmware,搭建虚拟机,克隆3台2、配置网络,防火墙,host,hostname,创建新用户,配置ssh免密3、上传jdk/hadoop安装包,解压,配置环境变量,wordcount测试注意:虚拟机搭建好,配置完就要切换到xing用户,使用sudo操......