大数据学习初级入门教程（十六） —— Hadoop 3.x 完全分布式集群的安装、启动和测试

时间：2023-04-29 11:03:45浏览次数：40

标签：HDFS hdfs 入门教程 Hadoop hadoop USER ERROR root 分布式

好久没用 Hadoop 集群了，参考以前写的《大数据学习初级入门教程（一） —— Hadoop 2.x 完全分布式集群的安装、启动和测试_孟郎郎的博客》和《大数据学习初级入门教程（十二） —— Hadoop 2.x 集群和 Zookeeper 3.x 集群做集成_孟郎郎的博客-》，下载了目前官网最新的版本 hadoop-3.3.5 再重温下集群部署。按步骤进行到格式化集群步骤时，发现不少和老版本不一致的地方，这里记录如下。

问题1）ERROR: Attempting to operate on *** as root

大数据学习初级入门教程（十六） —— Hadoop 3.x 完全分布式集群的安装、启动和测试_hadoop

[root@node111 hadoop]# start-dfs.sh
Starting namenodes on [node111]
ERROR: Attempting to operate on hdfs namenode as root
ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting operation.
Starting datanodes
ERROR: Attempting to operate on hdfs datanode as root
ERROR: but there is no HDFS_DATANODE_USER defined. Aborting operation.
Starting secondary namenodes [node112]
ERROR: Attempting to operate on hdfs secondarynamenode as root
ERROR: but there is no HDFS_SECONDARYNAMENODE_USER defined. Aborting operation.
Starting journal nodes [node115 node114 node113]
ERROR: Attempting to operate on hdfs journalnode as root
ERROR: but there is no HDFS_JOURNALNODE_USER defined. Aborting operation.
Starting ZK Failover Controllers on NN hosts [node111 node112]
ERROR: Attempting to operate on hdfs zkfc as root
ERROR: but there is no HDFS_ZKFC_USER defined. Aborting operation.
[root@node111 hadoop]#

查了下资料，解决方法是在环境变量配置中加上下面这些配置：

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

注意：添加完后，一定执行命令 source ~/.bash_profile 让配置立刻生效。

还有一种方式如下，稍微繁琐些，请自行尝试。

1）将start-dfs.sh，stop-dfs.sh(在hadoop安装目录的sbin里)两个文件顶部添加以下参数
HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
2）将start-yarn.sh，stop-yarn.sh(在hadoop安装目录的sbin里)两个文件顶部添加以下参数
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

问题2）启动集群时，发现 Namenode 节点总是启动了 Datanode

每次启动集群后，Namenode节点总是启动了 Datanode，最后发现新的版本中配置 Datanode文件为 /etc/hadoop/workers，不需要和原来那样创建 /etc/hadoop/slaves 了。

问题3）启动 journalnode 节点命令

新版本启动 journalnode 节点的命令变更如下，原命令已废弃。

hdfs --daemon start journalnode
more /soft/hadoop/hadoop-3.3.5/logs/hadoop-root-journalnode-node115.log
hdfs --daemon stop journalnode

问题4）如果访问路径 http://192.168.220.19:50070/ 无法打开页面

启动后浏览器访问 namenode 节点的监控页面，访问路径为：http://192.168.220.19:50070/，结果页面打不开，看官网发现新版本把 namenode 端口变了，访问 9870 端口即可。

大数据学习初级入门教程（十六） —— Hadoop 3.x 完全分布式集群的安装、启动和测试_集群_02

问题5）测试集群高可用时，standby 无法切换为 active 状态

查看 standby 所在节点的日志，可以发现 Connection refused 错误，详细如下：

PATH=$PATH:/sbin:/usr/sbin fuser -v -k -n tcp 8020 via ssh: bash
: fuser: command not found

这是因为在 hdfs-site.xml 中配置了如下配置：

<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>

因为机器上没有 fuser 程序，导致无法进行 fence，安装 psmisc 即可解决问题。

yum install psmisc

以上是部署新版集群踩的一些坑，顺手记录一下。

Good Luck！

标签：HDFS,hdfs,入门教程,Hadoop,hadoop,USER,ERROR,root,分布式
From： https://blog.51cto.com/menglanglang/6236656

Zabbix 3.0 alpha6企业级分布式监控系统发布
Zabbix企业级分布式监控系统发布了3.0第六个alpha版本，目前Zabbix3.0还处在内测阶段，官方不建议大家慎重使用。BUT，目前我的alpha5版本运行良好。胆量大的同学不妨升级到最新版本。备注：zabbix升级是一个不可逆的过程，还请慎重！zabbix3.0alpha6如下更新：[ZBXNEXT-3073]实现公共与私有sc......
Hadoop启动集群报错:Starting namenodes on [hadoop01] hadoop01: root@hadoop01: Per
搭建三个hadoop集群的时候,master没有启动namenode和datanode，报错:Startingnamenodeson[hadoop01]hadoop01:root@hadoop01:Permissiondenied(publickey,gssapi-keyex,gssapi-with-mic,password).Startingdatanodeshadoop01:root@hadoop01:Permissiondenied(publicke......
Hadoop概述
Hadoop概述Hadoop是什么hadoop是一个由Apache基金会所开发的分布式系统基础框架其主要解决，海量数据的存储和海量数据的的分析计算问题广义上，Hadoop通常是指一个更加广泛的概念——Hadoop生态圈Hadoop的发展历史Hadoop创始人DougCutting，为了实现与Google类似的全......
2-Hadoop集群配置-安装-启动
1、流程说明在单机测试wordcount没问题后，开始配置集群模式说明:hadoop有几个功能 ①hdfs存 NameNode SecondNameNode DataNode ②yarn资源调度 ResourceManager NodeManager ③mapreduce计算有Job任务的时候才会有每台机器都有hd......
redisson 分布式锁
@RequestMapping(value="/testLock",method=RequestMethod.POST)publicBaseResponse<Boolean>testLock(@RequestBodyTestLockRequesttestLockRequest){RLockrLock=null;booleanisLocked=false;try{......
织密“安全云网”，天翼云探索构建分布式多场景云服务稳定性保障体系！
近日，中国信息通信研究院（以下简称“中国信通院”）主办，混沌工程实验室承办的信息通信领域系统稳定性保障沙龙·北京站成功举办。沙龙以“共筑数字免疫韧性长城，助力信息通信行业稳定安全运行”为主题，旨在促进信息通信领域系统稳定性保障技术交流，推动信息通信领域稳定安全运行水平提升，......
Hadoop-HDFS压测】针对HDFS进行读写性能测试
【Hadoop-HDFS压测】针对HDFS进行读写性能测试1）测试工具2）写入数据测试3）读取数据测试4）清除数据1)测试工具Hadoop自身集成的工具包：hadoop-mapreduce-client-jobclient-3.1.1.jar注意：1、如果是Apache版本安装的Hadoop默认在lib目录下，如果是CDH版本安装的Hadoop需要自己去对......
Hadoop集群搭建总结
对这两天搭建Hadoop集群做个经验总结master节点:Ubuntu22.04，也就是我的台式机主机slave节点：Debian11，通过VMware虚拟出来（1）集群节点设置和角色分配master namenode,datanode,resourcemanager,nodemanagerslave0 secondarynamenode,datanode,nodem......
织密“安全云网”，天翼云探索构建分布式多场景云服务稳定性保障体系！
近日，中国信息通信研究院（以下简称“中国信通院”）主办，混沌工程实验室承办的信息通信领域系统稳定性保障沙龙·北京站成功举办。沙龙以“共筑数字免疫韧性长城，助力信息通信行业稳定安全运行”为主题，旨在促进信息通信领域系统稳定性保障技术交流，推动信息通信领域稳定安全运行水平提升，加......
从0-1_Hadoop安装
1、流程说明本文参考尚硅谷大数据教程加以整理1、win10,安装好xshell/xftp/vmware，搭建虚拟机，克隆3台2、配置网络，防火墙，host,hostname，创建新用户，配置ssh免密3、上传jdk/hadoop安装包，解压，配置环境变量，wordcount测试注意：虚拟机搭建好，配置完就要切换到xing用户，使用sudo操......