Hadoop集群模式的搭建之四：运行Hadoop集群

时间：2024-05-20 21:29:15浏览次数：29

格式化NameNode

当第一次启动HDFS时要进行格式化，将NameNode上的数据清零，否则会缺失DataNode。以后启动无需再格式化，只要运行过Hadoop集群，其工作目录（/usr/local/src/hadoop/tmp）中就会有数据。如果需要重新格式化，则在重新格式化之前一定要先删除工作目录下的数据，否则格式化时会出问题，并且缺失DataNode进程。
在master节点上进行格式化，执行以下命令

hdfs namenode -format

格式化的过程比较长，一般需要1Min,该过程会在屏幕上不断地刷新。等待格式化完成后，Hadoop3.1.4版本会提示格式化成功信息。

启动和关闭Hadoop集群

针对Hadoop集群的启动，需要启动HDFS集群YARN集群两个框架，启动方式可以逐个启动，也可以使用脚本一键启动。

1. 逐个启动

在master节点上启动HDFS NameNode进程、YARN ResourceManager进程和HistoryServer进程。启动后可以使用"jps"命令查看进程，执行以下命令

hadoop-daemon.sh start namenode
yarn-daemon.sh start resourcemanager
mr-jobhistory-daemon.sh start historyserver
jps

使用jps命令查看NameNode 和ResourceManager两个进程，如下图

在slave节点中启HDFS DataNode进程、YARN NodeManager进程，执行以下命令

hadoop-daemon.sh start datanode
yarn-daemon.sh start nodemanager
jps

启动后可以使用jps命令查看进程，slave1和slave2情况以下，如下图

2.脚本一键启动

执行以下命令

start-dfs.sh
start-yarn.sh
mr-jobhistory-daemon.sh start historyserver
jps

以上是启动进程的各种方法，Hadoop集群的关闭和启动的顺序是相反的，即倒序关闭。如果要关闭相应的进程，则执行以下命令，先关闭HistoryServer进程，然后关闭YARN进程，最后关闭HDFS。

mr-jobhistory-daemon.sh start historyserver
start-yarn.sh
start-dfs.sh

使用浏览器查看节点状态

Hadoop集群启动后，通过Web页面可以方便地进行集群的管理和查看，只需在本地操作系统的浏览器的地址栏中输入集群服务器的节点名称（或ip地址）和相应的端口号。在浏览器中输入http://master:9870,如图所示

在浏览器中输入http://master:8088, 进入页面，可以查看SecondaryNameNode信息，如下图

标签：格式化,启动,Hadoop,start,sh,集群,之四
From： https://www.cnblogs.com/cs-js/p/18202824

自动化部署elasticsearch三节点集群
什么是Elasticsearch？Elasticsearch是一个开源的分布式搜索和分析引擎，构建在ApacheLucene的基础上。它提供了一个分布式多租户的全文搜索引擎，具有实时分析功能。Elasticsearch最初是用于构建全文搜索引擎，但它的功能已经扩展到包括日志分析、应用程序性能监控、地理信息系统等......
使用私有云搭建ceph集群（一）
环境背景本次ceph集群的搭建过程，利用学校数据中心服务器上部署的openstack私有云来进行实验学习[登录账户]一、初始配置(两张网卡)network1配置点击+创建网络进行网络的创建，首先对网络进行命名对网络中的子网进行配置，设置子网名称subnet1以及网络地址192.168.1.0/24，网关......
Hadoop集群模式的搭建之三：搭建Hadoop完全分布式集群
Hadoop可以按如下3种模式进行安装和运行。（1）单机模式：Hadoop的默认模式，安装时不需要修改配置文件（2）伪分布式模式：Hadoop安装在一台计算机上，需要修改相应的配置文件，用一台计算机模拟多台主机的集群。（3）完全分布式模式：在多台计算机上安装JDK和Hadoop，组成相互连通的集群，需要修改相应的......
redis实现分片集群
为什么要使用分片集群？主从和哨兵可以解决高可用、高并发读的问题。但是仍存在海量数据存储、高并发写问题分片集群特征：集群中有多个master，每个master保存不同数据。为master置备了后备隐藏能源：多个slave节点优化了sentinel，master互相ping检测彼此状态结构复杂，难弄 ......
Linux集群管理
1.ssh密钥认证全过程 2.Ansible自动化运维:批量管理,批量分发,批量执行,维护。。Ansible是python写的. 3.Ansible管理架构Inventory主机清单:被管理主机的ip列表,分类.ad-hoc模式:命令行批量管理(使用ans模块),临时任务.playbook剧本模式:类似于把操作写出脚......
Ack集群Pod独占EIP实践
1.背景某线上应用部署在ack集群内，用于根据用户定义的http请求项配置，周期性检查http接口的请求响应状态，接口地址为内网或公网，当接口地址为公网时，频繁出现请求超时的报警错误。经过排查发现，在公网请求发生超时的时刻，集群vpcNAT带宽达到上限200Mbps，也就是25MB/s分析：由于集群占用......
第四节：MySQL主从集群搭建、扩容与数据迁移、半同步复制详解
一. 二. 三. !作者:Yaopengfei(姚鹏飞)博客地址:http://www.cnblogs.com/yaopengfei/声明1:如有错误，欢迎讨论，请勿谩骂^_^。声明2:原创博客请在转载......
Dolphinscheduler-3.2.0集群部署安装
一、下载二进制安装包集群配置主机名IP部署服务hadoop101192.168.12.101MasterServer、WorkServer、ApiServer、AlertServerhadoop102192.168.12.102WorkServerhadoop103192.168.12.103WorkServer 二、配置环境1. 2. 3. 4.#Licensedto......
【转载】高可用（HA）集群之pacemaker+corosync
转载地址：https://blog.51cto.com/liheng1815/5637598高可用（HA）集群之pacemaker+corosync方案 0x00 概念在传统Linux集群种类中，主要分了三类：一类是LB（负载均衡）集群，这类集群的作用是对用户流量做负载均衡，让其后端每个real-server都能均衡的处理一部分请求；其次就是HA（高......
搭建k8s集群完整版本
搭建k8s集群完整版基础设置设置主机ipnmcliconaddifnameens33con-nameens33autoconnectyestypeethernetnmcliconmodifyens33ipv4.methodmanualipv4.dns114.114.114.114ipv4.addresses192.168.109.102/24ipv4.gateway192.168.109.2修改主机名hostname......