首页 > 其他分享 >HDFS集群

HDFS集群

时间:2024-07-30 22:50:32浏览次数:14  
标签:HDFS hadoop datanode master namenode 集群 目录


一、上传hadoop安装包到hdp-01集群任一节点(master)

 

tar -zxvf 软件包 -C 指定安装文件夹


二、修改配置文件

1.指定Hadoop的默认文件系统为hdfs

2.指定hdfs的namenode节点为哪台机器

3.指定namenode软件存储元数据的本地目录

4.指定datanode软件存放文件块的本地目录

三、进入安装目录

cd etc/hadoop/
1.vi hadoop-env.sh

修改:

export JAVA_HOME=/root/apps/jdk # jdk 安装位置


2.vi core-site.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000/</value> #namenode设置成master
</property>
</configuration>
3.vi hdfs-site.xml

<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>/root/data/name</value> #存储元数据的本地目录
</property>



<property>
<name>dfs.datanode.data.dir</name>
<value>/root/data/data</value> #存放文件块的本地目录
</property>


#防止单点故障的配置
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>hdp1:50090</value>
</property>
</configuration>

4.配置Hadoop的环境变量 要运行hadoop的命令,需要在linux环境中配置HADOOP_HOME和PATH环境变量

vi /etc/profile

export HADOOP_HOME=/root/apps/hadoop-2.8.4 #hadoop 安装位置
export PATH=.:$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin


保存之后,别忘了 source /etc/profile使配置生效

5.把这台机器安装的Hadoop拷贝到其他机器

scp -r hadoop-2.4.8 hdp1:$PWD
四、初始化namenode的元数据目录

要在master上执行hadoop的一个命令来初始化namenode的元数据存储目录

hadoop namenode -format
创建一个全新的元数据存储目录
生成记录元数据的文件fsimage
生成集群的相关标识:如:集群id——clusterID
五、启动Hadoop

单独启动

hadoop-daemon.sh start namenode
启动完后,首先用jps查看一下namenode的进程是否存在

然后,在windows中用浏览器访问namenode提供的web端口:50070

http://master:50070

 

然后,启动众datanode们(在任意地方)

hadoop-daemon.sh start datanode

补充:

Namenode监听两个端口——9000(客户端和namenode交互);50070(namenode内置的服务器)

用自动批量启动脚本来启动HDFS

先配置master到集群中所有机器(包含自己)的免密登陆
配完免密后,可以执行一次 ssh 0.0.0.0
修改hadoop安装目录中/etc/hadoop/slaves(把需要启动datanode进程的节点列入)
vi slaves 加入节点名称

 

启动/停止

master上用脚本:start-dfs.sh 来自动启动整个集群
如果要停止,则用脚本:stop-dfs.sh
————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/laozaoxiaowanzi/article/details/112481516

标签:HDFS,hadoop,datanode,master,namenode,集群,目录
From: https://www.cnblogs.com/Christmas77/p/18333504

相关文章

  • DM-DSC集群配置
    DM-DSC集群配置 DMDSC概述DM共享存储数据库集群全称DMDataSharedCluster,简称DMDSCDMDSC特性DM共享存储数据库集群,允许多个数据库实例同时访问、操作同一数据库,具有高可用、高性能、负载均衡等特性。DMDSC支持故障自动切换和故障自动重加入,某一个数据库实例故障后......
  • 达梦数据库dm8版本Mpp集群原理系统架构和搭建测试
    达梦数据库dm8版本Mpp集群原理系统架构和搭建测试    当前主流的数据库系统架构有完全共享、共享存储、完全不共享和完全对等不共享几种。其中完全共享体系如SMP服务器,局限于单节点服务器,通常价格比较昂贵,其扩展性和性能受到相应的限制。共享存储体系允许系统......
  • 二进制部署k8s集群之cni网络插件flannel和calico工作原理(中)
    目录1.k8s的三种网络模式2.flannel网络插件3.部署CNI网络组件4.Calico介绍1.k8s的三种网络模式k8s集群中pod网络通信分类1、pod内容器之间的通信在同一个Pod内的容器(Pod内的容器是不会跨宿主机的)共享同一个网络命令空间,相当于它们在同一台机器上一样,可以用loc......
  • Docker中使用自定义网络方式实现Redis集群部署与测试流程
    场景Docker中Docker网络-理解Docker0与自定义网络的使用示例:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/140788458参考上面的流程实现自定义网络的实现。下面记录其应用实例,使用Docker的自定义网络实现redis集群部署。注:博客:https://blog.csdn.net/badao_......
  • 当我尝试在 flink 集群上运行 Beam Pipeline 时,为什么会出现 ERROR:root:java.lang.Nu
    我正在尝试在本地托管的Flink集群上运行一个简单的Beam管道,但在执行此操作时遇到错误。我已经尝试了在互联网上可以找到的所有内容。importapache_beamasbeamfromapache_beam.ioimportReadFromTextfromapache_beam.ioimportWriteToTextfromapache_beam.option......
  • Redis 集群
    Redis集群  Redis集群是Redis提供的分布式数据库方案,集群通过分片(sharding)来进行数据共享,并提供复制和故障转移功能。  下面会对集群的节点、槽指派、命令执行、重新分片、转向、故障转移、消息等各个方面进行介绍  一、节点  1.连接节点  一个Redis集群......
  • windows hbase连接工具 hbase连接数过多, yarn job HBase hdfs zookeper
    windowshbase连接工具hbase连接数过多##1.ZK连接过多1)查看ip连接数前十  登录后复制netstat-na|grep2181|awk'{print$5}'|awk-F:'{print$1}'|sort|uniq-c|sort-rn|head-n101.##2.补数操作登录后复制hbaseorg.apache.hadoop.hbase.mapreduce.Co......
  • RabbitMQ实战——rabbitmq高可用集群搭建
    本文详细介绍了如何在CentOS7系统上部署RabbitMQ高可用集群,包括安装ERlang和RabbitMQ服务器,设置Web客户端,配置主机名映射,同步cookie,加入和退出集群,以及使用镜像队列实现数据同步。摘要由CSDN通过智能技术生成前言本节内容是关于rabbitmq高可用集群的部署搭建,使用的是centos7系统,......
  • tidb集群部署
    ####################################################集群IP例子172.21.243.141172.21.243.69172.21.243.47172.21.243.33172.21.243.184172.21.243.64172.21.243.223机器配置我这边是7台机器,每台2c8g100g####################################################离线部署方......
  • Elasticsearch跨集群搜索
    Elasticsearch(简称ES)是一种基于Lucene的搜索引擎,以其高性能、可扩展性和实时搜索能力而广受欢迎。在大型分布式系统中,跨集群搜索成为了一个重要的需求,它允许用户从多个Elasticsearch集群中联合查询数据,以提高搜索效率和数据一致性。ES|QL(ElasticsearchQueryLanguage)作为一......