首页 > 其他分享 >hadoop伪分布式集群的安装(不是单机版)

hadoop伪分布式集群的安装(不是单机版)

时间:2023-04-14 15:45:30浏览次数:36  
标签:单机版 hadoop dfs sh master yarn address 分布式

准备工作

三台虚拟机,关闭防火墙,关闭selinux

查看防火状态 systemctl status firewalld

暂时关闭防火墙 systemctl stop firewalld

永久关闭防火墙 systemctl disable firewalld

查看 selinux状态 getenforce

暂时关闭 selinux setenforce 0

永久关闭 selinux 在/etc/selinux/config文件中将SELINUX改为disabled

 

修改主机名称

三台主机

hostnamectl set-hostname master
hostnamectl set-hostname slave1
hostnamectl set-hostname slave2

使用bash命令刷新生效

在/etc/hosts文件中添加ip映射

IP+主机名称

根据自己需求修改,这里给出模板

 

 

 

配置ssh免密登录

 

ssh-keygten -t rsa   #生成密钥

ssh-copy-id master  #分发给其他节点,分发给自己主要是为了之后群集集群不需要输入密码
ssh-copy-id slave1
ssh-copy-id slave2

安装JAVA和HADOOP

解压JAVA

 

 解压HADOOP

 

 修改名称为jdk与hadoop

 

 配置环境变量

 

 

 刷新环境变量,使生效

source /etc/profile

使用javac  与hadoop verison验证是否安装成功

配置hadoop文件

core-site.xml文件


<!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop:9000</value>
</property>


<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/src/hadoop-2.7.2/data/tmp</value>
</property>

 

hdfs-site.xml


<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/home/hadoop/hadoop-2.6.0/hdfs/name</value>
<final>true</final>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/home/hadoop/hadoop-2.6.0/hdfs/data</value>
<final>true</final>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9001</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

 

yarn.site.xml


<property>
<name>yarn.resourcemanager.address</name>
<value>master:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:18141</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

 

mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

在hadoop-env.sh yarn-env.sh  mapred-env.sh中配置java环境

 

 这里给出hadoop-env.sh 其他相同

配置slave

写入三台主机的主机名

 

 将配置好的hadoop分发给其他主机

[root@master ~]# scp -r /usr/local/src/hadoop/ root@slave1:/usr/local/src/

[root@master ~]# scp -r /usr/local/src/hadoop/ root@slave2:/usr/local/src/

格式化namenode

hdfs namenode -format

启动dfs

start-dfs.sh

启动yarn

start-yarn.sh

使用jps查看

master节点:ResourceManager,DataNode,SecondaryNameNode,NameNode,NodeManager

slave1节点与slave2节点:NodeManager,DataNode

集群全部启动则为启动成功

进入web页面验证

namenode  web页面 = IP+50070

yarn  web页面 =IP 8088

 

标签:单机版,hadoop,dfs,sh,master,yarn,address,分布式
From: https://www.cnblogs.com/gudeman/p/17318436.html

相关文章

  • MATLAB代码:基于多目标遗传算法的分布式电源选址定容研究
    MATLAB代码:基于多目标遗传算法的分布式电源选址定容研究关键词:分布式电源选址定容多目标遗传算法  参考文档:《店主自写文档》基本复现;仿真平台:MATLAB主要内容:代码主要做的是基于多目标遗传算法的分布式电源选址定容模型,首先构建了含义分布式电源的配电网基本结构,对分布......
  • 06-分布式数据库
    一、引入ShardingSphere(一)分库分表理论和解决方案​1、对于IM聊天记录的存储的选型:​关系型数据库仍然是业务数据基石,因为关系型数据存有稳定性、可靠性和事务性的优势​但是如果用关系型数据库,就会存在单表容量问题:如MySQL单表千......
  • 分布式能源接入分析matlab 通过分布式能源的选址定容确定得到帕累托最优解集
    分布式能源接入分析matlab通过分布式能源的选址定容确定得到帕累托最优解集,然后选择最优值进行分析,模型为双层模型,程序采用改进粒子群算法ID:33180639056410504......
  • 考虑过网费用分摊的多产消者点对点能源交易分布式优化
    考虑过网费用分摊的多产消者点对点能源交易分布式优化摘要:代码主要做的是配电网中产消者点对点交易相关研究,配网中的卖方和买方通过P2P交易匹配协商来平衡供需,同时重点考虑了P2P交易过程中公共设施的使用以及过网费用的分配问题,并等效将其叠加到P2P交易成本上,从而影响P2P交易的定......
  • 基于ADMM算法的主从配电网分布式有功无功调度
    基于ADMM算法的主从配电网分布式有功无功调度摘要:代码主要做的是一个配电网分布式调度的问题,模型参考的是主动配电网的无功优化控制模型,在具体的配电网分区上与之有些许不同,具体看代码的注释,在完成配电网基本优化模型的构建后,参考文档2,构建了基于串行ADMM和并行ADMM算法的分布式......
  • zabbix分布式监控服务 安装与配置
     zabbix安装与配置一、什么是zabbix及优缺点 Zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 agent端:主机通过安装......
  • 分布式鲁棒优化matlab 提出含风&ndash;光&ndash;水&ndash;火多种能源的分布鲁棒动态最
    分布式鲁棒优化matlab编程语言:matlab+cplexgurobi针对大规模清洁能源接入电网引起的系统鲁棒性和经济性协调问题,提出含风–光–水–火多种能源的分布鲁棒动态最优潮流模型。采用分布鲁棒优化方法将风光不确定性描述为包含概率分布信息的模糊不确定集。将模糊不确定集构造为一......
  • 分布式电源优化配置 二阶锥 考虑配电网二阶锥模型,运行主体包括光伏、微燃机以及负荷,创
    分布式电源优化配置二阶锥编程方法:采用matlab+yalmip编程,cplex或gurobi作为求解器。主要内容:考虑配电网二阶锥模型,运行主体包括光伏、微燃机以及负荷,创新性考虑敏感负荷及加权电压支撑能力指标,约束条件考虑潮流约束、电压电流约束、分布式电源容量约束、微燃机出力约束和光伏功......
  • 分布式电源优化配置 33节点 以33节点为例,考虑配电网二阶锥模型,运行主体包括光伏、微燃
    分布式电源优化配置33节点编程方法:采用matlab+yalmip编程,cplex或gurobi作为求解器。主要内容:以33节点为例,考虑配电网二阶锥模型,运行主体包括光伏、微燃机以及负荷,创新性考虑敏感负荷及加权电压支撑能力指标,约束条件考虑潮流约束、电压电流约束、分布式电源容量约束、微燃机出力......
  • DG储能选址定容模型matlab 程序采用改进粒子群算法,考虑时序性得到分布式和储能的选址
    DG储能选址定容模型matlab程序采用改进粒子群算法,考虑时序性得到分布式和储能的选址定容模型,程序运行可靠YID:87140641990659957......