首页 > 其他分享 >Hadoop-3.3.6分布式集群搭建步骤

Hadoop-3.3.6分布式集群搭建步骤

时间:2023-11-27 14:00:49浏览次数:35  
标签:xml hdfs 配置文件 default hadoop Hadoop 3.3 分布式

1.下载JDK8

Linux 安装Openjdk

2.下载Hadoop3.3.6

Hadoop 安装及环境变量配置

3.创建hadoop数据存储的目录

mkdir -p /opt/hadoop/tmp /opt/hadoop/hdfs/data /opt/hadoop/hdfs/name

4.配置hostname和host文件

hostnamectl set-hostname {hostName}
vim /etc/hosts
192.168.58.130  {hostName}
192.168.58.131  {hostName}
192.168.58.132  {hostName}

5.分布式集群搭建

1.集群部署规划

注意:

  • NameNode和SecondaryNameNode不要安装在用一台服务器上

  • ResourceManager也很消耗内存,不要和NameNode、SecondaryNameNode配置在同一台服务器上。

Hadoop02 Hadoop03 Hadoop04
HDFS NameNode、DataNode DataNode SecondaryNameNode、DataNode
YARN NodeManager ResourceManager、NodeManager NodeManager

2.配置文件说明

Hadoop配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认配置值时,才需要修改自定义配置文件,更改相应属性值。

1.默认配置文件
要获取的默认文件 文件存放在Hadoop的jar包中的位置
core-default.xml hadoop-common-3.3.6.jar/core-default.xml
hdfs-default.xml hadoop-hdfs-3.3.6.jar/hdfs-default.xml
yarn-default.xml hadoop-yarn-common-3.3.6.jar/yarn-default.xml
mapred-default.xml hadoop-mapreduce-client-core-3.3.6.jar/mapred-default.xml
2.自定义配置文件

core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml 四个配置存放在$HADOOP_HOME/etc/hadoop这个路径上,用户可以根据项目需求重新进行修改配置。

标签:xml,hdfs,配置文件,default,hadoop,Hadoop,3.3,分布式
From: https://www.cnblogs.com/fanqisoft/p/17859086.html

相关文章

  • 分布式锁-redis
    packageredis.clients.jedis;importjava.net.URI;importjavax.net.ssl.HostnameVerifier;importjavax.net.ssl.SSLParameters;importjavax.net.ssl.SSLSocketFactory;importorg.apache.commons.pool2.impl.GenericObjectPool;importorg.apache.commons.pool2.im......
  • Hadoop 环境变量配置
    1.下载https://hadoop.apache.org/releases.html2.环境变量配置在/etc/profile.d中配置1.新建hadoop.shvi/etc/profile.d/hadoop.shexportHADOOP_HOME=/usr/hadoop/hadoop-3.3.6exportPATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin2.授予文件执行权限chmodu+x/e......
  • 一、Hadoop概述与初步学习
    一、Hadoop的发展史 Google 爬取全球的网站,然后计算页面的PageRank 要解决网站的问题: a:这些网站怎么存放 b:这些网站应该怎么计算 发布了三篇论文 a:GFS(GoogleFileSystem) b:MapReduce(数据计算方法) c:BigTable-->HBase Dougcutting花费......
  • 科普:多领域分布式协同仿真
    分布式协同仿真是一种在分布式计算环境中进行协同工作的仿真方法。使用该方法进行协同仿真时,仿真任务将被分发到多个计算节点上,并且这些节点可以同时工作以模拟完整的系统行为。分布式协同仿真已被广泛应用于工程、科学和军事领域,以便更好地模拟和理解大规模和复杂系统的行为。分......
  • Hadoop第一天学习记录
    今天,我开始接触并学习Hadoop,一个分布式存储和计算框架,广泛应用于大数据处理和分析领域。为了方便记录和回顾,我将在这里详细记录下我第一天的学习内容和心得。首先,我了解了Hadoop的背景和基本概念。Hadoop起源于ApacheNutch项目,旨在构建一个分布式搜索引擎。然而,随着项目的演进,Hado......
  • 3高级篇--商城业务--压测--缓存--分布式锁
    高级篇--商城业务部分本笔记从谷粒商城的P141(性能测试)开始记录一、性能与压力测试​ 压力测试考察当前软硬件环境下系统所能承受的最大负荷并帮助找出系统瓶颈所在。压测都是为了系统在线上的处理能力和稳定性维持在一个标准范围内,做到心中有数。​ 使用压力测试,我们有希望......
  • 分布式通讯方式比较(RPC、RMI、JMS、WebService、TIBCO)
    在分布式服务框架中,最基本的问题就是网络服务间的远程通讯。根据计算机网络通讯的基本原理,网络服务间的通讯就是将数据流从一台PC传输到另一台PC,这一切都是基于网络传输协议与网络IO实现的。网络传输技术发展至今,我们常用的协议都是基于Socket而扩展出的传输协议,主要有HTTP、TCP、......
  • 利用 docker 实现JMeter分布式压测
    为什么需要分布式?在工作中经常需要对一些关键接口做高QPS的压测,JMeter是由Java语言开发,没创建一个线程(虚拟用户),JVM默认会为每个线程分配1M的堆栈内存空间。受限于单台试压机的配置很难实现太高的并发。所以,通过JMeter实现分布式,可以整合多台主机的硬件资源,实现同时对被测试接口......
  • 聊聊分布式 SQL 数据库Doris(四)
    FE层的架构都能在网上找到说明.但BE层的架构模式、一致性保障、与FE层之间的请求逻辑,数据传输逻辑等,我个人暂时没有找到相应的博客说明这些的。当然这些是我个人在学习与使用Doris过程中,对内部交互逻辑与实现感兴趣才有这些疑问.还好现在有GPT这类大模型,有了疑问,只要问题描述得......
  • keycloak~分布式缓存的使用
    keycloak目前提供了几种分布式缓存,我们自己的缓存,如果希望是分布式的,可以将缓存添加到以下几个缓存里即可actionTokensclientSessionsloginFailuresofflineClientSessionsofflineSessionssessionswork如果你希望自己开发分布式缓存,还是需要复杂的,需要配置,检查,获取远程......