Hadoop基础及安装

时间：2024-07-01 09:30:55浏览次数：20

标签：基础 Hadoop yarn HADOOP HOME home hadoop 安装

Hadoop基础

了解hadoop

我们生活在一个数据大爆炸的时代，数据飞速的增长，急需解决海量数据的存储和计算问题

Hadoop适合海量数据分布式存储和分布式计算

Hadoop的作者是Doug Cutting, Hadoop这个名字是他的孩子给他的毛绒象玩具起的名字

Hadoop3.x的细节优化

Hadoop三大核心组件介绍

Hadoop主要包含三大组件：HDFS + MapReduce+YARN

HDFS负责海量数据的份布式存储

MapReduce是一个计算模型，负责海量数据的分布式计算

YARN主要负责集群资源的管理和调试

伪分布集群

分布式集群

Hadoop安装

配置文件修改

需使用notepad++配合插件nppftp修改

hadoop-env.sh

需要自行创建目录：/home/data/logs

export JAVA_HOME=/home/softwares/jdk

export HADOOP_LOG_DIR=/home/data/logs

hdfs-site

<name>dfs.replication</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>bigdata01:50090</value>

</property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

</configuration>

mapred-site

<name>mapreduce.framework.name</name>

</property>

<!--

<name>mapreduce.job.tracker</name>

<value>hdfs://bigdata01:8001</value>

</property>

-->

</configuration>

yarn-site

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.env-whitelist</name>

<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>bigdata01</value>

</property>

<name>yarn.log-aggregation-enable</name>

</property>

<name>yarn.log.server.url</name>

<value>http://bigdata01:19888/jobhistory/logs</value>

</property>

</configuration>

etcprofile

export JAVA_HOME=/home/softwares/jdk

export HADOOP_HOME=/home/softwares/hadoop

export ZOOKEEPER_HOME=/home/softwares/zookeeper

export HIVE_HOME=/home/softwares/hive

export JRE_HOME=$JAVA_HOME/jre

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin:$HIVE_HOME/bin

export PATH=$PATH:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin

core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://bigdata01:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/softwares/hadoop/data/tmp</value>

</property>

<name>fs.trash.interval</name>

</property>

<name>hadoop.proxyuser.root.hosts</name>

</property>

<name>hadoop.proxyuser.root.groups</name>

</property>

</configuration>

workers

bigdata02

bigdata03

备注：此处为workers，不是workers.sh !!

修改启动脚本

修改 start-dfs.sh ， stop-dfs.sh 这两个脚本文件，在文件前面增加如下内容

HDFS_DATANODE_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

修改 start-yarn.sh ， stop-yarn.sh 这两个脚本文件，在文件前面增加如下内容

YARN_RESOURCEMANAGER_USER=root

HADOOP_SECURE_DN_USER=yarn

YARN_NODEMANAGER_USER=root

把bigdata01节点上将修改好配置的安装包拷贝到其他两个从节点

cd /home/softwares/

scp -rq hadoop bigdata02:/home/softwares/

scp -rq hadoop bigdata03:/home/softwares/

Hadoop操作

格式化hdfs

hdfs namenode -format

启动集群

start-all.sh

验证

jps

停止

stop-all.sh

标签：基础,Hadoop,yarn,HADOOP,HOME,home,hadoop,安装
From： https://blog.csdn.net/qq_36922376/article/details/140091666

Hive基础及安装
Hive基础了解HiveHive就像一个超级聪明的图书管理员，它住在一个很大的图书馆里（这个图书馆就是Hadoop），能帮助人们找到他们想要的信息。它用一种特别的语言（HiveSQL）来理解人们的问题，然后帮他们找到答案。但是，Hive不擅长做那些需要立刻回答的问题，它更喜欢帮助人们处理很多信息，然......
sqli-labs基础篇（1-22）
‍less-1字符型判断是否存在sql注入?id=1and1=1--+?id=1'and1=1--+?id=1'and1=2--+说明存在sql注入，并且注入类型为字符型注入联合注入先判断列数?id=1'orderby3--+有回显?id=1'order......
3分钟手把手教Parallels Desktop for Mac 19中文破解版安装激活图文教程
ParallelsDesktopforMac 19专为最新的Apple硬件和最新版macOS14Ventura设计，改进了基于ARM运行的Windows11的兼容性并始终保持最新状态，让用户能够不间断地完成更多工作。据介绍，Parallels最新版本旨在优化最新Apple硬件的可用性，同时还支持性能和游戏更新，为用......
服务器硬件基础知识
服务器硬件基础知识涵盖了多个核心组件，这些组件共同协作，确保服务器的稳定运行和高性能。以下是对服务器硬件基础知识的详细说明：一、主要硬件组件中央处理器（CPU）功能：执行计算和处理数据。重要因素：核心数、频率、缓存大小。厂商：Intel、AMD等。说明：CPU是服务器的“大脑”，负责处......
小程序开发基础(一)
今天学习下微信小程序,打算做一个界面出来来实现我的物联网功能,首先了解下微信小程序都有哪些基础组件和相应的控件。首先需要清楚的背景知识:每一个组件都是由index.jsindex.jsonindex.wxmlindex.wxss四个文件组成，但是其中若是Canvas种类的插件还不太一样，后面会详细介绍。......
C++基础语法——《循环结构》题解
循环结构参考资料：https://blog.csdn.net/m0_56945138/article/details/118929416需要掌握：1.for循环用法2.while循环用法3.continue跳过和break终止题号题目名称题解链接3067输出范围内的整数https://www.cnblogs.com/jyssh/p/182740551206简单的累加https://www......
什么是未授权访问漏洞？Hadoop & Redis靶场实战——Vulfocus服务攻防
什么是未授权访问漏洞？Hadoop&Redis靶场实战——Vulfocus服务攻防一、介绍未授权访问，也称为未经授权的访问或非法访问，是指在没有得到适当权限或授权的情况下，个人或系统访问了网络、计算机、数据库、文件、应用程序或其他受保护资源的行为。这种访问可能出于恶意或非恶意的目......
文件的基础
1、定义文件：一组相关数据的有序集合。文件名：这个数据集合的名称。2、文件类型Linux上一切皆文件常规文件:-}ASCII码文件}二进制的文件目录:d字符设备:c块设备:b有名管道:p套接口:s符号链接:l3、系统调用和库函数系统调用用户空间进程访问内核的接口把......
Tesseract-OCR下载和安装
原文连接：https://blog.csdn.net/qq_43317529/article/details/83340739 Tesseract，一款由HP实验室开发由Google维护的开源OCR（OpticalCharacterRecognition,光学字符识别）引擎，与MicrosoftOfficeDocumentImaging（MODI）相比，我们可以不断的训练的库，使图像转换文......
HarmonyOS应用开发者基础认证，Next版本发布后最新题库
笔者会尽量找到答案的出处，力求答案准确无误。有些题目答案可能有错，也有一些笔者实在找不到出处，也不知道答案的，如果读者发现错误或有补充建议，欢迎评论或私信笔者。您的每一条反馈都是宝贵的，能够帮助笔者不断完善这篇文章，也能让下一个看到这篇文章的读者，从中获得更加丰富和准......

Hadoop基础及安装

Hadoop基础

了解hadoop

我们生活在一个数据大爆炸的时代，数据飞速的增长，急需解决海量数据的存储和计算问题

Hadoop适合海量数据分布式存储和分布式计算

Hadoop的作者是Doug Cutting, Hadoop这个名字是他的孩子给他的毛绒象玩具起的名字

Hadoop3.x的细节优化

Hadoop三大核心组件介绍

Hadoop主要包含三大组件：HDFS + MapReduce+YARN

HDFS负责海量数据的份布式存储

MapReduce是一个计算模型，负责海量数据的分布式计算

YARN主要负责集群资源的管理和调试

伪分布集群

分布式集群

Hadoop安装

配置文件修改

hadoop-env.sh

hdfs-site

mapred-site

yarn-site

etcprofile

core-site.xml

workers

修改启动脚本

把bigdata01节点上将修改好配置的安装包拷贝到其他两个从节点

Hadoop操作

格式化hdfs

启动集群

验证

停止

相关文章

赞助商

阅读排行

Hadoop基础及安装

Hadoop基础

了解hadoop

我们生活在一个数据大爆炸的时代，数据飞速的增长，急需解决海量数据的存储和计算问题

Hadoop适合海量数据 分布式存储 和 分布式计算

Hadoop的作者是Doug Cutting, Hadoop这个名字是他的孩子给他的毛绒象玩具起的名字

Hadoop3.x的细节优化

Hadoop三大核心组件介绍

Hadoop主要包含三大组件：HDFS + MapReduce+YARN

HDFS负责海量数据的份布式存储

MapReduce是一个计算模型，负责海量数据的 分布式计算

YARN主要负责 集群资源的管理和调试

伪分布集群

分布式集群

Hadoop安装

配置文件修改

hadoop-env.sh

hdfs-site

mapred-site

yarn-site

etcprofile

core-site.xml

workers

修改启动脚本

把bigdata01节点上将修改好配置的安装包拷贝到其他两个从节点

Hadoop操作

格式化hdfs

启动集群

验证

停止

相关文章

赞助商

阅读排行

Hadoop适合海量数据分布式存储和分布式计算

MapReduce是一个计算模型，负责海量数据的分布式计算

YARN主要负责集群资源的管理和调试