首页 > 其他分享 >Hadoop基础及安装

Hadoop基础及安装

时间:2024-07-01 09:30:55浏览次数:20  
标签:基础 Hadoop yarn HADOOP HOME home hadoop 安装

Hadoop基础

了解hadoop

我们生活在一个数据大爆炸的时代,数据飞速的增长,急需解决海量数据的存储和计算问题

Hadoop适合海量数据 分布式存储 和 分布式计算

Hadoop的作者是Doug Cutting, Hadoop这个名字是他的孩子给他的毛绒象玩具起的名字


Hadoop3.x的细节优化


Hadoop三大核心组件介绍

Hadoop主要包含三大组件:HDFS + MapReduce+YARN

HDFS负责海量数据的份布式存储

MapReduce是一个计算模型,负责海量数据的 分布式计算

YARN主要负责 集群资源的管理和调试


伪分布集群

分布式集群


Hadoop安装

配置文件修改

需使用notepad++配合插件nppftp修改

hadoop-env.sh

需要自行创建目录:/home/data/logs

export JAVA_HOME=/home/softwares/jdk

export HADOOP_LOG_DIR=/home/data/logs

hdfs-site

<configuration>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>bigdata01:50090</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

</configuration>

mapred-site

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<!--

<property>

<name>mapreduce.job.tracker</name>

<value>hdfs://bigdata01:8001</value>

<final>true</final>

</property>

-->

</configuration>

yarn-site

<configuration>

<!-- Site specific YARN configuration properties -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.env-whitelist</name>

<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>bigdata01</value>

</property>

<!--new add config-->

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.log.server.url</name>

<value>http://bigdata01:19888/jobhistory/logs</value>

</property>

</configuration>

etcprofile

export JAVA_HOME=/home/softwares/jdk

export HADOOP_HOME=/home/softwares/hadoop

export ZOOKEEPER_HOME=/home/softwares/zookeeper

export HIVE_HOME=/home/softwares/hive

export JRE_HOME=$JAVA_HOME/jre

export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin:$HIVE_HOME/bin

export PATH=$PATH:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin

core-site.xml

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://bigdata01:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/softwares/hadoop/data/tmp</value>

</property>

<property>

<name>fs.trash.interval</name>

<value>1440</value>

</property>

<property>

<name>hadoop.proxyuser.root.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.root.groups</name>

<value>*</value>

</property>

</configuration>

workers

bigdata02

bigdata03

备注:此处为workers,不是workers.sh !!

修改启动脚本

修改 start-dfs.sh , stop-dfs.sh 这两个脚本文件,在文件前面增加如下内容

HDFS_DATANODE_USER=root

HDFS_DATANODE_SECURE_USER=hdfs

HDFS_NAMENODE_USER=root

HDFS_SECONDARYNAMENODE_USER=root

修改 start-yarn.sh , stop-yarn.sh 这两个脚本文件,在文件前面增加如下内容

YARN_RESOURCEMANAGER_USER=root

HADOOP_SECURE_DN_USER=yarn

YARN_NODEMANAGER_USER=root

把bigdata01节点上将修改好配置的安装包拷贝到其他两个从节点

cd /home/softwares/

scp -rq hadoop bigdata02:/home/softwares/

scp -rq hadoop bigdata03:/home/softwares/


Hadoop操作

格式化hdfs

hdfs namenode -format

启动集群

start-all.sh

验证

jps

停止

stop-all.sh

标签:基础,Hadoop,yarn,HADOOP,HOME,home,hadoop,安装
From: https://blog.csdn.net/qq_36922376/article/details/140091666

相关文章

  • Hive基础及安装
    Hive基础了解HiveHive就像一个超级聪明的图书管理员,它住在一个很大的图书馆里(这个图书馆就是Hadoop),能帮助人们找到他们想要的信息。它用一种特别的语言(HiveSQL)来理解人们的问题,然后帮他们找到答案。但是,Hive不擅长做那些需要立刻回答的问题,它更喜欢帮助人们处理很多信息,然......
  • sqli-labs基础篇(1-22)
    ‍less-1字符型判断是否存在sql注入​?id=1and1=1--+​​​​?id=1'and1=1--+​​​​?id=1'and1=2--+​​​说明存在sql注入,并且注入类型为字符型注入联合注入先判断列数​?id=1'orderby3--+​有回显​​​?id=1'order......
  • 3分钟手把手教Parallels Desktop for Mac 19中文破解版安装激活图文教程
    ParallelsDesktopforMac 19专为最新的Apple硬件和最新版macOS14Ventura设计,改进了基于ARM运行的Windows11的兼容性并始终保持最新状态,让用户能够不间断地完成更多工作。据介绍,Parallels最新版本旨在优化最新Apple硬件的可用性,同时还支持性能和游戏更新,为用......
  • 服务器硬件基础知识
    服务器硬件基础知识涵盖了多个核心组件,这些组件共同协作,确保服务器的稳定运行和高性能。以下是对服务器硬件基础知识的详细说明:一、主要硬件组件中央处理器(CPU)功能:执行计算和处理数据。重要因素:核心数、频率、缓存大小。厂商:Intel、AMD等。说明:CPU是服务器的“大脑”,负责处......
  • 小程序开发基础(一)
    今天学习下微信小程序,打算做一个界面出来来实现我的物联网功能,首先了解下微信小程序都有哪些基础组件和相应的控件。首先需要清楚的背景知识:每一个组件都是由index.jsindex.jsonindex.wxmlindex.wxss四个文件组成,但是其中若是Canvas种类的插件还不太一样,后面会详细介绍。......
  • C++基础语法——《循环结构》题解
    循环结构参考资料:https://blog.csdn.net/m0_56945138/article/details/118929416需要掌握:1.for循环用法2.while循环用法3.continue跳过和break终止题号题目名称题解链接3067输出范围内的整数https://www.cnblogs.com/jyssh/p/182740551206简单的累加https://www......
  • 什么是未授权访问漏洞?Hadoop & Redis靶场实战——Vulfocus服务攻防
    什么是未授权访问漏洞?Hadoop&Redis靶场实战——Vulfocus服务攻防一、介绍未授权访问,也称为未经授权的访问或非法访问,是指在没有得到适当权限或授权的情况下,个人或系统访问了网络、计算机、数据库、文件、应用程序或其他受保护资源的行为。这种访问可能出于恶意或非恶意的目......
  • 文件的基础
    1、定义文件:一组相关数据的有序集合。文件名:这个数据集合的名称。2、文件类型Linux上一切皆文件常规文件:-}ASCII码文件}二进制的文件目录:d字符设备:c块设备:b有名管道:p套接口:s符号链接:l3、系统调用和库函数系统调用用户空间进程访问内核的接口把......
  • Tesseract-OCR下载和安装
    原文连接:https://blog.csdn.net/qq_43317529/article/details/83340739      Tesseract,一款由HP实验室开发由Google维护的开源OCR(OpticalCharacterRecognition,光学字符识别)引擎,与MicrosoftOfficeDocumentImaging(MODI)相比,我们可以不断的训练的库,使图像转换文......
  • HarmonyOS应用开发者基础认证,Next版本发布后最新题库
    笔者会尽量找到答案的出处,力求答案准确无误。有些题目答案可能有错,也有一些笔者实在找不到出处,也不知道答案的,如果读者发现错误或有补充建议,欢迎评论或私信笔者。您的每一条反馈都是宝贵的,能够帮助笔者不断完善这篇文章,也能让下一个看到这篇文章的读者,从中获得更加丰富和准......