首页 > 其他分享 >hadoop-3.1.1分布式搭建与常用命令

hadoop-3.1.1分布式搭建与常用命令

时间:2024-03-29 21:29:45浏览次数:15  
标签:文件 fs 配置文件 HDFS 常用命令 hadoop vim 3.1

一、准备工作

1.首先需要三台虚拟机: master 、 node1 、 node2 2.时间同步 ntpdate ntp.aliyun.com 3.调整时区 cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime  4.jdk1.8 java -version 5.修改主机名 三台分别执行 vim /etc/hostname 并将内容指定为对应的主机名 6.关闭防火墙: systemctl stop firewalld 名 查看防火墙状态: systemctl status firewalld 取消防火墙自启: systemctl disable firewalld 7.静态IP 配置 直接使用图形化界面配置(不推荐) 手动编辑配置文件进行配置 (1)编辑网络配置文件 vim /etc/sysconfig/network-scripts/ifcfg-ens33 TYPE=Ethernet BOOTPROTO=static HWADDR=00:0C:29:E2:B8:F2 NAME=ens33 DEVICE=ens33 ONBOOT=yes IPADDR=192.168.190.100 GATEWAY=192.168.190.2 NETMASK=255.255.255.0 DNS1=192.168.190.2 DNS2=223.6.6.6 需要修改: HWADDR ( mac 地址 ,centos7 不需要手动指定 mac 地 址) IPADDR (根据自己的网段,自定义 IP 地址) GATEWAY (根据自己的网段填写对应的网关地址) (2)关闭 NetworkManager ,并取消开机自启 systemctl stop NetworkManager systemctl disable NetworkManager systemctl status NetworkManager (3)重启网络服务 systemctl restart network 8.免密登录 (1)生成密钥 ssh-keygen -t rsa (2)配置免密登录 ssh-copy-id master ssh-copy-id node1 ssh-copy-id node2 (3)测试免密登录 ssh node1 9.配置好映射文件: /etc/hosts 192.168.19.100 master 192.168.19.110 node1 192.168.19.120 node2

二、搭建Hadoop集群

在搭建之前,我们需要了解非高可用集群的分布情况:

  

去官网或者华为云镜像下载解压包

华为云镜像:https://mirrors.huaweicloud.com/apache/hadoop/common/hadoop-3.1.1/

(一)上传解压配置环境变量

1、解压

tar -xvf hadoop-3.1.1.tar.gz.gz

include文件夹存放一些第三方的东西,lib存放jar包 

2、配置环境变量

vim /etc/profile

#增加配置

export HADOOP_HOME=/usr/local/soft/hadoop-3.1.1
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

4.使环境变量生效

source /etc/profile

(二)修改配置文件

1、进入hadoop配置文件所在位置,修改hadoop配置文件
cd /usr/local/soft/hadoop-3.1.1/etc/hadoop

2、修改core-site.xml配置文件,在configuration中间增加配置

vim core-site.xml
# 增加配置
<configuration>
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://master:9000</value>
</property>
<property>
  <name>hadoop.tmp.dir</name>
  <value>/usr/local/soft/hadoop-3.1.1/tmp</value>
</property>
<property>
  <name>fs.trash.interval</name>
  <value>1440</value>
</property>
</configuration>

 

 3、修改hdfs-site.xml配置文件,在configuration中间增加配置


vim hdfs-site.xml
# 增加配置
<configuration>
<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>
<property>
  <name>dfs.permissions</name>
  <value>false</value>
</property>
</configuration>

4、修改yarn-site.xml配置文件,在configuration中间增加配置


vim yarn-site.xml
# 增加配置
<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>master</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>
<property>
  <name>yarn.log-aggregation-enable</name>
  <value>true</value>
</property>

5.vim mapred-site.xml


    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

    <property>  
        <name>mapreduce.jobhistory.address</name>  
        <value>master:10020</value>  
    </property>  

    <property>  
        <name>mapreduce.jobhistory.webapp.address</name>  
        <value>master:19888</value>  
    </property> 

6.修改hadoop-env.sh配置文件


vim hadoop-env.sh
# 增加配置
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home

 

7.修改hadoop-env.sh配置文件


vim workers

# 增加配置
node1
node2

8.修改hadoop-env.sh的文件

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

(三)初始化hdfs

hdfs namenode -format

 

(四)启动与停止hadoop以及ui页面

(1)启动hadoop
         start-all.sh

(2)停止hadoop
         stop-all.sh

(3)hdfs web ui
         http://master:9870

 

(4)yarn web ui
         http://master:8088

三.常用命令

1.创建文件夹

hadoop fs -mkdir [-p] <paths>

2.将Linux中的文件上传到HDFS文件系统中

hadoop fs -put [-f] [-p] [-l] [-d] [ - | <localsrc1> .. ]. <dst>

-p 保留访问和修改时间、权限

-f 覆盖目标文件

3.查看文件内容

hadoop fs -cat [-ignoreCrc] URI [URI ...]

4.复制文件到HDFS其他目录下

 hadoop fs -cp [-f] [-p | -p[topax]] URI [URI ...] <dest>

5.将HDFS的文件移动到HDFS其他目录下

hadoop fs -mv URI [URI ...] <dest>

6.强制删除文件或者文件夹

hadoop fs -rm -r -f 

-r 递归删除目录

-f 覆盖目标文件

7.将HDFS文件下载到Linux中

hadoop fs -get [-ignorecrc] [-crc] [-p] [-f] <src> <localdst>

8.用于将指定文件最后1K字节的内容输出到stdot,一般用于查看日志

hadoop fs -tail [-f]<file>

9.追加并合并文件内容

hadoop fs -appendToFile<localsrc> ... <dst>

10.修改权限

(1)改变文件的权限

         hadoop fs  -chmod [-R] PATH

(2)改变文件的拥有者或所属组

         hadoop fs -chown [-R] [OWNER]:[:[GROUP]] PATH

11.统计

(1)统计指定目录下的目录数,文件数,字节数

         hadoop fs -count [-h] <path>

          -h: 使用便于操作人员读取的单位信息格式

  (2)统计文件系统的容量,可用空间,已用空间信息

         hadoop fs -df [-h] <path>

  (3)显示指定目录下所有文件和文件夹的大小,或者当只指定一个文件时,显示此文件的大小

          fs -du [-s] [-h] <path>

         -s:不显示指定目录下每个单独文件的大小,只统计目录所占用空间的总大小

         -h: 使用便于操作人员读取的单位信息格式

12.改变HDFS中文件的副本数

     hadoop fs -setrep [-R] <rep> <path>

     -R :用于递归改变指定目录下所有文件的副本系数

标签:文件,fs,配置文件,HDFS,常用命令,hadoop,vim,3.1
From: https://blog.csdn.net/weixin_52134189/article/details/137118864

相关文章

  • oracle常用命令
    1.修改监听器配置在Oracle数据库中,监听器是一个非常重要的组件,其负责监听外部的请求并将其分发到相应的实例中。当无法远程登录时,我们需要检查监听器的配置。2.在终端中输入以下命令,打开监听器配置文件:$cd$ORACLE_HOME/network/admin$vilistener.ora在文件中修改以下参......
  • KubeSphere 社区双周报|2024.03.15-03.29
    KubeSphere社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过commit的贡献者,并对近期重要的PR进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。本次双周报涵盖时间为:2024.03.15-03.29。贡献者名单新晋KubeSpherecontribut......
  • ubuntu使用-ubuntu23.10安装qemu
    ubuntu使用-ubuntu23.10安装qemuubuntuqemu虚拟化在ubuntu23.10上安装qemu,希望后面可以创建一个arm的虚拟机。sudoaptinstallqemu-kvmlibvirt-daemon-systemlibvirt-clientsbridge-utilsvirtinstvirt-manager这就可以了。......
  • 【docker常用命令系列】Docker save语法用法示例详解
    【docker常用命令系列】Dockersave语法用法示例详解源自专栏《docker常用命令系列目录导航?》文章目录[【docker常用命令系列】Dockersave语法用法示例详解](https://zhuanlan.zhihu.com/p/689619518/)概览用法别名选项示例参考链接概览dockerimagesav......
  • 面试题:为什么hadoop不适合存储小文件(1、从NN角度去 分析 2、DN角度分析 3、从MR角度分
    NN角度:小文件一旦很多,那么小文件的权限信息,文件大小信息,归属信息等信息就会跟着增加,每一个小文件都会产生这些信息,这些信息一旦多起来,那么NameNode的元数据就会变大,会导致元数据的大小超过小文件大小的总和,会增加NameNode的压力,有可能导致主节点崩溃,用户就无法通信了DN角度:小文件......
  • 云计算02笔记---远程连接服务ssh 以及cp mv rm cd mkdir echo 等Linux常用命令
    远程连接服务ssh语法格式:ssh用户名@ip地址【-p指定端口号】例如:[email protected]默认端口号:22修改端口号:vim/etc/ssh/sshd_config编辑其中一行#port22改为port2222删去了注释符号#且改变端口号拷贝命令cpcp位置1位置2从位置1复制到位置......
  • 云计算笔记03--配置yum源及下载nginx并上传项目至服务器(常用命令 lrzsz cat head tail
    配置yum源首先将系统自带的yum源进行备份cd/etc/yum.repos.d///进入到yum配置目录mkdirbackup//创建一个备份目录mv*.repobackup///将所有以.repo结尾的文件移动到备份目录中#阿里云的yum源网站:https://developer.aliyun.com/......
  • 6.Hadoop MapReduce
    6.1编辑WordCount.java创建wordcount测试目录 编辑WordCount.java输入下面代码:可以访问https://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html查看importjava.io.IOException;importjava.util.String......
  • 5.Hadoop HDFS 命令
    5.1启动HadoopMuti-NodeClusterstart-all.sh5.2创建与查看HDFS目录创建user目录:hadoopfs-mkdir/user创建user下hduser子目录:hadoopfs-mkdir/user/hduser创建hduser下test子目录:hadoopfs-mkdir/user/hduser/test查看之前创建的HDFS目录: 一次查看HDFS所有子目......
  • docker常用命令
    最后修改时间2024-03-28操作系统Linuxversion5.15.0-86-generic(buildd@lcy02-amd64-086)(gcc(Ubuntu11.4.0-1ubuntu1~22.04)11.4.0,GNUld(GNUBinutilsforUbuntu)2.38)#96-UbuntuSMPWedSep2008:23:49UTC2023一些docker常用指令查看镜像列表sudodocker......