首页 > 其他分享 >Hadoop三大组件之HDFS(二)

Hadoop三大组件之HDFS(二)

时间:2024-09-26 22:24:14浏览次数:9  
标签:username HDFS fs hadoop myfolder Hadoop user 三大

HDFS 常用操作命令

Hadoop 分布式文件系统 (HDFS) 提供了灵活且高效的文件管理方式,类似于 Linux 文件系统。本文将介绍常用的 HDFS 操作命令,帮助您更好地掌握 HDFS 的基本操作。

1. 查看 HDFS 内容

HDFS 的目录结构与 Linux 类似,顶层目录为 /

1.1 通过浏览器查看

可以通过以下 URL 在浏览器中查看 HDFS 内容:

http://<服务器IP>:50070 #低版本
http://<服务器IP>:9870 #高版本

详细端口区别可以查看本专栏hadoop第一篇内容

1.2 通过 HDFS 命令查看(hadoop fs 与 hdfs fs 完全相同)

  • 列出根目录内容:

    hadoop fs -ls /
    
  • 列出特定用户目录及其子目录:

    hadoop fs -ls -R /user/username
    

2. 管理 HDFS 文件系统

假设需要操作的 HDFS 路径为 /user/username

2.1 创建目录

  • 创建新目录:

    hadoop fs -mkdir -p /user/username/myfolder
    

    mkdir会在 /user/username 目录下创建一个名为 myfolder 的新目录。如果中间的路径不存在,-p 选项会确保所有必要的父目录都被创建

  • 创建空文件:

    hadoop fs -touchz /user/username/myfolder/emptyfile.txt
    

2.2 本地(正在操作的机器 如Linux)上传文件到 HDFS put

2.2.1 从本地移动文件到 HDFS
  • 剪切并粘贴文件:
    hadoop fs -moveFromLocal /home/user/localfile.txt /user/username/myfolder
    
2.2.2 从本地复制上传文件到 HDFS
  • 拷贝文件:
    hadoop fs -copyFromLocal sample.txt /user/username/myfolder
    
2.2.3 使用 put 上传文件 (常用)
  • 使用 put 命令上传文件,等同于copyFromLocal
    hadoop fs -put sample.txt /user/username/myfolder
    
2.2.4 追加文件到已存在的文件末尾
  • 可以使用 appendToFile 命令将本地文件的内容追加到已经存在的 HDFS 文件末尾。注意,此操作只支持将本地文件追加到 HDFS 文件,不能直接在 HDFS 文件之间追加内容。
    hadoop fs -appendToFile  new_data.txt /user/username/existing_file.txt
    

2.3 从 HDFS 下载文件到本地 get

2.3.1 从 HDFS 拷贝下载到本地
  • 拷贝文件到本地目录:
    hadoop fs -copyToLocal /user/username/myfolder/sample.txt  ./
    
2.3.2 使用 get 下载文件 (常用)
  • 使用 get命令下载文件,等同于copyToLocal
    hadoop fs -get /user/username/myfolder/anotherfile.txt  ./
    

3. HDFS 直接操作

3.1 显示文件内容

  • 显示文件内容:
    hadoop fs -cat /user/username/myfolder/sample.txt
    

3.2 修改文件权限

  • 修改文件权限(基本用不到):
    hadoop fs -chmod 755 /user/username/myfolder/sample.txt
    

3.3 拷贝文件

  • 拷贝文件到新位置:
    hadoop fs -cp /user/username/myfolder/sample.txt /user/username/myfolder/copy_sample.txt
    

3.4 移动文件

  • 移动或重命名文件:
    hadoop fs -mv /user/username/myfolder/sample.txt /user/username/myfolder/renamed_sample.txt
    

3.5 显示文件末尾内容

  • 显示文件的最后 1KB 数据:
    hadoop fs -tail /user/username/myfolder/anotherfile.txt
    

3.6 删除文件或文件夹

  • 删除文件:

    hadoop fs -rm /user/username/myfolder/oldfile.txt
    
  • 递归删除文件夹及其内容:

    hadoop fs -rm -r /user/username/myfolder/old_folder
    

    使用 -r 选项可以使 Hadoop 递归地检查该文件夹中的所有文件和子文件夹并将其一并删除。如果没有 -r 选项,Hadoop 将不会删除文件夹(即使文件夹为空),因为-rm只处理单个文件的删除,与Linux略有不同。

3.7 统计文件夹大小信息

  • 统计文件夹大小:
    hadoop fs -du -s -h /user/username/myfolder
    

标签:username,HDFS,fs,hadoop,myfolder,Hadoop,user,三大
From: https://blog.csdn.net/m0_58076578/article/details/142576534

相关文章

  • centos7通过Ambari2.74部署Hadoop
    一、前言服务器:建议第一台内存不少于16G,其他可以8G 软件版本:链接:https://pan.baidu.com/s/17GWF0opxYl0MIm2LJNUGRg?pwd=iq4l提取码:iq4l 二、部署前环境准备以下操作在所有机器上执行1.配置host解析vim/etc/hosts10.0.0.138 hdp01.ambari.com hdp0110.0.0.139 hdp02.ambari.c......
  • centos7编译安装Hadoop3
    一、安装编译相关依赖此篇文档及Hadoop相关文档相关软件包统一在此百度网盘:链接:https://pan.baidu.com/s/11F4THdIfgrULMn2gNcObRA?pwd=cjllyuminstallsnappysnappy-develbzip2bzip2-devellzolzo-devellzoplibXtstlzo-develzlib-developensslopenssl-develncurse......
  • centos7二进制安装Hadoop3
    一、Hadoop简介1.1Hadoop3核心组件HDFS:分布式文件系统:解决海量数据存储YARN:集群资源管理和任务调度框架:解决资源任务调度MapReduce:分布式计算框架:解决海量数据计算1.2Hadoop集群简介Hadoop集群包括两个集群:HDFSYARN两个集群逻辑上分离(互不影响、互不依赖)物理上一......
  • HDFS NAMENODE 安全模式
    一、安全模式现象探究1.1 关闭所有服务,使用命令单独启动服务使用hdfs--daemon命令逐个进程启动集群,观察现象1.首先启动namenodestop-all.shjpshdfs--daemonstartnamenodejpshadoopfs-ls/#使用ls浏览时正常显示hadoopfs-cat/test.txt#使用cat查看数......
  • HDFS数据(跨集群)迁移
    一、数据迁移使用场景1.冷热集群数据同步、分类存储2.整体数据整体搬迁3.数据准实时同步(备份)二、考量因素1.网络传输带宽及时间,是否会影响现有业务2.性能,单机?多线程?分布式?3.是否正常增量同步4.数据迁移的同步性(同步单位时间数据超过单位时间)三、DistCp工具使用3.1简介dis......
  • HDFS优化方案
    一、短路本地读取(ShortCircuitLocalReads)1.1 背景在HDFS中,不管是LocalReads(DFSClient和Datanode在同一个节点)还是RemoteReads(DFSClient和Datanode不在同一个节点),底层处理方式都是一样的,都是先由Datanode读取数据,然后再通过RPC(基于TCP)把数据传给DFSClient。这样......
  • HDFS 节点动态管理
    一、节点上线1.新机器安装环境准备参考集群安装文档环境准备2.namenode节点配置[root@hdp01hadoop]#catworkershdp01.dialev.comhdp02.dialev.comhdp03.dialev.comhdp04.dialev.com[root@hdp01hadoop]#pwd/usr/local/hadoop/etc/hadoop[root@hdp01hadoop]#cd/us......
  • Hadoop高可用集群搭建
    一、HDFSHA简介1.1 QJM简介1.QuorumJournalManager(仲裁日志管理器),是Hadoop官方推荐的HDFSHA解决方案之一2.使用zookeeper中ZKFC来实现主备切换;3.使用JournalNode(JN)集群实现editslog的共享以达到数据同步的目的1.2主备切换问题解决方案--ZKFailoverController(zkfc)ZKFailo......
  • HDFS数据安全与隐私保护
    一、HDFSTrash垃圾桶1.文件系统垃圾桶背景HDFS本身也是一个文件系统,那么就会涉及到文件数据的删除操作。默认情况下,HDFS中是没有回收站垃圾桶概念的,删除操作的数据将会被直接删除,没有后悔药。2.功能概述1.HDFSTrash机制,叫做回收站或者垃圾桶。Trash就像Windows操作系统中的回收......
  • centos7通过CDH部署Hadoop
    一、角色分配及安装环境准备资料下载地址:链接:百度网盘1.机器及机器角色规划2.关闭防火墙及SELinux3.安装依赖(server)redhat-lsb-core4.配置hosts解析192.168.1.136hadoop01192.168.1.137hadoop02192.168.1.138hadoop035.配置ClouderaManageryum仓库(server)#服务端配置y......