首页 > 其他分享 >统计HDFS中文件数量、大小、以及在某范围大小的文件数量

统计HDFS中文件数量、大小、以及在某范围大小的文件数量

时间:2024-08-08 18:24:21浏览次数:13  
标签:文件 rw HDFS hdfs -- dfs ls 大小

说明:统计HDFS文件数量大小,小于20M文件数量

1、HDFS 相关命令

# 统计文件大小
hdfs dfs -du -h / 

# 统计文件数量,返回的数据是目录个数,文件个数,文件总计大小,输入路径
hdfs dfs -count / 

#统计所有文件的信息,过滤文件夹, 只统计文件,因为使用-ls -R 之后,可以看到文件是”-“开头,文件夹是”d”开头
hdfs dfs -ls -R /path/data | grep ^- > /data.txt

可见,文件是”-“开头,文件夹是”d”开头:

2、取一些测试数据

使用:hdfs dfs -ls -R / |grep ^-

数据保存在 data.txt 文件中;

-rw-r--r--   3 root            supergroup          0 2018-08-31 10:36 /tmp/azkaban/mutiTest_3_1/_SUCCESS
-rw-r--r--   3 root            supergroup      70514 2018-08-31 10:36 /tmp/azkaban/mutiTest_3_1/part-00000-c-88980650a164-c000.snappy.parquet
-rw-r--r--   3 root            supergroup

标签:文件,rw,HDFS,hdfs,--,dfs,ls,大小
From: https://blog.csdn.net/weixin_43566162/article/details/140904772

相关文章

  • 系统编程 day5 文件4
    函数time(time_t*tloc),返回值为time_t;可以读取秒数函数ctime(consttime_t*timep),返回值为获得时间字符串首地址,char*可以将秒数转化为年月日时分秒函数localtime structtm*tm_info=localtime(&tm);返回本地实时时间命令函数:软链接函数symlink(传参:被链接,新链接);返......
  • Linux文件/目录权限管理
    系列文章目录`提示:仅用于个人学习,进行查漏补缺使用。1.Linux介绍、目录结构、文件基本属性、Shell2.Linux常用命令3.Linux文件管理4.Linux命令安装(rpm、install)5.Linux账号管理提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文......
  • 【大小球让球实战】——深度剖析足球大小球数据分析软件,找到一个临界点,把准确率提高到
    最近在跟一些圈内朋友聊天,发现每个人都有一套自己的玩球逻辑,比如有些人看亚盘,有些看欧盘,有些玩绝杀,有些看盘口,是否可以自定义的去玩球?结合多年的经验,把分析的过程大概写了一下。数据爬取采集汇聚全球各大足球赛事的即时比赛数据。从进球瞬间到红黄牌警告,每一刻赛场动态......
  • 英雄联盟d3dx9_39.dll丢失怎么修复?lol缺少dll文件的解决方法
    在享受《英雄联盟》(LeagueofLegends)的战斗之旅时,偶尔会遇到诸如“d3dx9_39.dll丢失”这样的错误提示,这可能会导致游戏无法启动。不要担心,这是一个相对常见的问题,通常与DirectX组件有关。以下是几种简单而有效的修复方法,一起来看看。1.使用DLL修复工具首先,下载DLL修复软......
  • 如何在python中使用jdbc jar文件连接informix数据库
    有什么想法如何使用jdbcjar文件连接到informix数据库吗?在python我尝试了jaydebeapi,当我执行时:conn=jaydebeapi.connect('com.informix.jdbc.IfxDriver',myurl,['user','pass'],jdbc_driver_path)...然后从表中选择数据的其余代码当我执行myscript.py它只......
  • R语言读取和修改 fcs文件
    记住要从上往下一个一个包的安装,已经安装了的就不用安装,如果就是读取和修改fcs文件,只需要安装flowCore包就可以了。if(!requireNamespace("BiocManager",quietly=TRUE))install.packages("BiocManager")##数据源:BiocManager::install("flowWorkspaceData")##数据......
  • 利用vscode-icons-js在Vue3项目中实现文件图标展示
    背景:在开发文件管理系统或类似的项目时,我们常常需要根据文件类型展示对应的文件图标,这样可以提高用户体验。本文将介绍如何在Vue3项目中利用vscode-icons-js库,实现类似VSCode的文件图标展示效果。先看效果:一、引入vscode-icons-js首先,我们需要安装vscode-icons-js库。......
  • vs生成事件中创建xml -bat取版本号写文件
      setfile=update.xmlsetver=0.0.0.0seturl=http://172.16.17.97:8999echo^<?xmlversion="1.0"encoding="utf-8"?^>>%file%echo^<item^>>>%file%rem这里读取exe的版本号到临时再转格式再输出到%file%wmicdatafilewhereName=$......
  • .Net5+的应用配置文件
    在VisualStudio项目中,”.exe.config”文件(也称为应用程序配置文件)和清单文件(manifestfile)是两个不同的文件类型,分别用于不同的目的。以下是它们的主要区别和用途:应用程序配置文件(”.exe.config”)1.目的应用程序配置文件用于存储应用程序的可配置设置,如数据库连接字符串、应......
  • C#开发的应用的应用配置文件
    注意:.netcore和.net5+为appsettings.json一、应用配置文件在C#应用程序中,`.exe.config`文件(通常称为应用程序配置文件)是一个XML文件,用于存储应用程序的配置设置。这些设置可以包括数据库连接字符串、应用程序特定的设置、外部库的配置等。配置文件的名称通常与应用程序的可执行......