首页 > 其他分享 >HDFS存储小文件的危害以及解决小文件问题的方法

HDFS存储小文件的危害以及解决小文件问题的方法

时间:2022-12-04 15:44:21浏览次数:38  
标签:文件 存储 阈值 HDFS 危害 datanode

HDFS存储小文件的危害以及解决小文件问题的方法:

危害:

  •   如果有大量的小文件的存在,存放的文件数目过多的话会占用很大的内存,甚至撑爆内存。
  •   hdfs使用于高吞吐量,不适合低时间延迟的访问,如果同时存入大量的小文件会花费很长的使时间。hive后者spark计算的时候会影响他们的速度。
  •   访问小文件,则必须从一个datanode跳转到另一个datanode,这样大大降低了读取性能。

 

解决方案:

  1.   生产上设置小文件的阈值,到达阈值就对小文件进行合并。
  2.   多Master设计,让元数据散存到不同的NameNode中。

标签:文件,存储,阈值,HDFS,危害,datanode
From: https://www.cnblogs.com/LXLwantwin/p/16949934.html

相关文章

  • Qt音视频开发04-保存音频文件(pcm/wav/aac)
    一、前言音频的保存相对来说比视频的要简单,具有通用性,不需要经过ffmpeg的编码,ffmpeg解码出来后一般会转换成pcm原始的数据用来播放,所以对数据直接写文件即可,但是这种格式......
  • sqlserver存储过程
    ref:https://blog.csdn.net/weixin_55909413/article/details/114767079https://blog.csdn.net/h610443955/article/details/83185528......
  • Android Studio 生成 keystore 签名文件及打包验证流程
    前言Android应用必须进行数字签名才可以发布,也就是我们平时所说的使用证书打包然后上传市场,其中数字证书的私钥由应用开发者持有。生成签名的方式有很多种,今天我们来讲......
  • # yyds干货盘点 # 盘点一个批量提取pdf文件目标信息的实用案例
    大家好,我是皮皮。一、前言前几天在帮助粉丝解决问题的时候,遇到一个简单的小需求,需要批量提取​​pdf​​文件目标信息,这里拿出来跟大家一起分享,后面再次遇到的时候,可以从这......
  • nginx在windows平台下使用文本编辑器修改配置文件引发的错误
    一、起因最近在使用nginx在windows平台上部署vue,但是使用Windows平台的文本编辑器修改了之后,就会导致错误,打开log日志,查看错误的时候,发现它提示第三行配置出错,死活找不到......
  • 盘点一个批量提取pdf文件目标信息的实用案例
    大家好,我是皮皮。一、前言前几天在帮助粉丝解决问题的时候,遇到一个简单的小需求,需要批量提取pdf文件目标信息,这里拿出来跟大家一起分享,后面再次遇到的时候,可以从这里得到......
  • DHorse的配置文件
    首先看一下DHorse的配置文件,如下:#====================================================================================================#本软件遵守Apache开源许......
  • 使用socketserver实现文件下载
    服务端server.pyimportosimportjsonimportstructimportsocketserverclassMyServer(socketserver.BaseRequestHandler):#重写handle消息的方法def......
  • H5文件保存为TIFF
    上周一个朋友拜托我帮它处理下遥感数据,拿到手一看,发现文件格式.h5,但是以往接触的遥感数据格式基本为.tif,带着好奇上网查了一下,维基百科对它的解释:HDF:层级数据格式(Hiera......
  • 手写shell脚本批量修改文件名
    作为前端开发,还原设计稿的同时,还要经常导出素材。某次活动需求上线前需要替换素材30张,导出时文件名如图,上传cdn时,需要重命名。如果一张张手动重命名,麻烦又耗时。于是想到......