首页 > 其他分享 >hdfs目录上/tmp/hive空间资源过大问题

hdfs目录上/tmp/hive空间资源过大问题

时间:2023-06-06 11:05:26浏览次数:33  
标签:tmp hdfs lf hive serv ia

HDFS上tmp/hive空间资源占用过大的原因,有啥清理机制呢


Hive的临时目录是用来存放不同阶段的map/reduce任务的执行计划和中间结果的,如果Hive任务成功完成的话,临时文件会被自动清理,如果Hive任务被取消或者中断,那么这个任务的临时文件就会被遗留下来。

可以手动删除这些旧文件,但不要删除任务还未完成的临时文件。也可以通过 cron job来定期删除无效的临时文件。

另外,也可以通过配置hive.start.cleanup.scratchdir在每次启动Hive时自动清理,要注意如果配置了这个参数,重启Hive时会花比较长的时间清理临时文件。


在Cloudera manager -> Hive Service -> Configuration -> HiveServer2 Advanced Configuration Snippet (Safety Valve) for hive-site.xml; 中增加如下配置,并重启。


<property>

<name>hive.start.cleanup.scratchdir</name>

<value>true</value>

</property>

----
[hdfs@dsj-419-4t-02 ~]$ hadoop fs -du -h -s hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c

860.7 T 2.5 P hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c

[hdfs@dsj-419-4t-02 ~]$ hadoop fs -ls hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c

Found 5 items

drwx------ - lf_ia_serv supergroup 0 2017-12-06 17:38 hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c/_tmp_space.db

drwx------ - lf_ia_serv supergroup 0 2017-12-06 19:26 hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c/hive_2017-12-06_17-38-27_677_6012246427052471025-1

drwx------ - lf_ia_serv supergroup 0 2017-12-06 17:38 hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c/hive_2017-12-06_17-38-27_677_6012246427052471025-2

drwx------ - lf_ia_serv supergroup 0 2017-12-06 18:15 hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c/hive_2017-12-06_17-38-27_677_6012246427052471025-3

drwx------ - lf_ia_serv supergroup 0 2017-12-06 19:16 hdfs://beh/tmp/hive/lf_ia_serv/84badee0-2f5e-4601-a461-8acff632b85c/hive_2017-12-06_17-38-27_677_6012246427052471025-4



可以通过2017-12-06_17-38-27文件的时间戳在yarn applicaton页面去看一下是否还有这个时间段的query在运行,如果都已经完成了,就可以清理临时文件了。

标签:tmp,hdfs,lf,hive,serv,ia
From: https://blog.51cto.com/u_13119980/6422718

相关文章

  • hdfs中acl权限管理的简单实用
    1、背景在我们开发的过程中有这么一种场景,/projectA目录是hadoopdeploy用户创建的,他对这个目录有wrx权限,同时这个目录属于supergroup,在这个组中的用户也具有这个目录的wrx权限,对于其他人,不可访问这个目录。现在有这么一个特殊的用户root,我想root用户可以访问这个目录,在不修改......
  • HDFS Federation
    HDFSFederationHDFSFederationBackgroundMultipleNamenodes/NamespacesKeyBenefitsFederationConfigurationConfiguration:FormattingNamenodesUpgradingfromanolderreleaseandconfiguringfederationAddinganewNamenodetoanexistingHDFSclusterManaging......
  • 周期视图WeekArchiveView
    2023.6.4WeekArchiveView是在数据表筛选某个日期字段某年某周的所有的数据,总周数是将一年的总天数除以7所得的,数据默认以升序的方式排序显示,年份和周数的筛选范围都是由路由变量提供的在一年中,无论是平年还是闰年,一共有52周,而且每年同一个周数的日期是各不相同的。如果要对数据表......
  • MySQL 8错误日志出现"The table /home/work/mysql_3306/tmp/#sqla2b_298b06_4d is fu
    ##############    了解MySQL8.0.26的错误日志出现"Thetable /home/work/mysql_3306/tmp/#sqla2b_298b06_4disfu11!"的bug,暂时通过修改临时表的存储引擎为内存引擎解决  MySQL8.0.13开始引入新的临时内存表引擎TempTable,并将其作为内存中创建临时表的默认存储引擎。T......
  • 日期筛选视图-MonthArchiveView
    2023.6.3日期筛选视图是根据模型里的某个日期字段进行数据筛选的,然后将符合结果的数据以一定的形式显示在网页上。简单来说,在列表视图ListView或详细视图DetailView的基础上增加日期筛选所实现的视图类●MonthArchiveView是在数据表筛选某个日期字段某年某月的所有的数据,默认以升......
  • hive初识
    HIVE的认识:定义:hive是基于hadoop的数据仓库工具,将结构化的数据映射成一张表,提供sql查询功能,可以对数据提取,转化,加载,简而言之:查询和分析存储在hadoop大规模的数据工具,离线的大数据分析hive在hadoop的生态圈hive将存储在HDFS中的结构化数据文件映射成类似关系型数据库......
  • Spark集成Hive
    命令行集成Hive将hive中的hive-site.xml配置文件拷贝到spark配置文件目录下,仅需要以下内容<configuration><property><name>hive.metastore.warehouse.dir</name><value>/user/hive/warehouse</value></property><property><na......
  • python mitmproxy抓包库
    一.简介mitmproxy是一款用Python编写的支持HTTP(S)的中间人代理工具。它可以拦截、查看、修改、重放和保存HTTP/HTTPS流量,支持命令行界面和图形界面,可用于安全测试、网络调试、API开发和反向工程等场景。mitmproxy具有很高的灵活性和扩展性,可以通过插件机制进行定制化开发和功能......
  • MySQL 8错误日志出现"The table /home/work/mysql_3306/tmp/#sqla2b_298b06_4d is fu
    ##############    了解MySQL8.0.26的错误日志出现"Thetable /home/work/mysql_3306/tmp/#sqla2b_298b06_4disfu11!"的bug,暂时通过修改临时表的存储引擎为内存引擎解决  MySQL8.0.13开始引入新的临时内存表引擎TempTable,并将其作为内存中创建临时表的默认存......
  • hive - beeline命令行可以使用的命令
       beeline>!help!allExecutethespecifiedSQLagainstallthecurrentconnections!autocommitSetautocommitmodeonoroff!batchStartorexecuteabatchofstatements!briefSetverbosemodeoff......