首页 > 系统相关 >用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑

时间:2022-10-29 22:00:09浏览次数:59  
标签:文件 shell logs 导致系统 echo 巧解 塞满 日志 arch

作者:田逸(formyz​)

出事了,十万火急

一帮可爱的程序员,写的程序没有规划,程序、代码与日志一锅粥,而且都在某云的系统盘,不光生成的文件多,而且不做处理。有一天,来了个十万火急的求救,告知弹性伸缩功能被触发,自动增加云主机到设定的最高值,但系统仍然不能访问,需要我马上解决。登上任意云主机系统,查进程、查负载、再查磁盘使用率,我的天,系统只有一个分区,大小为40G,使用率接近100%。没有空闲空间,系统往/var/log及/tmp里无法写入数据,导致服务不响应,负载均衡监控发现云主机整体异常,认为是容量不够,就自动扩容,但扩容出来的云主机,其磁盘空间也一样是塞满了的,所以….

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑_计划任务

故障排查及临时措施

因为磁盘塞满了,虽然登录进去了系统,但很多操作不能进行,最后在/tmp目录下删掉一些下文件,稍微给系统腾出了一些空间,才有幸把与业务相关的服务停止,用df配合du看看是什么文件占据了这么多的空间。

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑_重启_02

好家伙,居然有单个日志文件超过20G的,虽然日志文件多且大,据猜测,这些程序员可能压根都没有去看这些日志,也不知道产生日志有什么意义(不看不处理等于零)。不管三七二十一,先干掉几个大的文件,让服务恢复。​


终极办法

给日志分配单独的磁盘空间,并按约定的统一格式命名日志,每天夜里,做一次日志切割。具体做法是复制前一天的日志到另外一个位置,接着清空原来的日志;在归档日志目录,保留最近15天来的所有日志。​

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑_重启_03


有人问,直接清空服务,会丢失少部分日志记录,为啥不停服务,等日志归档完再重启?这个是因为需要重启的服务太多,数十个,可能存在自动启动不了的风险,并且丢失少许日志是他们可以接受的。​


需求明确以后,撰写了一个Shell脚本,内容如下:​

[root@s176 logs]# more /usr/bin/logs_arch.sh​

#!/bin/bash​

source /etc/profile​

cd /logs​

list_src_logs=`ls -f | grep log$`​

for i in $list_src_logs​

do​

#echo $i​

cp $i arch_logs/$i.`date +%Y-%m-%d`​

echo ""> $i​

sleep 1​

done​

if [[ $(ls -A arch_logs) ]]​

then​

find arch_logs/* -mtime 15 -delete​

else​

echo "dir is empty"​

fi​

exit 0​

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑_云主机_04


先手动执行此脚本,验证其正确性及有效性,确保可以到达目的以后,再将其加入到crontab计划任务中。​

用shell脚本巧解日志文件塞满磁盘导致系统挂起的困惑_重启_05


第二天,查验计划任务完成情况,经多次验证,最终达到系统盘及归档盘不被塞满的目标。​

标签:文件,shell,logs,导致系统,echo,巧解,塞满,日志,arch
From: https://blog.51cto.com/sery/5806558

相关文章

  • 日志包含Getshell
    题目来自CTFSHOWWEB81第一步,将携带有webshell的语句插入到UA当中,并访问主页<?phpsystem('ls');?>第二步,包含日志可以看到已经执行了命令。......
  • Shell脚本之数组
    概念数组(Array)是有序的元素序列。若将有限个类型相同的变量的集合命名,那么这个名称为数组名。组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量。......
  • Shell脚本之数组排序
    数组排序(使用tr、sort、for)操作步骤;使用tr命令将数组内每个元素之间的空格替换为换行符;之后使用sort命令按从小到大重新排序;最后使用for循环遍历排序后的元素值。......
  • shell脚本三剑客之sed
    一、sed编辑器的概述1、sed编辑器的概念sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流sed编辑器可以根据命令来处理数据流中的数......
  • HDFS的 Shell操作-API操作
    HDFS的Shell操作(重点)2.1基本语法hadoopfs具体命令 OR hdfsdfs具体命令两个是完全相同的。2.2命令大全[[email protected]]$bin/hadoopfs[......
  • python系列:paramiko中invoke_shell和exec_command的区别
    目录​​exec_command​​​​invoke_shell​​exec_command只能运行一次,命令执行完成后channel将关闭,不能被复用。invoke_shell使用get_pty()获取一个伪终端后,需要使用invo......
  • shell脚本三剑客之awk
    一、awk的概述1、awk的概念逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令sed命令常用于一整行的......
  • 简单实现shell
    参考Tutorial-WriteaShellinC•StephenBrennan   下面是原作者在github上传的代码/****************************************************************......
  • shell-练习
    1.打印字符串#!/bin/bash<<! 打印字符串 知识点:echo、if、$、``、wc-c!forsinBashalsointerpretsanumberofmulti-characteroptions.do n=`echo$s|......
  • PHP执行Shell脚本或Bash脚本文件并返回命令输出详情
    PHP执行shell脚本或者Bash脚本文件实例。system和exec函数可能被配置文件禁用,可以通过修改php配置文件删除被禁用的函数。1.通过system函数执行使用实例:<?php$shell="dig......