首页 > 系统相关 >【牛客编程题】shell34题(Linux awk,grep命令)

【牛客编程题】shell34题(Linux awk,grep命令)

时间:2023-04-27 22:32:25浏览次数:46  
标签:grep nginx shell34 牛客 awk nowcoder print END


【牛客编程题】shell34题(Linux awk,grep命令)

SHELL01-22:基本文本处理
SHELL23-28:nginx日志分析
SHELL29-32:netstat练习

做题链接:https://www.nowcoder.com/exam/oj?page=1&tab=SHELL%E7%AF%87&topicId=195

参考资料:https://github.com/jaywcjlove/linux-command

文章目录

  • 从awk命令开始
  • 对grep命令的补充
  • SHELL1 统计文件的行数
  • SHELL2 打印文件的最后5行
  • SHELL3 输出7的倍数
  • SHELL4 输出第5行的内容
  • SHELL5 打印空行的行号
  • SHELL6 去掉空行
  • SHELL7 打印字母数小于8的单词
  • SHELL8 统计所有进程占用内存大小的和
  • SHELL9 统计每个单词出现的个数
  • SHELL10 第二列是否有重复
  • SHELL11 转置文件的内容
  • SHELL12 打印每一行出现的数字个数
  • SHELL13 去掉所有包含this的句子
  • SHELL14 求平均值
  • SHELL15 去掉不需要的单词
  • SHELL16 判断输入的是否为IP地址
  • SHELL17 将字段逆序输出文件的每行
  • SHELL18 域名进行计数排序处理
  • SHELL19 打印等腰三角形
  • SHELL20 打印只有一个数字的行
  • SHELL21 格式化输出
  • SHELL22 处理文本
  • SHELL23 nginx日志分析1-IP统计
  • SHELL24 nginx日志分析2-统计某个时间段的IP
  • SHELL25 nginx日志分析3-统计访问3次以上的IP
  • SHELL26 nginx日志分析4-查询某个IP的详细访问情况
  • SHELL27 nginx日志分析5-统计爬虫抓取404次数
  • SHELL28 nginx日志分析6-统计每分钟的请求数
  • SHELL29 netstat练习1-查看各个状态的连接数
  • SHELL30 netstat练习2-查看和3306端口建立的连接
  • SHELL31 netstat练习3-输出每个IP的连接数
  • SHELL32 netstat练习4-输出和3306端口建立连接总的各个状态的数目
  • SHELL33 业务分析-提取值
  • SHELL34 ps分析-统计VSZ,RSS各自总和

从awk命令开始

awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理。

它在命令行中使用,但更多是作为脚本来使用。awk有很多类似于C语言的灵活内建的功能,比如数组、函数等。

awk [options] 'script' var=value file(s)
awk [options] -f scriptfile var=value file(s)

-F fs,fs指定输入分隔符,fs可以是字符串或正则表达式,如-F : 。默认的分隔符是连续的空格或制表符。
-v var=value 赋值一个用户定义变量,将外部变量传递给awk
-f scripfile 从脚本文件中读取awk命令

参考资料:https://wangchujiang.com/linux-command/c/awk.html

awk脚本是由模式和操作组成的。

模式可以是以下任意一个:

  • /正则表达式/, 关系表达式, 模式匹配表达式(~匹配, !~不匹配),
  • BEGIN语句块、pattern语句块、END语句块

awk脚本基本结构

awk 'BEGIN{ print "start" } pattern{ commands } END{ print "end" }' file

第一步:执行BEGIN{ commands }语句块中的语句;
第二步:从文件或标准输入读取一行,然后执行pattern{ commands }语句块,它逐行扫描文件,从第一行到最后一行重复这个过程,直到文件全部被读取完毕。
第三步:当读至输入流末尾时,执行END{ commands }语句块。
BEGIN和END是可选的,但是如果没有pattern语句块,则默认执行{ print },即打印每一个读取到的行,awk读取的每一行都会执行该语句块。

awk内置变量

NR: 表示记录数,在执行过程中对应于 当前的行号。
NF: 表示字段数,在执行过程中对应于 当前的字段数。
FS:字段分隔符(默认是任何空格)。

使用print $NF可以打印出一行中的最后一个字段,使用$(NF-1)则是打印倒数第二个字段。
打印每一行的第二和第三个字段:awk '{ print $2,$3 }' filename
统计文件中的行数:awk 'END{ print NR }' filename
在读入每一行的时,awk会将NR更新为对应的行号,当到达最后一行NR的值就是最后一行的行号,所以END语句块中的NR就是文件的行数。

将外部变量值传递给awk

借助 -v选项 ,可以将外部值传递给awk

VAR=10000
echo | awk -v VARIABLE=$VAR '{ print VARIABLE }'

var1="aaa"
var2="bbb"
echo | awk '{ print v1,v2 }' v1=$var1 v2=$var2

查找进程pid
netstat -antup | grep 7770 | awk '{ print $NF NR}' | awk '{ print $1}'

对grep命令的补充

强大的文本搜索工具

  • grep 更适合单纯的查找或匹配文本
  • sed 更适合编辑匹配到的文本
  • awk 更适合格式化文本,对文本进行较复杂格式处理

grep全面搜索正则表达式并把匹配的行打印出来。用于过滤/搜索的特定字符。

# grep查找
grep "match_pattern" file_1 file_2 file_3 ...

# 查找后,输出除之外的所有行 -v
grep -v "match_pattern" file_name

# 使用正则表达式 -E 
# 使用正则表达式 -P 选项:
grep -E "[1-9]+"
grep -P "(\d{3}\-){2}\d{4}" file_name

# 统计文件或者文本中包含匹配字符串的行数 -c 选项:
grep -c "text" file_name

# 输出包含匹配字符串的行数 -n 选项
grep "text" -n file_name
cat file_name | grep "text" -n

# 在多级目录中对文本进行递归搜索, .表示当前目录。
grep "text" . -r -n

# 忽略匹配样式中的字符大小写:
echo "hello world" | grep -i "HELLO"

SHELL1 统计文件的行数

# 查看文件的'\n'的数量
wc  -l  ./nowcoder.txt

# 执行结果
8 ./nowcoder.txt

# 用awk打印第一个数字
wc -l ./nowcoder.txt | awk '{print $1}'

SHELL2 打印文件的最后5行

# 查看文件的前5行,可以使用head命令,如
head -5 filename

# 查看文件的后5行,可以使用tail命令,如:
tail -5 filename 或 tail -n 5 filename

# 查看文件中间一段,你可以使用sed命令,如:
sed -n ‘5,20p’ filename

SHELL3 输出7的倍数

#!/bin/bash
for num in {0..500..7}; do  
  echo "${num}" 
done

SHELL4 输出第5行的内容

# head 命令拿到前五行,再通过通道,通过tail取出来最后一行,即第五行
head -n 5 nowcoder.txt | tail -n 1 

# sed 命令中的 p 子命令,打印第五行
sed -n 5p nowcoder.txt

SHELL5 打印空行的行号

# awk是数据解析工具 对文件或管道数据、终端输入数据逐行解析 默认以空格分隔
# awk语法:awk 'pattern{命令}' 文件名, /pattern/是正则表达式匹配, /^$/表示空字符串

awk '/^$/{print NR}' nowcoder.txt

SHELL6 去掉空行

# awk 命令,判断当前行的内容然后输出
awk '!/^$/ {print $NF}' nowcoder.txt
awk '{if($0 != "") {print $0}}' nowcoder.txt

# cat 输出文本内容,然后通过管道符交由 awk 做非空校验然后输出
cat nowcoder.txt | awk NF

# grep 命令 -v 显示不包含匹配文本的所有行
grep -v '^$'

SHELL7 打印字母数小于8的单词

# awk嵌套for
awk -F " " '{for(i=1;i<=NF;i++){if(length($i) < 8){print $i}}}' nowcoder.txt

# 或者循环
for i in $(cat nowcoder.txt); do
    if [ ${#i} -lt 8 ]; then
        echo ${i}
    fi
done

SHELL8 统计所有进程占用内存大小的和

# 利用awk的强大功能
awk '{sum+=$6}END{print sum}' nowcoder.txt

SHELL9 统计每个单词出现的个数

# awk天下无敌
awk '{for(i=1;i<=NF;i++) a[$i]+=1}END{for(x in a) print x,a[x]}' nowcoder.txt

SHELL10 第二列是否有重复

# awk
awk '{a[$2]+=1}END{for(x in a){if(a[x]>1) print a[x],x}}' nowcoder.txt

SHELL11 转置文件的内容

# awk
awk '{
    for(i=1;i<=NF;i++){
      if(NR==1){
        row[i] = $i;
      }else{
        row[i] = row[i]" "$i;
      }
    }
}END{
  for(i=1;i<=NF;i++){
    print row[i]
  }
}' nowcoder.txt

SHELL12 打印每一行出现的数字个数

# awk
awk -F "[1,2,3,4,5]" '
BEGIN{sum=0}
{print "line"NR" number:"(NF-1);sum+=(NF-1)}
END{print "sum is "sum}
' nowcoder.txt

SHELL13 去掉所有包含this的句子

# grep 命令 -v 显示不包含匹配文本的所有行
grep -v 'this'

# awk 命令,检查当前 $0 不包含 this 随机输出
awk '$0!~/this/ {print $0}'

SHELL14 求平均值

awk '{if(NR==1) {N=$1} else{sum+=$1}} END{printf ("%.3f",sum/N) }'

SHELL15 去掉不需要的单词

# 使用grep -v去掉
grep  -E -v "[bB]"

# awk
awk '{ for (i=1; i<=NF; i++) { if ($i ~ /.*[bB]+.*/) { continue } else { print $i } } }'

SHELL16 判断输入的是否为IP地址

# 使用 . 作为分隔符
 awk -F '.' '{
     if (NF == 4) {
         for (i = 1; i < 5; i++) {
             if ($i > 255 || $i < 0) {
                 print("no")
                 break
             }
         }
         if (i == 5) {
             print("yes")
         } else {
             print("error")
         }
     }   
 }'

SHELL17 将字段逆序输出文件的每行

awk -F ":" '{a[NR]=$NF; for (i=NF-1;i>0;i--) a[NR]=a[NR]":"$i }END{for(k in a) print a[k]}' nowcoder.txt

SHELL18 域名进行计数排序处理

awk -F/ '{print $3}'|sort -r|uniq -c|awk '{print $1,$2}'

SHELL19 打印等腰三角形

awk 'BEGIN{
    for(n = 1; n <= 5; n++){
        row = "";
        for(i = 1;i <= 5 - n; i++){
            row = row " "
        }
        for(i = 1; i <= n; i++){
            row = row "*" " "
        }
        print row
    }
}'

SHELL20 打印只有一个数字的行

awk -F[1-9] '{if(NF==2)print $0}'

SHELL21 格式化输出

awk 'BEGIN{FS=""}{for(i=1;i<=NF;i++) {if((NF-i)%3==0&&i!=NF) printf $i",";else printf $i};printf "\n"}' nowcoder.txt

SHELL22 处理文本

awk -F ":" '{
	a[$1] = a[$1] $2 "\n"
} 
END {for (i in a){
	printf("[%s]\n%s",i,a[i])
} 
}' nowcoder.txt

SHELL23 nginx日志分析1-IP统计

# 利用 awk 中的 substr 函数
awk '{
    if(substr($4, 2, 11) == "23/Apr/2020") {
        res[$1]++;
    }
}END {
    for(k in res) {
        print res[k] " " k
    }
}' | sort -nr -k 1 -t " "

SHELL24 nginx日志分析2-统计某个时间段的IP

# 使用grep
grep "23/Apr/2020" | cut -c '-12' | sort -u | wc -l

# awk
awk '{
	if ($0 ~ /\[23\/Apr\/2020:2[0-2]/) {
         a[$1]=1
     } 
} END {
     print (length(a))
}'

SHELL25 nginx日志分析3-统计访问3次以上的IP

awk '{
    if ($1 in a) {
        a[$1]++;
    } else {
        a[$1]=1
    }
} END {
    for (j in a) {
        if (a[j] > 3) {
            print a[j],j
        }
    }
}' nowcoder.txt | sort -r

SHELL26 nginx日志分析4-查询某个IP的详细访问情况

awk '$1=="192.168.1.22"{a[$7]++}END{ for(i in a){ print a[i],i } }' | sort -r

SHELL27 nginx日志分析5-统计爬虫抓取404次数

# grep
grep 'www.baidu.com' nowcoder.txt | grep ' 404 ' | wc -l

# awk
awk '{
	if ($0 ~ '/www.baidu.com/' && $9 = 404 ) a++
} END {
	print a
}' nowcoder.txt

SHELL28 nginx日志分析6-统计每分钟的请求数

awk '{print substr($4,14,5)}' | sort | uniq -c | sort -rn -k 1 | awk '{print $1,$2}'

SHELL29 netstat练习1-查看各个状态的连接数

awk '/tcp/{a[$6]++}END{for(i in a)print i,a[i]}' nowcoder.txt | sort -nrk 2

SHELL30 netstat练习2-查看和3306端口建立的连接

cat nowcoder.txt | grep '3306' | grep 'ESTABLISHED' | awk -F ' ' '{print $5}' | awk -F: '{print $1}' | sort | uniq -c | sort -nr -k1 | awk '{print $1" "$2}'

SHELL31 netstat练习3-输出每个IP的连接数

awk -F "[ :]+" '/tcp/{a[$6]++}END{for(i in a)print i,a[i]}' nowcoder.txt | sort -nrk2

SHELL32 netstat练习4-输出和3306端口建立连接总的各个状态的数目

awk '{
    if ($1 == "tcp" && $5 ~ /3306/) {
        if ($6 == "ESTABLISHED") {
            es++
        }
        ans++
        arr[$5]=0
    }
} END {
    printf("TOTAL_IP %d\nESTABLISHED %d\nTOTAL_LINK %d", length(arr), es, ans)
}'

SHELL33 业务分析-提取值

awk -F "[:,]" '{
    if($0~"Server version"){
        print "serverVersion:" $4;
    }
    if($0~"Server number"){
        print "serverName:" $4;
    }
    if($0~"OS Name"){
        print "osName:" $4;
    }
    if($0~"OS Version"){
        print "osVersion:" $6
    }
}'

SHELL34 ps分析-统计VSZ,RSS各自总和

awk '{
    v += $5
    r += $6
} END {
    printf("MEM TOTAL\nVSZ_SUM:%0.1fM,RSS_SUM:%0.3fM", v/1024, r/1024)
}'


标签:grep,nginx,shell34,牛客,awk,nowcoder,print,END
From: https://blog.51cto.com/gwj1314/6232264

相关文章

  • “蔚来杯“2022牛客暑期多校训练营1,签到题GADI
    题号标题已通过代码通过率团队的状态AVillages:Landlines点击查看1673/4177通过BSpiritCircleObservation点击查看39/299未通过CGrabtheSeat!点击查看88/392未通过DMochaandRailgun点击查看1589/8517通过ELTCS点击查看43/324未通过FCut点击......
  • Linux grep命令详细教程
    [本文出自天外归云的博客园]简介Linuxgrep命令是一种非常常用的文本搜索工具,它可以在给定的文件中搜索匹配的字符串,并输出匹配的行。grep是全称“globalsearchregularexpressionprint”,可以识别正则表达式,并使用正则表达式进行搜索。选项以下是 grep 的所有选项:grep......
  • 2021牛客OI赛前集训营-提高组(第二场)第三题 树数树题解
    题目描述牛牛有一棵\(n\)个点的有根树,根为\(1\)。我们称一个长度为\(m\)的序列\(a\)是好的,当且仅当:\(\foralli\in(1,m]\),\(a_i\)为\(a_{i−1}\)的祖先或\(a_{i−1}\)是\(ai\)的祖先\(\forall1\leqi\ltj\leqm,a_i\neqa_j\)你需要帮助牛牛求出最长的......
  • 2021牛客OI赛前集训营-提高组(第三场) 第二题 交替 题解与结论证明
    题目描述一个长度为\(n\)的数组\(A\),每秒都会变成一个长度为\(n−1\)新数组\(A'\),其变化规则如下:若当前数组\(A\)的长度\(n\)为偶数,则对于新数组\(A'\)的每一个位置\(i(1≤i<n)\)来说,\(A'[i]=A[i]+A[i+1]\)若当前数组\(A\)的长度\(n\)为奇数,则对于......
  • 牛客小白月赛71
    A.猫猫与广告题目:分析:只需考虑c*d的矩阵竖着摆和横着摆两种情况。本题提示了考虑两矩阵对应边平行的情况,实际上可以证明倘若能斜着放,那么一定可以横着放或竖着放,证明方式可已通过构造三角形来证明a*b的矩阵的长宽一定小于c*d矩阵的长宽。code:#include<iostream>#inc......
  • [牛客]链表的回文结构
    牛客链接思路:找中间结点从中间结点开始对后半段进行逆置比较前半段和后半段相等是,不相等不是只需将我们前面写过的链表中间结点,逆置链表的代码复用,并加上如下代码即可最终代码:/*structListNode{intval;structListNode*next;ListNode(intx):val(x),ne......
  • linux中grep指令补充
    grep是Linux中一个强大的文本搜索工具,可以用于在一个或多个文件中查找特定的字符串。grep的基本语法如下:grep[options]pattern[files]其中,pattern表示要搜索的模式,可以是一个字符串或是一个正则表达式。files则表示要搜索的文件列表,如果省略,则默认从标准输入中读取数......
  • 牛客练习赛110
    A.嘤嘤的签到双指针+算贡献用cnt[]来记录当前维护区间1和4的数量,当当前区间不满足要求则移动左指针直到满足要求,再加上贡献即可。当然也可以记录最后的1和4的位置,这样他们位置中较小的那一个的后一个位置就是能满足要求的区间的最左端的左指针,但是该方法就没上一个那么通用了......
  • 牛客网——实现二叉树先序、中序和后序遍历
    title:牛客网——实现二叉树先序、中序和后序遍历题目描述:分别按照二叉树先序,中序和后序打印所有的节点。示例:输入:{1,2,3}返回值:[[1,2,3],[2,1,3],[2,3,1]]备注:$$n\leqslant10^6$$代码如下:(照着别人的代码敲的,待重新实现一遍)/***structTreeNode{* int......
  • 牛客网——数组中出现次数超过一半的数字
    title:牛客网——数组中出现次数超过一半的数字题目描述:数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。例如输入一个长度为9的数组{1,2,3,2,2,2,5,4,2}。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。如果不存在则输出0。示例:输入[1,2,3,2,2,2......