上周内容:
1.VmwareWorkStition ( 快照、克隆、网络 )
2.Linux目录结构 ( 每个目录存放是什么类型的文件 )
3.Linux路径定位 /etc/hostname 路径就是对文件定位的一种方式
4.基础命令
ls ll、pwd、cd、cp、rm、mv、mkdir、touch、tree
wget、curl
rz、sz
cat、less、more、head、tail、grep
本周内容:
1.基础指令讲完 ( grep、sed、awk <--正则表达式-暂时 "可忽略" )
1) 命令所在的绝对路径在哪? ( 脚本时,碰到环境不同,使用相对路径执行会报错,可以使用绝对路径)
which、whereis
2)字符处理类? 统计 ( 分析文件中哪行内容出现的次数最多,取前3名)
sort、uniq、wc、cut、sed、awk
3)练习:如何提取自己的IP地址?
手机号: 判断11位 判断是不是全整数 判断手机号开头的数字在不在我定义的范围内
2.文件属性 -rw-r--r--. 1 root root 2523 6月 16 2018 Centos-7.repo
3.文件类型
4.软链接、硬链接
5.vim编辑器
6.用户管理
4.文件或命令查找(which、whereis)
----------------------------------------命令查找----------------------------------------
# which ls #查找ls命令的绝对路径
# whereis ls #查找命令的路径、帮助手册、等
# whereis -b ls #仅显示命令所在的路径
# type -a ls #查看命令的绝对路径(包括别名)
----------------------------------------------------------------------------
sort [OPTION]... [FILE]...
命令:sort
选项:-r:倒序 -n:按数字排序 -t:指定分隔符(默认空格) -k:指定第几列, 指定几列几字符(指定1,1 3.1,3.3)
cat >> file.txt <<EOF
b:3
c:2
a:4
e:5
d:1
f:11
EOF
cat >> file2.txt <<EOF
oldxu:20
oldguo:10
oldli:30
oldboy:0
EOF
[root@oldboy ~]# sort -t ":" -k2 -nr file2.txt | head -3
oldli:30
oldxu:20
oldguo:10
[root@oldboy ~]# wget http://fj.xuliangwei.com/public/ip.txt
[root@oldboy ~]# sort -t "." -k3.1,3.1 -k4.1,4.3 -n ip.txt
--------------------------------------------------------------------
uniq [OPTION]... [INPUT [OUTPUT]]
#选项:-c 计算重复的行
cat >>file3.txt <<EOF
abc
123
abc
123
EOF
实现思路: 先排序,然后去重,最后统计
[root@oldboy ~]# sort file3.txt #必须先排序(不排序相同的内容不再一起,无法去重)
123
123
abc
abc
[root@oldboy ~]#
[root@oldboy ~]# sort file3.txt | uniq #去重
123
abc
[root@oldboy ~]# sort file3.txt | uniq -c #统计出现的次数
2 123
2 abc
#面试题: 请统计分析如下日志,打印出访问最高前3的IP
( 排序 去重 统计 打印top3 = 排名前3 )
[root@oldboy ~]# cat >>ip2.txt<<EOF
192.168.3.1
192.168.3.2
192.168.3.3
192.168.2.20
192.168.2.21
192.168.2.22
192.168.0.151
192.168.0.151
192.168.0.152
192.168.0.153
192.168.0.151
192.168.2.22
192.168.1.10
192.168.1.11
192.168.1.12
192.168.0.151
192.168.1.1
192.168.2.2
192.168.0.151
192.168.3.3
192.168.2.20
192.168.1.21
192.168.0.151
192.168.2.22
192.168.0.151
192.168.2.22
192.168.1.152
192.168.0.153
192.168.3.10
192.168.1.11
192.168.2.22
192.168.3.12
EOF
每个命令能做的事情都很单一,所以需要使用 管道技术 将命令与命令之间衔接起来,这样能做的事情就是无限的。
[root@oldboy ~]# sort ip2.txt | uniq -c | sort -nr | head -3
7 192.168.0.151
5 192.168.2.22
2 192.168.3.3
--------------------------------------------------------------------
cut OPTION... [FILE]...
#选项:
-d 指定分隔符
-f 数字,取第几列 –f3,6三列和6列
-c 按字符取(空格也算)
1.产生文件
[root@oldboy ~]# echo "Im oldxu, is QQ 552408925" > oldboy.txt
2.需求:过滤出oldboy.txt文件里 oldxu以及552408925
3.如何实现:
实现方法1:
[root@oldboy ~]# cut -d " " -f 2,5 oldboy.txt
oldxu, 552408925
[root@oldboy ~]# cut -d " " -f 2,5 oldboy.txt | sed 's#,##g'
oldxu 552408925
实现方法2:
[root@oldboy ~]# awk '{print $2,$5}' oldboy.txt
oldxu, 552408925
[root@oldboy ~]# awk '{print $2,$5}' oldboy.txt | sed 's#,##g'
oldxu 552408925
实现方法3: awk处理
[root@oldboy ~]# awk -F "," '{print $1,$2}' oldboy.txt | awk '{print $2,$5}'
oldxu 552408925
[root@oldboy ~]# awk -F "[ ,]" '{print $2,$6}' oldboy.txt
oldxu 552408925
高级用法
[ ,]+ +表示重复 前面的字符一次或多次
空格算一个分隔符
逗号算一个分隔符
空格和逗号挨在一起,也算一个分隔符
空格逗号空格,全算一个分隔符
[root@oldboy ~]# awk -F "[ ,]+" '{print $2,$5}' oldboy.txt
oldxu 552408925
----------------------------------------------------------------
wc [OPTION]... [FILE]...
#选项:
-l显示文件行数
-c显示文件字节
-w显示文件单词
方法1:统计一个文件有多少行,使用wc -l
[root@oldboy ~]# wc -l /etc/services
11176 /etc/services
方法2:
[root@oldboy ~]# cat -n /etc/services | tail -1 | awk '{print $1}'
11176
方法3:
[root@oldboy ~]# grep -n ".*" /etc/services | tail -1 | awk -F ":" '{print $1}'
11176
方法4:仅供参考!!!!!!!不纠结
NR: 行号
$0: awk是逐行处理文件的,读入一行,然后将一行的内容赋值给$0变量,
[root@oldboy ~]# awk '{print NR,$0}' /etc/services | tail -1 | awk '{print $1}'
11176
#练习题: 过滤出/etc/passwd以nologin结尾的内容,并统计有多少行
过滤: grep /etc/passwd
条件: nologin结尾的
并且:
统计出现的内容总共有多少行: wc -l
[root@oldboy ~]# grep "nologin$" /etc/passwd | wc -l
19
--------------------------------------------------------
习题: 分析如下日志,统计每个域名被访问的次数。
[root@student tmp]# cat >>web.log<<EOF
http://www.xuliangwei.com/index.html
http://www.xuliangwei.com/1.html
http://post.xuliangwei.com/index.html
http://mp3.xuliangwei.com/index.html
http://www.xuliangwei.com/3.html
http://post.xuliangwei.com/2.html
EOF
思路:
1.要想办法提取域名
2.排序,将相同的域名罗列在一起
3.去重,统计
实现:
[root@oldboy ~]# awk -F '/' '{print $3}' web.log | sort | uniq -c
1 mp3.xuliangwei.com
2 post.xuliangwei.com
3 www.xuliangwei.com
将访问次数最多的排在上面
[root@oldboy ~]# awk -F '/' '{print $3}' web.log | sort | uniq -c | sort -nr
3 www.xuliangwei.com
2 post.xuliangwei.com
1 mp3.xuliangwei.com
----------------------------下午-------------------------------
习题1: 使用awk取出系统的IP地址,思路如下:
1.我要取的IP值在哪里 ifconfig
2.如何缩小取值范围(行)
3.如何精确具体内容(列)
方式1:
[root@oldboy ~]# ifconfig eth0 | head -2 | tail -1 | awk '{print $2}'
172.16.1.53
方式2:
[root@oldboy ~]# ifconfig eth0 | grep "netmask" | awk '{print $2}'
172.16.1.53
习题2: 将/etc/passwd文件中的第一行中的第一列和最后一列位置进行交换。(自行指定以:为分隔符)
源文件:root:x:0:0:root:/root:/bin/bash
改变后:/bin/bash:x:0:0:root:/root:root
习题3: 将/etc/sysconfig/selinux 文件中的SELINUX=enforcing替换成SELINUX=disabled
标签:oldboy,DAY08,运维,xuliangwei,awk,Linux,print,txt,root From: https://www.cnblogs.com/cjy0823/p/17196742.html