awk可以使用自身变量NR和FNR来处理多个文件。
NR:表示awk开始执行程序后所读取的数据行数。
FNR:awk当前读取的记录数,其变量值小于等于NR(比如当读取第二个文件时,FNR是从0开始重新计数,而NR不会)。
NR==FNR:用于在读取两个或两个以上的文件时,判断是不是在读取第一个文件。
awk处理多个文件的基本语法是:
awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file_list1 file_list2
其中BEGIN和END可以省略,-F也可以使用默认,循环执行部分,是按行对文件进行处理的。
先看一下NR和FNR的使用例子。
root@ubuntu:/home/zoer# cat a
a aaaaa
b bbbbb
c ccccc
d ddddd
root@ubuntu:/home/zoer# cat b
e eeeee
f fffff
g ggggg
root@ubuntu:/home/zoer# awk '{print NR,$0}' a b
1 a aaaaa
2 b bbbbb
3 c ccccc
4 d ddddd
5 e eeeee
6 f fffff
7 g ggggg
对于NR,读取不同文件,NR是一直++的。
-------------------------------------------------
root@ubuntu:/home/zoer# awk '{print FNR,$0}' a b
1 a aaaaa
2 b bbbbb
3 c ccccc
4 d ddddd
1 e eeeee
2 f fffff
3 g ggggg
但是对于FNR,读取不同文件,开始下一个文件的时候FNR又从1开始了。