首页 > 其他分享 >初识 sed 和 gawk

初识 sed 和 gawk

时间:2023-07-10 09:22:24浏览次数:36  
标签:11 sed centos VM gawk 初识 root testdir

初识 sed 和 gawk

原创 饺子泡牛奶 饺子泡牛奶 2023-07-01 08:40 发表于四川 收录于合集#Linux与Shell18个

本章内容:

  • 文本处理
  • 学习 sed 编辑器
  • sed 编辑器基础命令
  • gawk 编辑器入门
  • sed 编辑器基础

一、文本处理

如果想在 shell 脚本中处理各种数据,则必须熟悉 Linux 中的 sed 和 gawk。这两款工具能够极大地简化数据处理任务。

  • 有时候你会发现自己想要即时处理文本文件中的文本,但又不想动用全副武装的交互式文本编辑器。
  • 在这种情况下,有一个可以自动格式化、插入、修改或删除文本元素的简单的命令行编辑器就方便多了。
  • 两款常见工具兼具上述功能:
    • sed
    • gawk

1.1 sed 编辑器

sed 编辑器被称作流编辑器。( stream editor )

  • 交互式文本编辑器(比如 Vim)中,可以用键盘命令交互式地插入、删除或替换文本数据。
  • 流编辑器则是根据事先设计好的一组规则编辑数据流。
  • sed 编辑器可以执行下列操作
    • 从输入中读取一行数据。
    • 根据所提供的编辑器命令匹配数据。
    • 按照命令修改数据流中的数据。
    • 将新的数据输出到 STDOUT。
  • 在流编辑器匹配并针对一行数据执行所有命令之后,会读取下一行数据并重复这个过程。
  • 在流编辑器处理完数据流中的所有行后,就结束运行
  • 由于命令是按顺序逐行执行的,因此 sed 编辑器只需对数据流处理一遍( one pass through )即可完成编辑操作。
  • sed 编辑器要比交互式编辑器快得多,并且可以快速完成对数据的自动修改
  • sed 命令的格式如下
# options 参数允许修改 sed 命令的行为。

# script 参数指定了应用于流数据中的单个命令。

# 如果需要多个命令,则要么使用-e 选项在命令行中指定,要么使用-f 选项在单独的文件中指定。

sed options script file
  • sed 常用命令选项
选项描述
-e commands 在处理输入时,加入额外的 sed 命令。
-f file 在处理输入时,将 file 中指定的命令添加到已有的命令中。
-n 不产生命令输出,使用 p(print)命令完成输出。

1.1.1 在命令行中定义编辑器命令

  • 默认情况下sed 编辑器会将指定的命令应用于 STDIN 输入流中。

  • 因此,可以直接将数据通过管道传入 sed 编辑器进行处理

# 1.使用sed命令将输入流的"green"替换为"blue",处理完成后输出。
# 格式说明:'s/替换前的字符串/替换后的字符串/' 
[root@VM-8-11-centos testdir]# echo "This is green." | sed 's/green/blue/' 
This is blue.
[root@VM-8-11-centos testdir]#
  • 你可以同时对数据做出多处修改,所消耗的时间差不过刚够一些交互式编辑器启动而已。
  • sed 编辑器并不会修改文本文件的数据。它只是将修改后的数据发送到 STDOUT:
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA
AAA
AAA

# 2.使用sed,将内容的"AAA"批量替换为"BBB"。
[root@VM-8-11-centos testdir]# sed 's/AAA/BBB/' data.txt 
BBB
BBB
BBB

# 3.替换完成,但是原文件数据不变。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA
AAA
AAA

1.1.2 在命令行中使用多个编辑器命令

  • 如果要在 sed 命令行中执行多个命令,可以使用 -e 选项:
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA
AAA
BBB
BBB

# 2.命令之间必须以分号(;)分隔,并且在命令末尾和分号之间不能出现空格。
[root@VM-8-11-centos testdir]# sed -e 's/AAA/CCC/ ; s/BBB/DDD/' data.txt 
CCC
CCC
DDD
DDD

# 3.如果不想用分号,那么也可以用 bash shell 中的次提示符来分隔命令。
# 注意:必须记住,要在闭合单引号所在行结束命令。bash shell 一旦发现了闭合单引号,就会执行命令。
[root@VM-8-11-centos testdir]# sed -e '
> s/AAA/CCC/
> s/BBB/DDD/' data.txt
CCC
CCC
DDD
DDD

1.1.3 从文件中读取编辑器命令

  • 如果有大量要执行的 sed 命令,那么将其放进单独的文件通常会更方便一些。
  • 可以在 sed命令中用 -f 选项来指定文件:
# 1.sed脚本内容。
[root@VM-8-11-centos testdir]# cat replace.sed 
s/AAA/CCC/
s/BBB/DDD/

# 2.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA
AAA
BBB
BBB

# 3.执行脚本。
[root@VM-8-11-centos testdir]# sed -f replace.sed data.txt 
CCC
CCC
DDD
DDD
  • 使用这种方式,不用在每条命令后面加分号
  • 提示sed 编辑器脚本文件容易与 bash shell 脚本文件混淆。为了避免这种情况,可以使用 .sed 作为 sed 脚本文件的扩展名

1.2 gawk 编辑器

sed 编辑器非常方便,可以即时修改文本文件,其自身也存在一些局限。这个时候可以使用更高级的文本文件处理工具 gawk 。

  • gawk 是 Unix 中最初的 awk 的 GNU 版本。
  • 它提供了一种编程语言,而不仅仅是编辑器命令
  • 在 gawk 编程语言中,可以实现以下操作:
    • 定义变量来保存数据
    • 使用算术字符串运算符处理数据
    • 使用结构化编程概念(比如 if-then 语句和循环)为数据处理添加处理逻辑。
    • 提取文件中的数据将其重新排列组合,最后生成格式化报告。( gawk 能够从日志文件中过滤出所需的数据,将其格式化,以便让重要的数据更易于阅读。)

1.2.1  gawk 命令格式

  • gawk 命令的格式如下
gawk options program file
  • gawk 常用命令选项
选项描述
-F fs 指定行中划分数据字段的字段分隔符。
-f file 从指定文件中读取 gawk 脚本代码。
-v var=value 定义 gawk 脚本中的变量及其默认值。
-L [keyword] 指定 gawk 的兼容模式或警告级别。
  • gawk 的强大之处在于脚本。你可以编写脚本来读取文本行中的数据,然后对其进行处理并显示,形成各种输出报告

1.2.2  从命令行读取 gawk 脚本

  • gawk 必须将脚本命令放到一对花括号({})之间
  • 由于 gawk 命令行假定脚本是单个文本字符串,因此还必须将脚本放到单引号中
  • 这里举一个简单的 gawk 程序脚本:
# 输入一行文本并按下 Enter 键,则 gawk 会对这行文本执行一遍脚本。
# 可以使用Ctrl+D的组合键,终止这个 gawk 程序,必须表明数据流已经结束了。
[root@VM-8-11-centos testdir]# gawk '{print "Hello World!"}'

Hello World!

Hello World!
[root@VM-8-11-centos testdir]# 

1.2.3 使用数据字段变量

  • gawk 的主要特性之一是处理文本文件中的数据
  • 它会自动为每一行的各个数据元素分配一个变量
  • 默认情况下gawk 会将下列变量分配给文本行中的数据字段
    • $0 代表整个文本行。
    • $n 代表文本行中的 n 数据字段。
  • 文本行中的数据字段是通过字段分隔符划分的。
  • 默认情况下,字段分隔符是任意的空白字符(比如空格或制表符)。
  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
One line of test text. 
Two lines of test text. 
Three lines of test text.
[root@VM-8-11-centos testdir]# 

# 2.($1)字段变量来显示每行文本的第一个数据字段。
[root@VM-8-11-centos testdir]# gawk '{print $1}' data.txt 
One
Two
Three

# 3.(-F:)表示指定冒号分隔。
[root@VM-8-11-centos testdir]# gawk -F: '{print $1}' /etc/passwd
root
bin
daemon
...

1.2.4 在脚本中使用多条命令

  • gawk 编程语言允许将多条命令组合成一个常规的脚本。
  • 要在命令行指定的脚本中使用多条命令,只需在命令之间加入分号即可:
# 1.第一条命令会为字段变量 $4 赋值。第二条命令会打印整个文本行。
[root@VM-8-11-centos testdir]# echo "My name is Tom" | gawk '{$4="Jan" ; print $0}'
My name is Jan
[root@VM-8-11-centos testdir]# 

# 2.也可以通过次提示符进行输入。(单引号表示了起止。)
[root@VM-8-11-centos testdir]# echo "My name is Tom" | gawk '{
> $4="Jan"
> print $0 }'
My name is Jan
[root@VM-8-11-centos testdir]# 

1.2.5 从文件中读取脚本

  • 应用示例
# 1.脚本内容。打印/etc/passwd 文件的用户名数据字段(字段变量$1),以及主目录数据字段(字段变量$6)。
[root@VM-8-11-centos testdir]# cat userHome.gawk 
{
    text = "'s home directory is "
    print $1 text $6
}

# 2.(-F:)指定冒号分隔符;(-f)指定脚本。
[root@VM-8-11-centos testdir]# gawk -F: -f userHome.gawk /etc/passwd
root's home directory is /root
bin's home directory is /bin
daemon's home directory is /sbin
...
  • 注意事项:在 gawk 脚本中,引用变量值时无须像 shell 脚本那样使用美元符号

1.2.6 在处理数据前运行脚本

  • 有时候,可能需要在处理数据前先运行脚本,比如要为报告创建一个标题。
  • BEGIN 关键字会强制 gawk 在读取数据前执行 BEGIN 关键字之后指定的脚本:
# 1.脚本内容。
[root@VM-8-11-centos testdir]# cat data.txt 
One line of test text. 
Two lines of test text. 
Three lines of test text.

# 2.gawk 执行了 BEGIN 脚本后,会用第二段脚本来处理文件数据。
# 这两段脚本仍会被视为 gawk 命令行中的一个文本字符串,所以需要相应地加上单引号。
[root@VM-8-11-centos testdir]# gawk 'BEGIN {print "Contents:"}
> {print $0}' data.txt
Contents:
One line of test text. 
Two lines of test text. 
Three lines of test text.
[root@VM-8-11-centos testdir]# 

1.2.7 在处理数据后运行脚本

  • 和 BEGIN 关键字类似,END 关键字允许指定一段脚本,gawk 会在处理完数据后执行这段脚本。
  • 这里可以结合上面的知识点,编写一个小型的脚本:
# 1.脚本内容。
# (BEGIN)负责创建标题、(END)生成页脚。
# (\t):表示制表符,进行格式化缩进。
# (FS):指定分隔符,无需再通过命令行指定。
[root@VM-8-11-centos testdir]# cat temp.gawk 
BEGIN {
    print "The latest list of users and shells" 
    print "UserID \t Shell" 
    print "------- \t -------"
    FS=":"
}

{
    print $1 " \t " $7
}

END {
    print "This concludes the listing"
}

# 2.执行脚本。
[root@VM-8-11-centos testdir]# gawk -f temp.gawk /etc/passwd
The latest list of users and shells
UserID   Shell
-------   -------
root   /bin/bash
bin   /sbin/nologin
daemon   /sbin/nologin
adm   /sbin/nologin
lp   /sbin/nologin
...
This concludes the listing

二、sed 编辑器基础命令

2.1 更多的替换选项

2.1.1 替换标志

  • 命令替换问题
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA AAA AAA
AAA

# 替换命令在替换多行中的文本时也能正常工作,但在默认情况下它只替换每行中出现的第一处匹配文本。
[root@VM-8-11-centos testdir]# sed 's/AAA/BBB/' data.txt 
BBB AAA AAA
BBB
  • 要想替换每行中所有的匹配文本,必须使用替换标志( substitution flag )。
  • 命令的格式如下
s/pattern/replacement/flags
  • 有 4 可用的替换标志:

    • 数字,指明新文本将替换行中的第几处匹配。
    • g,指明新文本将替换行中所有的匹配。
    • p,指明打印出替换后的行。
    • w file,将替换的结果写入文件
  • 应用示例

# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
AAA AAA AAA
AAA
CCC
DDD

# 2.替换行中第3处的匹配值。
[root@VM-8-11-centos testdir]# sed 's/AAA/BBB/3' data.txt 
AAA AAA BBB
AAA
CCC
DDD

# 3.替换行所有匹配值。
[root@VM-8-11-centos testdir]# sed 's/AAA/BBB/g' data.txt 
BBB BBB BBB
BBB
CCC
DDD

# 4.(p)通常和(-n)搭配使用。
# -n 选项会抑制 sed 编辑器的输出,而替换标志 p 会输出替换后的行。
[root@VM-8-11-centos testdir]# sed -n 's/AAA/BBB/p' data.txt 
BBB AAA AAA
BBB

# 5.替换标志(w)会产生同样的输出,不过会将输出保存到指定文件中。
[root@VM-8-11-centos testdir]# sed 's/AAA/BBB/w data_replace.txt' data.txt 
BBB AAA AAA
BBB
CCC
DDD

# 6.被写入的文件。(只有那些包含匹配模式的行才会被保存在指定的输出文件中。)
[root@VM-8-11-centos testdir]# cat data_replace.txt 
BBB AAA AAA
BBB
[root@VM-8-11-centos testdir]# 

2.1.2 替代字符

有时候,你会在字符串中遇到一些不太方便在替换模式中使用的字符。

  • Linux 中一个常见的例子是正斜线(/)。
  • 如果想将 /etc/passwd 文件中的 bash shell 替换为 C shell,则必须这么做:
$ sed 's/\/bin\/bash/\/bin\/csh/' /etc/passwd
  • 由于正斜线被用作替换命令的分隔符,因此它在匹配模式和替换文本中出现时,必须使用反斜线来转义。这很容易造成混乱和错误
  • 为了解决这个问题,sed 编辑器允许选择其他字符作为替换命令的替代分隔符
$ sed 's!/bin/bash!/bin/csh!' /etc/passwd
  • 在这个例子中,感叹号(!)被用作替换命令的分隔符,这样就更容易阅读和理解其中的路径了。

2.2 使用地址

默认情况下,在 sed 编辑器中使用的命令会应用于所有的文本行。如果只想将命令应用于特定的某一行或某些行,则必须使用行寻址

  • 在 sed 编辑器中有两种形式的行寻址:

    • 以数字形式表示的行区间。
    • 匹配行内文本的模式。
  • 以上两种形式使用相同的格式来指定地址:

[address]command

# 也可以将针对特定地址的多个命令分组:
address { 
 command1 
 command2 
 command3 
}
  • sed 编辑器会将指定的各个命令应用于匹配指定地址的文本行

2.2.1 数字形式的行寻址

  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy dog.
[root@VM-8-11-centos testdir]# 

# 2.只修改第3行文本。
[root@VM-8-11-centos testdir]# sed '3s/dog/cat/' data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy dog.
[root@VM-8-11-centos testdir]# 

# 3.修改第2至第3行文本。
[root@VM-8-11-centos testdir]# sed '2,3s/dog/cat/' data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy dog.
[root@VM-8-11-centos testdir]# 

# 4.修改从第2行到结束行($)的文本。
# 有可能不知道文本中到底有多少行,所以美元符号用起来往往很方便。
[root@VM-8-11-centos testdir]# sed '2,$s/dog/cat/' data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy cat.
[root@VM-8-11-centos testdir]# 

2.2.2 使用文本模式过滤

  • sed 编辑器允许指定文本模式来过滤出命令所应用的行,其格式如下
/pattern/command
  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy pig.
The quick brown fox jumps over the lazy duck.
[root@VM-8-11-centos testdir]# 

# 2.只修改cat的。(sed 编辑器会将该命令应用于包含匹配模式的行。)
[root@VM-8-11-centos testdir]# sed '/cat/s/lazy/happy/' data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the happy cat.
The quick brown fox jumps over the lazy pig.
The quick brown fox jumps over the lazy duck.
[root@VM-8-11-centos testdir]# 

2.2.3 命令组

  • 如果需要在单行中执行多条命令,可以用花括号将其组合在一起,sed 编辑器会执行匹配地址中列出的所有命令:
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
The quick brown fox jumps over the lazy dog.
The quick brown fox jumps over the lazy cat.
The quick brown fox jumps over the lazy pig.
The quick brown fox jumps over the lazy duck.
[root@VM-8-11-centos testdir]# 

# 2.花括号将多条命令进行组合。
[root@VM-8-11-centos testdir]# sed '2,${
> s/fox/toad/
> s/lazy/sleeping/}' data.txt
The quick brown fox jumps over the lazy dog.
The quick brown toad jumps over the sleeping cat.
The quick brown toad jumps over the sleeping pig.
The quick brown toad jumps over the sleeping duck.
[root@VM-8-11-centos testdir]# 
  • sed 编辑器会将所有命令应用于该区间内的所有行

2.3 删除行

如果需要删除文本流中的特定行,可以使用删除(d)命令。

  • 删除命令很简单,它会删除匹配指定模式的所有行。
  • 使用该命令时要特别小心,如果忘记加入寻址模式,则流中的所有文本行都会被删除
  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.删除行区间。
[root@VM-8-11-centos testdir]# sed '2,3d' data.txt 
line 1
line 4
[root@VM-8-11-centos testdir]# 

# 3.删除第2到最后一行。
[root@VM-8-11-centos testdir]# sed '2,$d' data.txt 
line 1

# 4.不加寻址模式,则会删除所有。
[root@VM-8-11-centos testdir]# sed 'd' data.txt 
[root@VM-8-11-centos testdir]# 

# 5.最后再查看下原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
  • 记住,sed 编辑器不会修改原始文件
  • 你删除的行只是从 sed 编辑器的输出中消失了。原始文件中仍然包含那些“被删掉”的行。

2.4 插入和附加文本

sed 编辑器也可以向数据流中插入附加文本行。

  • 插入( insert )(i)命令会在指定行前增加一行。

  • 附加( append )(a)命令会在指定行后增加一行。

  • 这两条命令不能在单个命令行中使用。必须指定是将行插入还是附加到另一行,其格式如下:

# new line 中的文本会出现在你所指定的 sed 编辑器的输出位置。
sed '[address]command\
new line'
  • 要插入或附加多行文本必须在要插入或附加的每行新文本末尾使用反斜线。(\)
  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.第3行插入。(目标行之前。)
[root@VM-8-11-centos testdir]# sed '3i\
> hello\
> world' data.txt
line 1
line 2
hello
world
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 3.第3行附加。(目标行之后。)
[root@VM-8-11-centos testdir]# sed '3a\
> hello\
> world' data.txt
line 1
line 2
line 3
hello
world
line 4
[root@VM-8-11-centos testdir]# 

# 4.附加到数据流的末尾。
[root@VM-8-11-centos testdir]# sed '$a\
> Bye.' data.txt
line 1
line 2
line 3
line 4
Bye.
[root@VM-8-11-centos testdir]# 

2.5 修改行

修改c)命令允许修改数据流中整行文本的内容。

  • 它跟插入和附加命令的工作机制一样,必须在 sed 命令中单独指定一行。

  • 应用示例

# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.修改第2行。
[root@VM-8-11-centos testdir]# sed '2c\
> hello' data.txt
line 1
hello
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 3.可以在修改命令中使用寻址区间。(注意:会直接替换,而不是逐一修改。)
[root@VM-8-11-centos testdir]# sed '2,$c\
> hello' data.txt
line 1
hello
[root@VM-8-11-centos testdir]# 

2.6 转换命令

转换y)命令是唯一可以处理单个字符的 sed 编辑器命令。

  • 该命令格式如下所示
# 转换命令会对 inchars 和 outchars 进行一对一的映射。

# inchars 中的第一个字符会被转换为 outchars 中的第一个字符,inchars 中的第二个字符会被转换成 outchars 中的第二个字符。

# 这个映射过程会一直持续到处理完指定字符。

# 如果 inchars 和 outchars 的长度不同,会产生一条错误消息。

[address]y/inchars/outchars/
  • 转换命令是一个全局命令,它会对文本行中匹配到的所有指定字符进行转换不考虑字符出现的位置
  • 应用示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.对单个字符进行映射转换。
[root@VM-8-11-centos testdir]# sed 'y/1234/5678/' data.txt 
line 5
line 6
line 7
line 8
[root@VM-8-11-centos testdir]# 

2.7 再探打印

  • 有 3 命令也能打印数据流中的信息:

    • 打印(p)命令用于打印文本行
    • 等号(=)命令用于打印行号。(行号由数据流中的换行符决定。)
    • 列出(l)命令用于列出行。(列出命令可以打印数据流中的文本和不可打印字符。)
  • 打印文本行

# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.查找包含数字 3 的行,然后执行两条命令。
#   首先,脚本用打印命令打印出原始行。
#   然后用替换命令替换文本并通过(p)标志打印出替换结果。
#   输出同时显示了原始的文本行和新的文本行。
# 用(-n)选项可以抑制其他行的输出,只打印包含匹配文本模式的行。
[root@VM-8-11-centos testdir]# sed -n '/3/{
> p
> s/line/test/p
> '} data.txt
line 3
test 3
[root@VM-8-11-centos testdir]# 
  • 打印行号
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.同上面目的一致,只是将打印文本行,变为打印行号。
[root@VM-8-11-centos testdir]# sed -n '/3/{
> =
> s/line/test/p
> '} data.txt
3
test 3
[root@VM-8-11-centos testdir]# 
  • 列出行
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1 AAA
line 2
line 3
line 4
[root@VM-8-11-centos testdir]# 

# 2.列出了不可打印的字符。
[root@VM-8-11-centos testdir]# sed -n 'l' data.txt 
line 1\tAAA$
line 2$
line 3$
line 4$
[root@VM-8-11-centos testdir]# 

2.8 使用 sed 处理文件

替换命令包含一些文件处理标志。一些常规的 sed 编辑器命令也可以让你无须替换文本即可完成此操作。

  • 写入文件
# 写入(w)命令用来向文件写入行。
# 该命令格式:[address]w filename

# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1 AAA
CCC line 2
DDD line 3
AAA line 4
[root@VM-8-11-centos testdir]# 

# 2.包含AAA的文本行写出到指定文件。
# 用(-n)选项可以抑制其他行的输出,只打印包含匹配文本模式的行。
[root@VM-8-11-centos testdir]# sed -n '/AAA/w test.txt' data.txt 
[root@VM-8-11-centos testdir]# 

# 3.写出后的文件内容。
[root@VM-8-11-centos testdir]# cat test.txt 
line 1 AAA
AAA line 4
[root@VM-8-11-centos testdir]# 
  • 从文件读取数据
# 读取(r)命令允许将一条独立文件中的数据插入数据流。
# 读取命令的格式:[address]r filename
# 读取命令中无法使用地址区间,只能指定单个行号或文本模式地址。
# sed 编辑器会将文件内容插入指定地址之后。

# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
line 1 AAA
CCC line 2
DDD line 3
AAA line 4
[root@VM-8-11-centos testdir]# 

# 2.待插入的数据。
[root@VM-8-11-centos testdir]# cat test.txt 
hello
world
[root@VM-8-11-centos testdir]# 

# 3.将test.txt内容插入到data.txt的尾行。
[root@VM-8-11-centos testdir]# sed '$r test.txt' data.txt 
line 1 AAA
CCC line 2
DDD line 3
AAA line 4
hello
world
[root@VM-8-11-centos testdir]# 
  • 补充示例
# 1.原文件数据。
[root@VM-8-11-centos testdir]# cat data.txt 
title

USERS

end
[root@VM-8-11-centos testdir]# cat users.txt 
jan
tom
rose
[root@VM-8-11-centos testdir]# 

# 2.替换占位文本`USERS`,并删除占位文本。
[root@VM-8-11-centos testdir]# sed '/USERS/{
> r users.txt
> d
> }' data.txt
title

jan
tom
rose

end
[root@VM-8-11-centos testdir]# 

# 2.也可以单行多命令完成这个需求。
[root@VM-8-11-centos testdir]# sed -e '/USER/ r users.txt' -e '/USER/ d' data.txt 
title

jan
tom
rose

end
[root@VM-8-11-centos testdir]# 

 

收录于合集 #Linux与Shell  18个 上一篇创建函数下一篇正则表达式 阅读 63   饺子泡牛奶 108篇原创内容 收藏此内容的人还喜欢   呈现数据     我看过的号 饺子泡牛奶 不看的原因   SQL 审核 | SQLE 2.2306.0 来啦!     爱可生开源社区 不看的原因   你真的会在 Linux 上查看和刷新 DNS 缓存吗?     Docker中文社区 不看的原因      

标签:11,sed,centos,VM,gawk,初识,root,testdir
From: https://www.cnblogs.com/cherishthepresent/p/17539938.html

相关文章

  • gawk 进阶
    gawk进阶原创 饺子泡牛奶 饺子泡牛奶 2023-07-0908:40 发表于四川收录于合集#Linux与Shell18个本章内容:使用变量处理数组使用模式结构化命令格式化打印内建函数自定义函数一、使用变量所有编程语言共有的一个重要特性是使用变量来存取值。gawk 编程......
  • Why is 127.0.0.1 used for localhost?
       Whyis127.0.0.1usedforlocalhost?Doesanyoneknowwhythatnumberwaschosen?Althoughit’snotdocumentedanywhere(atleastasfarasIknow),buttherearesomelogicalexplanations.Butbeforegoing......
  • Effective Diversity in Population-Based Reinforcement Learning
    发表时间:2020(NeurIPS2020)文章要点:这篇文章提出了DiversityviaDeterminants(DvD)算法来提升种群里的多样性。之前的方法通常都考虑的两两之间的距离,然后设计一些指标或者加权来增加种群多样性,这种方式容易出现cycling,也就是类似石头剪刀布的循环克制的关系,造成训练不上去,......
  • flink初识
    一、flink:apache开源的一款流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。二、Flink是一个计算框架......
  • IDEA:AXIOS使用网页报错net::ERR_CONNECTION_REFUSED
     之前使用的是下载的文件,一直是报错的状态,页面加载不进来 之后进官网选择在线的之后可用。......
  • 初识html[230706]
    基础认知目标:认识网页组成、浏览器、web标准概念铺垫网页有哪些部分组成?文字图片视频音频超链接背后本质是什么?前端程序员、工程师的代码代码是通过什么软件转换成用户眼中的页面?通过浏览器“解析和渲染”常见:IE、Firefox、Chorme(辅助、自带调试功能多)、Saf......
  • 【论文阅读】CrossFormer: A Versatile Vision Transformer Based on Cross-scale Att
    来自CVPR2021论文地址:https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/2108.00154.pdf代码地址:https://link.zhihu.com/?target=https%3A//github.com/cheerss/CrossFormer一、Motivation 主要还是ViT的历史遗留问题ViT在处理输入时,将图片划分为了相等大小的图像......
  • 01_Avalonia+.NET 6 初识篇
    https://zhuanlan.zhihu.com/p/539490994 前言应信创(主要是国产麒麟系统)的要求,最近在看C/S架构跨平台的解决方案。由于之前的系统是使用WPF开发的,使用Avalonia跨平台改动的工作量会比较小。Avalonia是一个跨平台的.NETUI框架,支持Windows,Linux,MacOSX,IOS环境......
  • Caused by: com.mysql.cj.exceptions.CJCommunicationsException: Communications lin
    2023-07-061、问题描述测试mybatis-plus代码功能的时候出现Causedby:com.mysql.cj.exceptions.CJCommunicationsException:Communicationslinkfailure问题2、问题解决通过查阅,发现,这个是数据库连接的问题。打开navicat连接数据库,发现连接不上。因此需要看数据库服务是否......
  • Paper Reading: Model-Based Synthetic Sampling for Imbalanced Data
    目录研究动机文章贡献本文方法训练特征模型生成临时采样数据生成最终的合成数据实验结果数据集和实验设置实验结果消融实验结果可视化和集成学习相结合对非线性特征模型的影响特征关系对合成样本的影响优点和创新点PaperReading是从个人角度进行的一些总结分享,受到个人关注点的......