首页 > 其他分享 >文本处理器sed 工具

文本处理器sed 工具

时间:2024-07-25 16:54:19浏览次数:9  
标签:tmp 文件 1.1 passwd sed 处理器 文本 root

在Linux/UNIX 系统中包含很多种类的文本处理器或文本编辑器,其中包括我们之前学习过的VIM 编辑器与grep 等。
而 grep,sed,awk 更是Shell 编程中经常用到的文本处理工具, 被称之为Shell 编程三剑客

1.1、sed 工具

sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。sed也可以在无交互的情况下实现相当复杂的文本处理操作,被广泛应用于Shell脚本中,用以完成各种自动化处理任务。

1.1.2、sed是什么

sed 命令是利用脚本来处理文本文件。它可以依照脚本的指令来处理、编辑文本文件。主要用来自动编 辑一个或多个文件、简化对文件的反复操作、编写转换程序等。

1.1.3、sed的原理

但是使用 sed 命令对文本进行操作之前必须要知道它的原理,它是怎么工作中的,这个非常重要,否则 会影响操作的结果的正确性 sed 的工作流程主要包括 读取、执行和显示三个过程。
读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。
执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行。
显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。
在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。


注意:默认情况下所有的 sed 命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。

1.1.4、sed的常用操作选项
1.sed 命令常见用法
通常情况下调用 sed 命令有两种格式,如下所示。

其中,“参数”是指操作的目标文件, 当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“-f” 选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。

  • sed [选项] '操作' 参数
  • sed [选项] -f scriptfile 参数

常见的 sed 命令选项主要包含以下几种。

  • -e 或--expression=:表示用指定命令或者脚本来处理输入的文本文件。
  • -f 或--file=:表示用指定的脚本文件来处理输入的文本文件。
  • -h 或--help:显示帮助。
  • -n、--quiet 或 silent:表示仅显示处理后的结果。
  • -i.bak:直接编辑文本文件。
  • -r, -E 使用扩展正则表达式
  • -s  将多个文件视为独立文件,而不是单个连续的长文件流

操作”用于指定对文件操作的动作行为,也就是 sed 的命令。通常情况下是采用的“[n1[,n2]]”操作参数的格式。n1、n2 是可选的,代表选择进行操作的行数,如操作需要在 5~ 20 行之间进行,则表示为“5,20 动作行为”。常见的操作包括以下几种。

  • a:增加,在当前行下面增加一行指定内容。
  • c:替换,将选定行替换为指定内容。
  • d:删除,删除选定的行。
  • i:插入,在选定行上面插入一行指定内容。
  • p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以 ASCII 码输出。其通常与“-n”选项一起使用。
  • s:替换,替换指定字符。
  • y:字符转换。

1.1.4、用法示例

1.1.4.1、打印输出 -n
cat -n /etc/passwd > /tmp/passwd cat -n 是加上序号 sed '' /tmp/passwd 打印原输出 sed 'p' /tmp/passwd 带有自动打印功能,p又再打印一遍 sed -n 'p' /tmp/passwd -n 选项关闭自动打印功能 当然,如果-n后面加数字还能 显示  行号 sed -n '1p' /tmp/passwd 直接显示第1 行 显示范围 sed -n '1,3p' /tmp/passwd sed -n '1p;3p;5p' /tmp/passwd 显示第一行 三行 五行 sed -n '3,+3p' /tmp/passwd 往后加3行,3行之后的再显示三行 奇数偶数表示 sed -n '1~2p' /tmp/passwd 1以及每隔2个,奇数 1从第一行开始,2选择每隔两行的行,p并打印出来 sed -n '2~2p' /tmp/passwd 偶数 #从第二行开始,2选择每隔两行的行,p并打印出来

sed -n '2~3p' /tmp/passwd #从第二行开始,3选择每隔三行的行,p并打印出来

 

sed -n '$p' /tmp/passwd 显示最后一行 sed -n '/root/p' /tmp/passwd 将包含root的行打印出来 /root(需要匹配的内容)/p(打印) 文件名 与 grep root /etc/passwd 功能相同 sed -n '/bash$/p' /tmp/passwd 将bash结尾 打印出来 文件名 sed -n '/s...x/p' /tmp/passwd /s...x/ 匹配包含一个字母 s,后面跟着任意三个字符,最后是一个字母 x 的行 p打印 sed -n '/[0-9]/p' /etc/passwd /[0-9]/ 匹配包含至少一个数字的行

 

sed -n '/^root/p' /etc/passwd 包含以root开头的行 sed -n '1!p' /tmp/passwd 1!p 的意思是除了第一行之外的所有行都会被打印出来 sed -n '/nologin/!p' /tmp/passwd 除了nologin都能打印出来 sed -n '/root/=' /tmp/passwd 描文件 /opt/passwd,找到所有包含字符串 "root" 的行;对于每一行,输出它在文件中的行号。

 

sed -n '/root/=;/root/p' /tmp/passwd 多个模式匹配用分号或 者-e sed   -n    -e    '/root/='     -e      '/root/p'    /tmp/passwd
这里,-e 允许你指定多个 sed 脚本,每个 -e 后面跟一个脚本。 第一个脚本 /root/= 匹配包含 "root" 的行并打印其行号,第二个脚本 /root/p 匹配包含 "root" 的行并打印该行内容。 sed -n '$=' zz.txt 相当于统计文件有几行 sed -n '$=;1p' zzz.txt 可以验证是逐行匹配
1.1.4.2、扩展正则r
sed 默认不支持扩展正则,如果要支持,需要加 -r 选项 sed -n '/^root|^shutdown/p' /etc/passwd sed -nr '/^root|^shutdown/p' /etc/passwd 可结合管道 df -h | sed -n '2p' 注意:通常 -n 和 ‘p’ 一起使用
1.1.4.3、增加内容 i
sed '2ihello world' /tmp/passwd 表示操作发生在第二行,i: 表示插入操作,即在指定的行之前插入文本hello world

sed '3ihello\nworld' /tmp/passwd sed '1ahello world' /tmp/passwd  a在当前行下面增加一行 sed '/li/a hello world' /tmp/passwd 在li的后面加 sed '2,4a hello world' /tmp/passwd sed '/li/a hello world;3p;3i shell' /tmp/passw 注意: a 或者 i 后面的所有内容都会被理解为需要添加的内容,也就是;无效
1.1.4.4、删除 d

sed  'd'  /tmp/passwd

sed '1d' /tmp/passwd sed  '1,4d'   /tmp/passwd 删除一到四行   echo '' >> /tmp/passwd echo '###' >> /tmp/passwd 在最后一行加入空行和### 把#开头的删除 sed  ‘/^$/d/'   /tmp/passwd     把空行删除
1.1.4.5、替换c
s/pattern/string/ 修饰符 查找替换 , 支持使用其它分隔符,可以是其它形式: s@@@ , s### 替换修饰符:
  • g 行内全局替换
  • p 显示替换成功的行
  • w /PATH/FILE 将替换成功的行保存至文件中
  • I,i 忽略大小写

实验

sed ‘/^root/ckgc’   /

sed '/^root/ckgc' /etc/passwd

把文件内容都换成yc

当然这里没有真的改变文件内容,只是输出到屏幕,如果想要真的替换,需要用 -i 选项,建议用 -i 之前对原文 件进行备份
1.1.4.6、搜索替换 s
c 指令使得整行内容全部替换, d 指令删除整行,如果要只替换某个关键词的话需要使用 s 指令 格式: sed 选项 ‘s/ 搜索的内容 / 替换的内容 / 动作 ’ 搜索 root 所在行把第一个出现的 root 换成 ROOT 搜索 root 所在行,把所有出现的 root 都替换成 ROOT 搜索字母 o ,仅替换每行第二个 o 为大写 O sed sed -n ‘s/o/O/2p’   /tmp/passwd 将 root 替换为空 sed -n 's/root//gp' /tmp/passwd 把 1-5 行的开头都插入 # 号 把所有 /sbin/nologin 换成yc , / 需要转义 sed  -n 's/\/sbin\/nologin/yc/gp'  /etc/passwd 但是使用默认的转义符之后阅读体验非常差,而且还容易写错,我们可以指定更有辨识度的转义符,例 如@,#, 数字都可以,将原来的 / 替换成我们想要的 我们只想搜索以 sync 开头的行并且前面加 # 号,那就需要保留 sync ,那就要把搜索的字符写成 & 就会被保 留不会一起替换,观察不加& 的区别。 忽略大小写 igp
1.1.4.7、插入文件 r
我们还可以将其他文件插入到当前文件当中处理 ,将/etc/hosts文件插入到/tmp/passwd 第三行后面 sed  '3r  /etc/hosts' /tmp/passwd sed  '/2/r  /etc/hosts'    /tmp/passwd 在匹配到包含数字  2 的行之后读取并插入文件  /etc/hosts 的内容 插入的是包含的东西 sed -n '$r  /etc/hosts'  /tmp/passwd
1.1.4.8、另存为到文件 w
使用 w 指令将当前编辑的文件内容另存到其他文件中,如果目标文件已存在,则会将目标文件的内容覆盖。 sed 'w /tmp/hosts' /etc/hosts 这个命令是将 /etc/hosts 文件中的内容复制到 /tmp/hosts 文件中 如果 /tmp/hosts 文件不存在, sed 命令会创建它;如果存在, sed 将会覆盖该文件的内容。 如果你想将 /etc/hosts 文件的内容追加到 /tmp/hosts 文件末尾,可以使用 >> 符号来实现,如 sed 'w /tmp/hosts' /etc/hosts >> /tmp/hosts 。 从 /etc/hosts 另存为到 tmp/hosts 中的第一行
1.1.4.9、同时编辑 -e

可以用-e同时编辑,sed支持一个或多个-e参数

1.1.4.10、分组操作ne {} ()

当我们需要对一行数据进行多次操作的时候我们可以使用{}进行分组

将root变成大写,x也是变成大写

sed   -ne '/root/{s/root/ROOT/;s/x/X/g}'   -ne   '1,10p'    /tmp/passwd 如果只是想看1到10行,则-ne

分组 s//代表查找替换 ()代表分组 \1 代表留下的组 r:读取指定文件

从 ifconfig 命令的输出中提取 ens33 网卡的 IP 地址。通过 sed 的正则表达式匹配,它会找到 包含 inet 字段的行,并从中提取出 IP 地址部分,然后输出这个 IP 地址
1.1.4.11、读取完退出

正常情况下sed会在读取完所有数据行之后退出,但是我们可以随时使用q指令来提前退出sed

注意:q不要和-i一起使用,以免覆盖源文件

1.1.4.12、sed脚本

有时我们需要对文件进行的增、删、改比较多,但是一条一条修改比较麻烦,所以对于指令比较多的情 况,我们可以先将所有的sed 指令写入一个文本文件中,然后通过 sed 的 -f 选项读取该指令文件即可实现多指令操作。 使用 sed 命令迁移符合条件的文本时,常用到以下参数 .
  • H:复制到剪贴板;
  • g、G:将剪贴板中的数据覆盖/追加至指定行;
  • w:保存为文件;
  • r:读取指定文件;
  • a:追加指定内容。具体操作方法如下所示。
  • I,i 忽略大小写
1.1.4.13、 sed的高级应用 -r 匹配正则 保留空间的使用 结合变量使用 1.1.4.14、 拓展和总结 总结 =是行号,/p是打印

标签:tmp,文件,1.1,passwd,sed,处理器,文本,root
From: https://blog.csdn.net/YCyjs/article/details/140660845

相关文章

  • 为什么在 tkinter 中的第二个窗口中使用 Tk() 而不是 Toplevel() 不允许我更新标签中
    首先,我是初学者,所以请不要指望这是专业的,但我需要帮助我想在我的新窗口中使用Tk()因为我要销毁主窗口并让第二个窗口运行时,当我使用它时,它不会让我的标签的文本变量更新,但通过使用toplevel()进行简单的更改就可以了,到底是怎么回事??Chatgpt没有帮助,他说了很多没有什么......
  • WebKit的文本装饰艺术:CSS Text Decoration全解析
    WebKit的文本装饰艺术:CSSTextDecoration全解析CSS文本装饰(TextDecoration)是一组用于美化和增强网页文本表现的属性,它们可以为文本添加下划线、上划线、线删除和强调标记等效果。WebKit作为许多现代浏览器的渲染引擎,对CSS文本装饰的支持非常全面。本文将深入探讨WebKit对......
  • PPLM:可控文本生成
    最近一直捣鼓生成式模型的东西,特别是关于利用现有预训练模型的生成式,中间很多挺有意思的坑,先不说。生成式中一个比较大的需求是,可控文本生成,其中可控表示能让模型生成与所需主题相关的文本,这也涉及到文本的风格迁移。往往即便是现有超大语言模型,如GPT2,可以生成没有任何拼写和语......
  • Linux 文本文件编辑相关命令简介【Linux 常用命令系列二】
    〇、前言本文介绍了如何通过vim命令,对文本文件进行打开、编辑、保存等相关操作,并通过简单的示例演示了常用用法。一、关于文本文件的操作1.1打开,查看(cat)、编辑(vim)打开文本文件,有查看和编辑两种状态。1.1.1仅查看cat可以使用cat命令,加上文件的绝对路径或者进入目标路......
  • object dict cannot be used in await expression报错解释
    报错解释:这个错误通常出现在使用Python的异步编程模型时,尝试在一个不支持异步的对象上使用await关键字。在Python中,await关键字只能在异步函数中使用,而异步函数通常定义在asyncdef语句中。错误"objectdictcannotbeusedinawaitexpression"意味着你正尝试在一个普通的字典......
  • Tools - 通过PlantUML进行文本方式绘图
    PlantUML简介PlantUML是支持多系统多编辑器的一个以文字方式绘图的工具,可以根据文字表述直接生成图,支持时序图、流程图、用例图、状态图、组件图等。能够以插件形式被Idea、VSCode、PyCharm等编辑工具所集成需先安装Java和开源图片渲染库Graphviz,否则无法正常显示需要先熟悉......
  • Unity 富文本 link 标签使用办法
    varstring=<link=url><u><#0076FF>openurl</u></color></link>text里面设置这个字符串 publicvoidOnPointerClick(PointerEventDataeventData){intlinkIndex=TMP_TextUtilities.Fin......
  • MM6100 MOTOROLA 可信处理器模块
    品牌、MOTOROLA品名:可信处理器模块接口:4通道电流:24毫安原产地:USA美国MM6100系列是首款采用TundraTs41*VMEbus接口芯片设计的MEbu单板计算机(SCO,提供2eSTVMEbus性能.2essT两个边象源同步传输协议便VMEbus在大多数情况下以320MB/s的实际带宽运行。MVME162PA-344SE-G2......
  • [error] [default] Error sending telemetry FetchError: The pending stream has bee
    我在VSCode使用GithubCopilot时遇到了一个问题。报错信息如下:[error][default]ErrorsendingtelemetryFetchError:Thependingstreamhasbeencanceled(causedby:unabletoverifythefirstcertificate)具体信息:2024-07-2317:44:56.712[error][default]Erro......
  • ASTGNN(Localised Adaptive Spatial-Temporal Graph Neural Network)
    引言        本文主要探讨的问题是:能否以及在多大程度上对时空图模型进行局部化。并且将研究领域集中到ASTGNN上。ASTGNNs通常使用自适应图卷积层对空间依赖性进行建模。通过学习图邻接矩阵来捕获空间依赖性。因此,ASTGNN的局部化是通过邻接矩阵(仅捕获空间依赖性)的稀疏......