文本处理工具
文件查找
在文件系统上查找符合条件的文件
文件查找:
非实时查找(数据库查找):locate
实时查找:find
locate命令用于按照名称快速搜索文件所对应的位置,语法格式为“locate文件名称”。
使用find命令进行全盘搜索虽然更准确,但是效率有点低。如果仅仅是想找一些常见的且又知道大概名称的文件,不如试试locate命令。在使用locate命令时,先使用updatedb命令生成一个索引库文件,这个库文件的名字是/var/lib/mlocate/mlocate.db,后续在使用locate命令搜索文件时就是在该库中进行查找操作,速度会快很多。
第一次使用locate命令之前,记得先执行updatedb命令来生成索引数据库,然后再进行查找
常用选项
-i 不区分大小写搜索
-n N 只列举前N个匹配的文件
-r 使用基本正则表达式
搜索名称或路径包含“conf”的文件
find命令
find命令用于按照指定条件来查找文件所对应的位置,语法格式为“find [查找范围] 寻找条件”。
本书中会多次提到“Linux系统中的一切都是文件”,接下来就要见证这句话的分量了。在Linux系统中,搜索工作一般都是通过find命令来完成的,它可以使用不同的文件特性作为寻找条件(如文件名、大小、修改时间、权限等信息),一旦匹配成功则默认将信息显示到屏幕。
head命令 – 显示文件开头的内容,head命令的功能是显示文件开头的内容,默认为前10行。
语法格式:head [参数] 文件
常用参数: -n <数字> 定义显示行数
-c <数字> 指定显示头部内容的字符数
-v 总是显示文件名的头信息
-q 不显示文件名的头信息
tac命令 – 反向显示文件内容,tac命令的功能是用于反向显示文件内容,即常见的查看文件内容命令cat的反写形式,当我们使用tac命令查看文件内容时,最先显示的是最后一行,倒数第二行,倒数第三行,以此类推到最后显示原本文件的第一行内容。
语法格式:tac [参数] 文件
常用参数:
-b 在行前而非行尾添加分隔标志
-r 将分隔标志视作正则表达式来解析
-s 使用指定字符串代替换行作为分隔标志
--help 显示此帮助信息并退出
tr命令 – 字符转换工具;tr命令来自于英文单词transform的缩写,中文译为转换,其功能是用于字符转换。tr命令是一款批量字符转换、压缩、删除的文本工具,但仅能从标准输入中读取文本内容,需要与管道符或输入重定向操作符搭配使用。
语法格式:tr [参数] 字符串1 字符串2
常用参数:
-c 反选字符串1的补集(取反)
-d 删除字符串1中出现的所有字符
-s 删除所有重复出现的字符序列
uniq命令 – 去除文件中的重复内容行;uniq命令来自于英文单词unique的缩写,中文译为独特的、唯一的,其功能是用于去除文件中的重复内容行。uniq命令能够去除掉文件中相邻的重复内容行,如果两端相同内容中间夹杂了其他文本行,则需要先使用sort命令进行排序后再去重复,这样保留下来的内容就都是唯一的了。
语法格式:uniq [参数] 文件
常用参数:
-c 打印每行在文本中重复出现的次数
-d 每个重复纪录只出现一次
-u 只显示没有重复的纪录
grep命令 – 强大的文本搜索工具
通常将grep命令与正则表达式搭配使用,参数作为搜索过程中的补充或对输出结果的筛选,命令模式十分灵活。 与之容易混淆的是egrep命令和fgrep命令。如果把grep命令当作是标准搜索命令,那么egrep则是扩展搜索命令,等价于“grep -E”命令,支持扩展的正则表达式。而fgrep则是快速搜索命令,等价于“grep -F”命令,不支持正则表达式,直接按照字符串内容进行匹配。
语法格式: grep [参数] 文件名
常用参数:
-i 忽略大小写
-c 只输出匹配行的数量
-l 只列出符合匹配的文件名
-n 列出所有的匹配行并显示行号
-h 查询多文件时不显示文件名
-s 不显示没有匹配文本的错误信息
-v 显示不包含匹配文本的所有行
-w 匹配整词
-x 匹配整行
-r 递归搜索
-q 禁止输出任何结果
-b 显示匹配行距文件头部的偏移量
-o 显示匹配的词据文件头部的偏移量
-F 匹配固定字符串的内容
-E 支持扩展的正则表达式
标签:文件,匹配,文本处理,命令,查找,搜索,内容,工具 From: https://www.cnblogs.com/m490545607/p/17338272.html