首页 > 其他分享 >正则表达式

正则表达式

时间:2024-09-04 16:23:07浏览次数:5  
标签:输出 字符 正则表达式 指定 awk 分隔符 排序

什么是正则表达式 : 正则表达式就是为处理大量的字符串及文本而定义的一套规则和方法。
正则表达式就是把人类想要查询的东西,用计算机能识别的语言表达出来的一种规则。
正则表达式仅受三剑客( grep , sed , awk )命令支持,其他 命无法使用

        ^  //以什么开头;"^hzz" 表示以hzz单词开头的行、

        $  //以什么结尾;"hzz$" 表示以hzz单词结尾的行

        ^$  //组合符号,表示空行,^$之间为空表示空行

        .  //匹配任意的单个字符,匹配空格,不匹配空行

        \   //转义字符,让后面的一个特殊字符失效

        *  //匹配前一个字符(连续出现)0次或1次以上

        .*   //组合符号,匹配所有字符

        [abc]   //匹配[]内包含的任意一个字符a或b或c

        [a-z]  //配置[]内包含的a-z的任意一个字符

        [0-9]   //匹配[]内包含的0-9的任意一个数字

        [^abc]   //取反,表示匹配除了a b c这三个字符以外的其他字符

cut命令

cut命令是一个Linux/Unix命令,用于从文件或标准输入中提取字段并输出到标准输出。

cut 经常用来显示文件的内容,显示行中的指定部分,删除文件中指定字段。

语法:cut [选项] 文件名

-b:仅显示行中指定直接范围的内容;

-c:仅显示行中指定范围的字符;

-d:指定字段的分隔符,默认的字段分隔符为“TAB”;

-f:显示指定字段的内容;

-n:与“-b”选项连用,不分割多字节字符;

--complement:补足被选择的字节、字符或字段;

--out-delimiter= 字段分隔符:指定输出内容是的字段分割符;

--help:显示指令的帮助信息;

--version:显示指令的版本信息  

示例L(显示2,4列两列的内容)

printf命令语法:printf '输出类型输出格式' 输出内容

类型转 换符  说明 % c  输出 一个字符 % d    输出 一个整数 % f  输出 float 数 % s  输出 字符串 % b  开启 转义,后面输出字符串中若含有转义字符会进行 转义

 转义字符  解释

\n  换行 \r  回车 \t  水平制表符 \\  反斜杠 字符 awk 命令 awk ‌ 是一种强大的 文本(一) 处理 工具,用于在 Linux 系统中对文本文件进行模式扫描和 处理 Awk 命令一般使用关系表达式作为 条件

        语法:awk ‘条件1{动作1}条件2{动作2}...’ 文件名

        grep   过滤文本

         sed :   修改文本

         awk :  处理文本

        关系表达式 

        > :   小于 

        < :  大于 

        >= :  小于等于 

        <= :  大于等于 

        == :  等于 

        != :  不等于

一般使用关系表达式作为

条件

 x>6:判断x是否大于6

x>=6:是否大于等于6

动作

格式化输出

流程控制语句(for循环、if语句)

语法:awk '条件1{动作1}条件2{动作2}...' 文件名

示例查看student下第二列,没有条件,只要有数据全部都输出,printf 输出 $n代表输出第n 列,$0输出整行

排序命令 sort 语法:sort [ 选项 ] 文件名

        -f 忽略大小写

        -n 以数值型进行排序,默认使用字符串型排序

        -r 反向排序

        -t 指定分隔符,默认是分隔符是制表符

        -k n,m 按照指定的字段范围排序。从第n字段开始,m字段结束(默认到行尾)

以student.txt 分数(Mark)为例

降序

指定分隔符就是“:”,用第三字段开头,第三字段结尾排序,就是只 用第三字段排序统计命令wc

语法: wc [选项] 文件名

选项   解释

-l:   只统计行数

-w:  只统计单词数

-m:  只统计字符数

标签:输出,字符,正则表达式,指定,awk,分隔符,排序
From: https://blog.csdn.net/2401_84017066/article/details/141896812

相关文章

  • 11.吐血整理sed入门到精通,sed语法,脚本命令,打印,替换,删除,插入,行替换,字符替换,保
    文章目录前言sed介绍1.sed介绍2.sed语法介绍3.sed脚本命令1.打印2.s替换3.删除脚本命令d3.插入脚本命令a/i4.行替换脚本命令c4.字符替换脚本y5.保存内容脚本w6.插入其他文本r6.中断退出脚本命令q脚本命令当中的地址[address]正则表达式sed[选项]1.sed-i选项2.sed-e......
  • 正则表达式_java
    今日内容正则表达式教学目标能够理解正则表达式的作用能够使用正则表达式的字符类能够使用正则表达式的逻辑运算符能够使用正则表达式的预定义字符类能够使用正则表达式的限定符能够使用正则表达式的分组能够在String的split方法中使用正则表达式正则表达式......
  • Python正则表达式替换(sub)中如何使用替换函数
    defsub_the_chinese_colon_of_the_question_number(_lines:str)->str:""":param_lines:清理后的文本文件内容功能:查找并替换题号后的中文冒号为英文冒号。"""#定义替换函数,用于调用re.sub:defreplacement(match)->str:"&q......
  • 定义一个正则表达式,使用finditer从表达式内取值后存储到列表中
    演示代码:responce=requests.get(url=url_web,headers=head)url_obj=re.compile(r'<aclass="media-content"target="_blank"href="(?P<url>.*?)"title=".*?"',re.S)list_url=url_obj.finditer(respo......
  • 正则表达式
    1.简介正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到2.常用的实用正则表达式整理只能输入数字:"^[0-9]*$"。只能输入n位的数字:"^"d{n}$"。只能输入至少n位的数字:"^"d{n,}$"。只能......
  • # yyds干货盘点 # 盘点一个Python正则表达式问题
    大家好,我是皮皮。一、前言前几天在Python最强王者交流群【大锤子】问了一个Python正则表达式处理的问题,这里拿出来给大家分享下。下图是代码:二、实现过程这个问题确看上去是正则表达式的问题,这里【杯酒】提出问题并给出建议:使用+号,就能匹配所有符合条件的文字,而不是第一段。不过后......
  • 正则表达式的使用方法
    我们通过几个方法来讲解一下正则表达式的使用方法matchsearchfindallsubcompile首先,我们需要引入正则的常用匹配规则现在我们可以进行讲解了 matchmatch方法会尝试从字符串的起始位置开始匹配正则表达式,如果匹配,就返回匹配成功的结果;如果不匹配就返回Noneimportreco......
  • 正则表达式:Visual Basic中的强大文本处理工具
    正则表达式:VisualBasic中的强大文本处理工具在软件开发中,文本处理是一项常见且关键的任务。正则表达式作为一种强大的文本模式匹配工具,能够用于执行各种复杂的字符串搜索、替换、验证等操作。VisualBasic(VB),作为一门流行的编程语言,提供了对正则表达式的支持。本文将详细介......
  • C# 正则表达式
    正则表达式是一种匹配输入文本的模式。.Net框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。定义正则表达式下面列出了用于定义正则表达式的各种类别的字符、运算符和结构。字符转义字符类定位点分组构造限定符反向引用构造备......
  • 正则表达式(Regular Expression)
    正则表达式(RegularExpression)是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为"元字符"),可以用来描述和匹配字符串的特定模式,是一种用于模式匹配和搜索文本的工具,提供了一种灵活且强大的方式来查找、替换、验证和提取文本数据。概括:正则表达式是制定特定的......