首页 > 数据库 >oracle正则表达式

oracle正则表达式

时间:2023-08-03 16:04:19浏览次数:57  
标签:正则表达式 REG test TEST REGEXP oracle regexp ID

oracle正则表达式

oracle regexp

参考:https://zhuanlan.zhihu.com/p/449885289

基础数据

CREATE TABLE REG_EXP_TEST(ID VARCHAR2(50));

INSERT INTO REG_EXP_TEST (ID)VALUES('GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG');

INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith, 10045 Berry Lane, San Joseph, CA 91234');

INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith');

INSERT INTO REG_EXP_TEST (ID)VALUES('10045 91234');

INSERT INTO REG_EXP_TEST (ID)VALUES('15888 646455');

INSERT INTO REG_EXP_TEST (ID)VALUES('asdfasdf fgfgfgfgf');

COMMIT;

regexp_substr描述

名称:regexp_substr(p1 , pattern , start_position , target_position)

功能:截取字符串中满足模式的子串

参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始截取 ,target_position : 返回第几个满足条件的子串

返回值: 字符串

--查询REG_EXP_TEST 表中ID列中的第3次出现的数字组( 相邻的数字看成一组)

SELECT REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)FROM REG_EXP_TEST R;

regexp_substr示例

**查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组) **

SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;

ID                                                 SUBSTR(R. REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)
-------------------------------------------------- --------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            GGG       46
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  Joe
Joe Smith                                          Joe
10045 91234                                        100
15888 646455                                       158
asdfasdf fgfgfgfgf                                 asd

已选择 6 行。

C##SCOTT@LHRCDB>

查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组)

SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;

ID                                                 REGEXP_SUBSTR(R.ID,'[A-ZA-Z]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            FDSFD
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  Berry
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf

已选择 6 行。

C##SCOTT@LHRCDB>

**查询REG_EXP_TEST 表中ID列中的第3次出现的字母数字组( 相邻的字母数字看成一组) **

SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;

ID                                                 REGEXP_SUBSTR(R.ID,'[A-ZA-Z0-9]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            454
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  10045
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf

已选择 6 行。

C##SCOTT@LHRCDB>

regexp_instr

名称:regexp_instr(p1 , pattern , start_position , target_position)

功能:这个函数返回一个模式的起始位置,因此它的功能非常类似于 INSTR 函数。

新的 REGEXP_INSTR 函数的语法在表 6 中给出。这两个函数之间的主要区别是,REGEXP_INSTR 让您指定一种模式,而不是一个特定的搜索字符串

参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始搜索 ,target_position : 返回第几个满足条件的子串的位置

返回值: 整数

--注[[:alpha:]]统计字符的个数 [[:digit:]]统计数字的个数

regexp_instr示例

**查询REG_EXP_TEST 表中ID列中出现在字符串末尾的5位数字(有一串字符串必须是五位数字结尾, 超过五位也可以,四位就不行) **

SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--或
SELECT R.ID, REGEXP_INSTR(R.ID,'[0-9]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;

ID                                                       DIGI
-------------------------------------------------- ----------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG                     0
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234          45
Joe Smith                                                   0
10045 91234                                                 7
15888 646455                                                8
asdfasdf fgfgfgfgf                                          0

已选择 6 行。

C##SCOTT@LHRCDB>

regexp_like

名称:regexp_like(p1 , pattern )

功能: 判断某个字符串中是否包括特定模式的子串, 有则返回true ,否则flase

参数: p1: 目标字符串, pattern: 匹配模式

返回值: 布尔值

regexp_like示例

查询REG_EXP_TEST 表中ID列中包括5位数字的记录

SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[[:digit:]]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[[:digit:]]{5}');
--或
SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[0-9]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[0-9]{5}');

regexp_count

名称:regexp_count(p1 , pattern )

功能: 统计某个字符串中包括特定模式的子串的个数

参数: p1: 目标字符串, pattern: 匹配模式

返回值: 0或者正整数

regexp_count示例

查询REG_EXP_TEST 表中ID列中包括5位数字的个数

SELECT R.ID ,REGEXP_COUNT(R.ID,'[[:digit:]]{5}')FROM REG_EXP_TEST R;

regexp_replace

名称:regexp_count(p1 , pattern , target_str )

功能: 将字符串中的满足模式的子串替换为目标字符串

参数: p1: 目标字符串, pattern: 匹配模式 ,target_str : 目标字符串

返回值: 字符串

regexp_replace示例

将 'Joe Smith'中间的多个空格替换为1个空格

SELECT REPLACE('Joe Smith',' ')AS replace FROM dual; --将空格替换掉
SELECT REGEXP_REPLACE('Joe Smith',' +',' ')AS replace FROM dual;

Oracle正则表达式(regularexpression)

参考:https://blog.csdn.net/weixin_34023863/article/details/92302772?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-92302772-blog-126680105.235^v38^pc_relevant_default_base3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-92302772-blog-126680105.235^v38^pc_relevant_default_base3&utm_relevant_index=2

元字符

字符含义

举例说明

^

匹配字符串的开始位置(在[]中使用,此时它表示不接受该字符集合。

a:匹配以a开始的字符串[a]:匹配不含a的字符串

-

当使用在a-m表示范围;当使用在第一个字符时表示连字符串,如[-abc]


$

匹配字符结束位置

‘a$':匹配以a结束的字符串

.

匹配除换行符 n之外的任何单字符。


?

匹配前面的子表达式零次或一次

tr(y(ing)?):可以表示try或者trying

*

匹配前面的子表达式零次或多次


+

匹配前面的子表达式一次或多次


()

标记一个子表达式的开始和结束位置

a(b)*可以匹配ab,abb,abbb,youabb(c|d)匹配c或d

[]

标记一个中括号表达式

[cd]匹配选择c或d等同于(c|d)。匹配的是单字符,[^cd]是匹配c,d之外的单字符。[a-z]表示所有小写字母

{m,n}

m= <出现次数 <=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。


|

表示或者的关系。指明两项之间的一个选择


字符簇

字符含义


[[:alpha:]]

任何字母。


[[:digit:]]

[[:digit:]] 任何数字。


[[:alnum:]]

任何字母和数


[[:space:]]

任何白字符。


[[:upper:]]

任何大写字母。


[[:lower:]]

任何小写字母。


[[:punct:]]

任何标点符号。


[[:xdigit:]]

任何16进制的数字,相当于[0-9a-fA-F]。


特殊字符

'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 'n' 或 'r'。
'.' 匹配除换行符 n之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'*' 匹配前面的子表达式零次或多次。
'+' 匹配前面的子表达式一次或多次。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。
num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
正则表达式的一个很有用的特点是可以保存子表达式以后使用, 被称为Backreferencing. 允许复杂的替换能力
如调整一个模式到新的位置或者指示被代替的字符或者单词的位置. 被匹配的子表达式存储在临时缓冲区中,
缓冲区从左到右编号, 通过数字符号访问。 下面的例子列出了把名字 aa bb cc 变成
cc, bb, aa.
Select REGEXP_REPLACE('aa bb cc','(.*) (.*) (.*)', '3, 2, 1') FROM dual;
REGEXP_REPLACE('ELLENHILDISMIT
cc, bb, aa

转义符

[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。

各种操作符的运算优先级
转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序
| “或”操作

函数例子

create table test(mc varchar2(60));

insert into test values('112233445566778899');
insert into test values('22113344 5566778899');
insert into test values('33112244 5566778899');
insert into test values('44112233 5566 778899');
insert into test values('5511 2233 4466778899');
insert into test values('661122334455778899');
insert into test values('771122334455668899');
insert into test values('881122334455667799');
insert into test values('991122334455667788');
insert into test values('aabbccddee');
insert into test values('bbaaaccddee');
insert into test values('ccabbddee');
insert into test values('ddaabbccee');
insert into test values('eeaabbccdd');
insert into test values('ab123');
insert into test values('123xy');s
insert into test values('007ab');
insert into test values('abcxy');
insert into test values('The final test is is is how to find duplicate words.');

commit;

一、REGEXP_LIKE

select * from test where regexp_like(mc,'^a{1,3}');
select * from test where regexp_like(mc,'a{1,3}');
select * from test where regexp_like(mc,'^a.*e$');
select * from test where regexp_like(mc,'^[[:lower:]]|[[:digit:]]');
select * from test where regexp_like(mc,'^[[:lower:]]');
Select mc FROM test Where REGEXP_LIKE(mc,'[^[:digit:]]');
Select mc FROM test Where REGEXP_LIKE(mc,'^[^[:digit:]]');

二、REGEXP_INSTR

Select REGEXP_INSTR(mc,'[[:digit:]]$') from test;
Select REGEXP_INSTR(mc,'[[:digit:]]+$') from test;
Select REGEXP_INSTR('The price is $400.','$[[:digit:]]+') FROM DUAL;
Select REGEXP_INSTR('onetwothree','[^[[:lower:]]]') FROM DUAL;
Select REGEXP_INSTR(',,,,,','[^,]*') FROM DUAL;
Select REGEXP_INSTR(',,,,,','[^,]') FROM DUAL;

三、REGEXP_SUBSTR

SELECT REGEXP_SUBSTR(mc,'[a-z]+') FROM test;
SELECT REGEXP_SUBSTR(mc,'[0-9]+') FROM test;
SELECT REGEXP_SUBSTR('aababcde','^a.*b') FROM DUAL;

四、REGEXP_REPLACE

Select REGEXP_REPLACE('Joe Smith','( ){2,}', ',') AS RX_REPLACE FROM dual;
Select REGEXP_REPLACE('aa bb cc','(.*) (.*) (.*)', '3, 2, 1') FROM dual;

20个最常用正则表达式

#1 . 校验密码强度:密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间
^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

#2. 校验中文:字符串仅能是中文
^[\\u4e00-\\u9fa5]{0,}$

# 3. 由数字、26个英文字母或下划线组成的字符串:
^\\w+$

#4. 校验E-Mail 地址:同密码一样,下面是E-mail地址合规性的正则检查语句。
[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w

#5. 校验身份证号码:下面是身份证号码的正则校验。15 或 18位。
#15位
^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$
#18位
^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

#6. 校验日期:“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。
^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

#7. 校验金额:金额校验,精确到2位小数。
^[0-9]+(.[0-9]{2})?$

#8. 校验手机号:下面是国内 13、15、18开头的手机号正则表达式。
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

#9. 判断IE的版本:IE目前还没被完全取代,很多页面还是需要做版本兼容,下面是IE版本检查的表达式。
^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

#10. 校验IP-v4地址:IP4 正则语句
\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

#11. 校验IP-v6地址:IP6 正则语句。
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

#12. 检查URL的前缀:应用开发中很多时候需要区分请求是HTTPS还是HTTP,通过下面的表达式可以取出一个url的前缀然后再逻辑判断。
if (!s.match(/^[a-zA-Z]+:\\/\\//))
{
 s = 'http://' + s;
}

#13. 提取URL链接:下面的这个表达式可以筛选出一段文本中的URL。
^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

#14. 文件路径及扩展名校验:下面的这个表达式可以筛选出一段文本中的URL。
^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

#14. 文件路径及扩展名校验:验证文件路径和扩展名
^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

#15. 提取Color Hex  Codes:有时需要抽取网页中的颜色代码,可以使用下面的表达式。
\\#([a-fA-F]|[0-9]){3,6}

#16. 提取网页图片:假若你想提取网页中所有图片信息,可以利用下面的表达式。
\\< *[img][^\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

#17. 提取页面超链接:提取html中的超链接。
(<;a\\s*(?!.*\\brel=)[^>;]*)(href="https?://)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list)

#18. 精炼CSS:通过下面的表达式,可以搜索相同属性值的CSS,从而达到精炼代码的目的。
^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}

#19. 抽取注释:如果你需要移除HMTL中的注释,可以使用如下的表达式。
<!--(.*?)--> 

#20. 匹配HTML标签:通过下面的表达式可以匹配出HTML中的标签。
</?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)/?>

校验数字表达式

1 数字:^[0-9]*$ 

2 n位的数字:^\d{n}$

3 至少n位的数字:^\d{n,}$ 

4 m-n位的数字:^\d{m,n}$ 

5 零和非零开头的数字:^(0|[1-9][0-9]*)$ 

6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$ 

7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$ 

8 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$ 

9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$

10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$

11 非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$

12 非零的负整数:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$

13 非负整数:^\d+$ 或 ^[1-9]\d*|0$

14 非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$

15 非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$

16 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

17 正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

18 负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

19 浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校验字符的表达式

1 汉字:^[\u4e00-\u9fa5]{0,}$ 

2 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$ 

3 长度为3-20的所有字符:^.{3,20}$ 

4 由26个英文字母组成的字符串:^[A-Za-z]+$ 

5 由26个大写英文字母组成的字符串:^[A-Z]+$ 

6 由26个小写英文字母组成的字符串:^[a-z]+$ 

7 由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$ 

8 由数字、26个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$ 

9 中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$

10 中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$

11 可以输入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+

12 禁止输入含有~的字符:[^~\x22]+

特殊需求表达式

1 Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ 

2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? 

3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ 

4 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 

5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$  

6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7} 

7 身份证号(15位、18位数字):^\d{15}|\d{18}$ 

8 短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$ 

9 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

10 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$

11 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

12 日期格式:^\d{4}-\d{1,2}-\d{1,2}

13 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$

14 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$

15 钱的输入格式:

16 1.有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$

17 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|[1-9][0-9]*)$

18 3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$

19 4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$

20 5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过的:^[0-9]+(.[0-9]{2})?$

21 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$

22 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$

23 8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$

24 备注:这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里

25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$

26 中文字符的正则表达式:[\u4e00-\u9fa5]

27 双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))

28 空白行的正则表达式:\n\s*\r (可以用来删除空白行)

29 HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)

30 首尾空白字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)

31 腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)

32 中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字) 33 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址时有用) 34 IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

regexp_extract (CRDB自带函数)

语法:regexp_extract(stringsubject, stringpattern, intindex)

说明:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符

  • 第一参数:要处理的字段
  • 第二参数: 需要匹配的正则表达式
  • 第三个参数:0是显示与之匹配的整个字符串;1 是显示第一个括号里面的,默认为1 ;2 是显示第二个括号里面的字段...
select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',0);
得到的结果为:itde

select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',1) ;
得到的结果为:i

select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',2) 
得到的结果为:td

select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',2) from default.dual;
得到的结果为:abc

regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',0),            -- i41915173660
regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',1)             -- 41915173660

标签:正则表达式,REG,test,TEST,REGEXP,oracle,regexp,ID
From: https://blog.51cto.com/363329071/6949921

相关文章

  • oracle修改数据类型报错
    1. nvarchar和blob类型转换时,直接modify会报错ORA-01735:invalidALTERTABLEoption2. 数字类型降低精度时 当数据库已有数据时,会报错ORA-01440:columntobemodifiedmustbeemptytodecreaseprecisionorscale 以上两种字段类型修改错误可以通过一下方式来避免......
  • 使用正则表达式 移除 HTML 标签后得到字符串
    需求分析后台返回的数据是这样式的需要讲html标签替换high_light_text:"<spanstyle='color:red'>OPPO</span><spanstyle='color:red'>OPPO</span>白色01"使用正则表达式functionstripHTMLTags(htmlString){returnhtmlString.repl......
  • 09通过正则表达式提取电影名称
    importrequestsimportrefromtimeimportsleep#目标电影网;https://nnyy.best/,爬取电影名字做测试。res=requests.session()headers={'authority':'nnyy.best','cache-control':'max-age=0','upgrade-insecur......
  • 一个oracle视频资料比较丰富的地方
    一个oracle视频资料比较丰富的地方,推荐之,地址是http://www.boobooke.com/bbs/viewthread.php?tid=2926&extra=page%3D1以及其www.boobooke.com网站,也有不少linux的好视频......
  • 数据库事务的四种隔离性及Oracle\MySQL默认隔离级别和原因分析
    1事务一个事务中的一系列的处理操作要么全部成功,要么一个都不做。在数据库操作中,一项事务(Transaction)是由一条或多条操作数据库的SQL语句组成的一个不可分割的工作单元。事务的处理结果有两种:1)当事务中的所有步骤全部成功执行时,事务提交,成功;2)如果其中任何一个步骤失败,该事务......
  • Oracle备份数据
    存储过程CREATEORREPLACEPROCEDUREDATA_MIGRATION(endDayVARCHAR2)ISQUERY_SQLVARCHAR(10000);COM_STRVARCHAR(10000);BEGIN QUERY_SQL:='CREATETABLEGPS_OLD_'||REPLACE(endDay,'-','')||'ASSELECT*F......
  • oracle脚本
    ------------------------------------------------------------------------------------------------------------在查看数据的连接情况很有用,写完程序一边测试代码一边查看数据库连接的释放情况有助于分析优化出一个健壮的系统程序来。1、查看当前的数据库连接数selectcount......
  • 对Oracle数据库的一下操作脚本
    --进去oracle服务器数据库su-oraclesqlplus/assysdba--查看所有容器showpdbs--查看当前容器showcon_name;--打开相应容器alterpluggabledatabaseorclpdbopen;--切换容器altersessionsetcontainer=ORCLPDB1;--创建表空间,指定文件createtablespaceOPSCW_DAT......
  • Docker安装Oracle11g
    1.拉取oracle数据库镜像dockerpullregistry.cn-hangzhou.aliyuncs.com/helowin/oracle_11g 2.启动oracle 自动启动镜像--restart=alwaysdockerrun-p1521:1521--nameoracle_11g-d--restart=alwaysregistry.cn-hangzhou.aliyuncs.com/helowin/oracle_11g3......
  • 正则表达式学习记录
    re正则表达式总结0、一般字符字符意义.a.c→abc,aic,a&c等(不包括换行符\转义字符,让字符变回原来的意思[...]在括号中任选一个:a[bcd]→ab,ac,ad1、预定义字符字符意义\d匹配一个数字字符,等价于[0-9]\D匹配一个非数字字符,等价于......