oracle正则表达式
oracle regexp
参考:https://zhuanlan.zhihu.com/p/449885289
基础数据
CREATE TABLE REG_EXP_TEST(ID VARCHAR2(50));
INSERT INTO REG_EXP_TEST (ID)VALUES('GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG');
INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith, 10045 Berry Lane, San Joseph, CA 91234');
INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith');
INSERT INTO REG_EXP_TEST (ID)VALUES('10045 91234');
INSERT INTO REG_EXP_TEST (ID)VALUES('15888 646455');
INSERT INTO REG_EXP_TEST (ID)VALUES('asdfasdf fgfgfgfgf');
COMMIT;
regexp_substr描述
名称:regexp_substr(p1 , pattern , start_position , target_position)
功能:截取字符串中满足模式的子串
参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始截取 ,target_position : 返回第几个满足条件的子串
返回值: 字符串
--查询REG_EXP_TEST 表中ID列中的第3次出现的数字组( 相邻的数字看成一组)
SELECT REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)FROM REG_EXP_TEST R;
regexp_substr示例
**查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组) **
SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;
ID SUBSTR(R. REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)
-------------------------------------------------- --------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG GGG 46
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234 Joe
Joe Smith Joe
10045 91234 100
15888 646455 158
asdfasdf fgfgfgfgf asd
已选择 6 行。
C##SCOTT@LHRCDB>
查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组)
SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;
ID REGEXP_SUBSTR(R.ID,'[A-ZA-Z]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG FDSFD
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234 Berry
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf
已选择 6 行。
C##SCOTT@LHRCDB>
**查询REG_EXP_TEST 表中ID列中的第3次出现的字母数字组( 相邻的字母数字看成一组) **
SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;
ID REGEXP_SUBSTR(R.ID,'[A-ZA-Z0-9]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG 454
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234 10045
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf
已选择 6 行。
C##SCOTT@LHRCDB>
regexp_instr
名称:regexp_instr(p1 , pattern , start_position , target_position)
功能:这个函数返回一个模式的起始位置,因此它的功能非常类似于 INSTR 函数。
新的 REGEXP_INSTR 函数的语法在表 6 中给出。这两个函数之间的主要区别是,REGEXP_INSTR 让您指定一种模式,而不是一个特定的搜索字符串
参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始搜索 ,target_position : 返回第几个满足条件的子串的位置
返回值: 整数
--注[[:alpha:]]统计字符的个数 [[:digit:]]统计数字的个数
regexp_instr示例
**查询REG_EXP_TEST 表中ID列中出现在字符串末尾的5位数字(有一串字符串必须是五位数字结尾, 超过五位也可以,四位就不行) **
SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--或
SELECT R.ID, REGEXP_INSTR(R.ID,'[0-9]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;
ID DIGI
-------------------------------------------------- ----------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG 0
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234 45
Joe Smith 0
10045 91234 7
15888 646455 8
asdfasdf fgfgfgfgf 0
已选择 6 行。
C##SCOTT@LHRCDB>
regexp_like
名称:regexp_like(p1 , pattern )
功能: 判断某个字符串中是否包括特定模式的子串, 有则返回true ,否则flase
参数: p1: 目标字符串, pattern: 匹配模式
返回值: 布尔值
regexp_like示例
查询REG_EXP_TEST 表中ID列中包括5位数字的记录
SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[[:digit:]]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[[:digit:]]{5}');
--或
SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[0-9]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[0-9]{5}');
regexp_count
名称:regexp_count(p1 , pattern )
功能: 统计某个字符串中包括特定模式的子串的个数
参数: p1: 目标字符串, pattern: 匹配模式
返回值: 0或者正整数
regexp_count示例
查询REG_EXP_TEST 表中ID列中包括5位数字的个数
SELECT R.ID ,REGEXP_COUNT(R.ID,'[[:digit:]]{5}')FROM REG_EXP_TEST R;
regexp_replace
名称:regexp_count(p1 , pattern , target_str )
功能: 将字符串中的满足模式的子串替换为目标字符串
参数: p1: 目标字符串, pattern: 匹配模式 ,target_str : 目标字符串
返回值: 字符串
regexp_replace示例
将 'Joe Smith'中间的多个空格替换为1个空格
SELECT REPLACE('Joe Smith',' ')AS replace FROM dual; --将空格替换掉
SELECT REGEXP_REPLACE('Joe Smith',' +',' ')AS replace FROM dual;
Oracle正则表达式(regularexpression)
元字符 | 字符含义 | 举例说明 |
^ | 匹配字符串的开始位置(在[]中使用,此时它表示不接受该字符集合。 | a:匹配以a开始的字符串[a]:匹配不含a的字符串 |
- | 当使用在a-m表示范围;当使用在第一个字符时表示连字符串,如[-abc] | |
$ | 匹配字符结束位置 | ‘a$':匹配以a结束的字符串 |
. | 匹配除换行符 n之外的任何单字符。 | |
? | 匹配前面的子表达式零次或一次 | tr(y(ing)?):可以表示try或者trying |
* | 匹配前面的子表达式零次或多次 | |
+ | 匹配前面的子表达式一次或多次 | |
() | 标记一个子表达式的开始和结束位置 | a(b)*可以匹配ab,abb,abbb,youabb(c|d)匹配c或d |
[] | 标记一个中括号表达式 | [cd]匹配选择c或d等同于(c|d)。匹配的是单字符,[^cd]是匹配c,d之外的单字符。[a-z]表示所有小写字母 |
{m,n} | m= <出现次数 <=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。 | |
| | 表示或者的关系。指明两项之间的一个选择 | |
字符簇 | 字符含义 | |
[[:alpha:]] | 任何字母。 | |
[[:digit:]] | [[:digit:]] 任何数字。 | |
[[:alnum:]] | 任何字母和数 | |
[[:space:]] | 任何白字符。 | |
[[:upper:]] | 任何大写字母。 | |
[[:lower:]] | 任何小写字母。 | |
[[:punct:]] | 任何标点符号。 | |
[[:xdigit:]] | 任何16进制的数字,相当于[0-9a-fA-F]。 |
特殊字符
'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 'n' 或 'r'。
'.' 匹配除换行符 n之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'*' 匹配前面的子表达式零次或多次。
'+' 匹配前面的子表达式一次或多次。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。
num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
正则表达式的一个很有用的特点是可以保存子表达式以后使用, 被称为Backreferencing. 允许复杂的替换能力
如调整一个模式到新的位置或者指示被代替的字符或者单词的位置. 被匹配的子表达式存储在临时缓冲区中,
缓冲区从左到右编号, 通过数字符号访问。 下面的例子列出了把名字 aa bb cc 变成
cc, bb, aa.
Select REGEXP_REPLACE('aa bb cc','(.*) (.*) (.*)', '3, 2, 1') FROM dual;
REGEXP_REPLACE('ELLENHILDISMIT
cc, bb, aa
转义符
[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序
| “或”操作
函数例子
create table test(mc varchar2(60));
insert into test values('112233445566778899');
insert into test values('22113344 5566778899');
insert into test values('33112244 5566778899');
insert into test values('44112233 5566 778899');
insert into test values('5511 2233 4466778899');
insert into test values('661122334455778899');
insert into test values('771122334455668899');
insert into test values('881122334455667799');
insert into test values('991122334455667788');
insert into test values('aabbccddee');
insert into test values('bbaaaccddee');
insert into test values('ccabbddee');
insert into test values('ddaabbccee');
insert into test values('eeaabbccdd');
insert into test values('ab123');
insert into test values('123xy');s
insert into test values('007ab');
insert into test values('abcxy');
insert into test values('The final test is is is how to find duplicate words.');
commit;
一、REGEXP_LIKE
select * from test where regexp_like(mc,'^a{1,3}');
select * from test where regexp_like(mc,'a{1,3}');
select * from test where regexp_like(mc,'^a.*e$');
select * from test where regexp_like(mc,'^[[:lower:]]|[[:digit:]]');
select * from test where regexp_like(mc,'^[[:lower:]]');
Select mc FROM test Where REGEXP_LIKE(mc,'[^[:digit:]]');
Select mc FROM test Where REGEXP_LIKE(mc,'^[^[:digit:]]');
二、REGEXP_INSTR
Select REGEXP_INSTR(mc,'[[:digit:]]$') from test;
Select REGEXP_INSTR(mc,'[[:digit:]]+$') from test;
Select REGEXP_INSTR('The price is $400.','$[[:digit:]]+') FROM DUAL;
Select REGEXP_INSTR('onetwothree','[^[[:lower:]]]') FROM DUAL;
Select REGEXP_INSTR(',,,,,','[^,]*') FROM DUAL;
Select REGEXP_INSTR(',,,,,','[^,]') FROM DUAL;
三、REGEXP_SUBSTR
SELECT REGEXP_SUBSTR(mc,'[a-z]+') FROM test;
SELECT REGEXP_SUBSTR(mc,'[0-9]+') FROM test;
SELECT REGEXP_SUBSTR('aababcde','^a.*b') FROM DUAL;
四、REGEXP_REPLACE
Select REGEXP_REPLACE('Joe Smith','( ){2,}', ',') AS RX_REPLACE FROM dual;
Select REGEXP_REPLACE('aa bb cc','(.*) (.*) (.*)', '3, 2, 1') FROM dual;
20个最常用正则表达式
#1 . 校验密码强度:密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间
^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
#2. 校验中文:字符串仅能是中文
^[\\u4e00-\\u9fa5]{0,}$
# 3. 由数字、26个英文字母或下划线组成的字符串:
^\\w+$
#4. 校验E-Mail 地址:同密码一样,下面是E-mail地址合规性的正则检查语句。
[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w
#5. 校验身份证号码:下面是身份证号码的正则校验。15 或 18位。
#15位
^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$
#18位
^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$
#6. 校验日期:“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。
^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$
#7. 校验金额:金额校验,精确到2位小数。
^[0-9]+(.[0-9]{2})?$
#8. 校验手机号:下面是国内 13、15、18开头的手机号正则表达式。
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$
#9. 判断IE的版本:IE目前还没被完全取代,很多页面还是需要做版本兼容,下面是IE版本检查的表达式。
^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$
#10. 校验IP-v4地址:IP4 正则语句
\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b
#11. 校验IP-v6地址:IP6 正则语句。
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))
#12. 检查URL的前缀:应用开发中很多时候需要区分请求是HTTPS还是HTTP,通过下面的表达式可以取出一个url的前缀然后再逻辑判断。
if (!s.match(/^[a-zA-Z]+:\\/\\//))
{
s = 'http://' + s;
}
#13. 提取URL链接:下面的这个表达式可以筛选出一段文本中的URL。
^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?
#14. 文件路径及扩展名校验:下面的这个表达式可以筛选出一段文本中的URL。
^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?
#14. 文件路径及扩展名校验:验证文件路径和扩展名
^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$
#15. 提取Color Hex Codes:有时需要抽取网页中的颜色代码,可以使用下面的表达式。
\\#([a-fA-F]|[0-9]){3,6}
#16. 提取网页图片:假若你想提取网页中所有图片信息,可以利用下面的表达式。
\\< *[img][^\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)
#17. 提取页面超链接:提取html中的超链接。
(<;a\\s*(?!.*\\brel=)[^>;]*)(href="https?://)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list)
#18. 精炼CSS:通过下面的表达式,可以搜索相同属性值的CSS,从而达到精炼代码的目的。
^\\s*[a-zA-Z\\-]+\\s*[:]{1}\\s[a-zA-Z0-9\\s.#]+[;]{1}
#19. 抽取注释:如果你需要移除HMTL中的注释,可以使用如下的表达式。
<!--(.*?)-->
#20. 匹配HTML标签:通过下面的表达式可以匹配出HTML中的标签。
</?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)/?>
校验数字表达式
1 数字:^[0-9]*$
2 n位的数字:^\d{n}$
3 至少n位的数字:^\d{n,}$
4 m-n位的数字:^\d{m,n}$
5 零和非零开头的数字:^(0|[1-9][0-9]*)$
6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
8 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
10 有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11 非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12 非零的负整数:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13 非负整数:^\d+$ 或 ^[1-9]\d*|0$
14 非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15 非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16 非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17 正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
校验字符的表达式
1 汉字:^[\u4e00-\u9fa5]{0,}$
2 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 长度为3-20的所有字符:^.{3,20}$
4 由26个英文字母组成的字符串:^[A-Za-z]+$
5 由26个大写英文字母组成的字符串:^[A-Z]+$
6 由26个小写英文字母组成的字符串:^[a-z]+$
7 由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
8 由数字、26个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
9 中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10 中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11 可以输入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
12 禁止输入含有~的字符:[^~\x22]+
特殊需求表达式
1 Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5 电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7 身份证号(15位、18位数字):^\d{15}|\d{18}$
8 短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式:^\d{4}-\d{1,2}-\d{1,2}
13 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 钱的输入格式:
16 1.有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00", 和没有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
17 2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|[1-9][0-9]*)$
18 3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
19 4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
20 5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过的:^[0-9]+(.[0-9]{2})?$
21 6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$
22 7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 备注:这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26 中文字符的正则表达式:[\u4e00-\u9fa5]
27 双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
28 空白行的正则表达式:\n\s*\r (可以用来删除空白行)
29 HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)
30 首尾空白字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
31 腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
32 中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字) 33 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址时有用) 34 IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
regexp_extract (CRDB自带函数)
语法:regexp_extract(stringsubject, stringpattern, intindex)
说明:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符
- 第一参数:要处理的字段
- 第二参数: 需要匹配的正则表达式
- 第三个参数:0是显示与之匹配的整个字符串;1 是显示第一个括号里面的,默认为1 ;2 是显示第二个括号里面的字段...
select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',0);
得到的结果为:itde
select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',1) ;
得到的结果为:i
select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',2)
得到的结果为:td
select regexp_extract('x=a3&x=18abc&x=2&y=3&x=4','x=([0-9]+)([a-z]+)',2) from default.dual;
得到的结果为:abc
regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',0), -- i41915173660
regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',1) -- 41915173660
标签:正则表达式,REG,test,TEST,REGEXP,oracle,regexp,ID
From: https://blog.51cto.com/363329071/6949921