oracle正则表达式

标签：正则表达式 REG test TEST REGEXP oracle regexp ID

oracle regexp

参考：https://zhuanlan.zhihu.com/p/449885289

基础数据

CREATE TABLE REG_EXP_TEST(ID VARCHAR2(50));

INSERT INTO REG_EXP_TEST (ID)VALUES('GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG');

INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith, 10045 Berry Lane, San Joseph, CA 91234');

INSERT INTO REG_EXP_TEST (ID)VALUES('Joe Smith');

INSERT INTO REG_EXP_TEST (ID)VALUES('10045 91234');

INSERT INTO REG_EXP_TEST (ID)VALUES('15888 646455');

INSERT INTO REG_EXP_TEST (ID)VALUES('asdfasdf fgfgfgfgf');

COMMIT;

regexp_substr描述

名称:regexp_substr(p1 , pattern , start_position , target_position)

功能:截取字符串中满足模式的子串

参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始截取 ,target_position : 返回第几个满足条件的子串

返回值: 字符串

--查询REG_EXP_TEST 表中ID列中的第3次出现的数字组( 相邻的数字看成一组)

SELECT REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)FROM REG_EXP_TEST R;

regexp_substr示例

**查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组) **

SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果：
C##SCOTT@LHRCDB> SELECT R.ID,substr(R.id,1,3),REGEXP_SUBSTR(R.ID,'[0-9]+',1,3) FROM REG_EXP_TEST R;

ID                                                 SUBSTR(R. REGEXP_SUBSTR(R.ID,'[0-9]+',1,3)
-------------------------------------------------- --------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            GGG       46
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  Joe
Joe Smith                                          Joe
10045 91234                                        100
15888 646455                                       158
asdfasdf fgfgfgfgf                                 asd

已选择 6 行。

C##SCOTT@LHRCDB>

查询REG_EXP_TEST 表中ID列中的第3次出现的字母组( 相邻的字母看成一组)

SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;
--执行结果：
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z]+',1,3) FROM REG_EXP_TEST R;

ID                                                 REGEXP_SUBSTR(R.ID,'[A-ZA-Z]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            FDSFD
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  Berry
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf

已选择 6 行。

C##SCOTT@LHRCDB>

**查询REG_EXP_TEST 表中ID列中的第3次出现的字母数字组( 相邻的字母数字看成一组) **

SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;
--执行结果：
C##SCOTT@LHRCDB> SELECT R.ID,REGEXP_SUBSTR(R.ID,'[a-zA-Z0-9]+',1,3) FROM REG_EXP_TEST R;

ID                                                 REGEXP_SUBSTR(R.ID,'[A-ZA-Z0-9]+',1,3)
-------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG            454
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234  10045
Joe Smith
10045 91234
15888 646455
asdfasdf fgfgfgfgf

已选择 6 行。

C##SCOTT@LHRCDB>

regexp_instr

名称:regexp_instr(p1 , pattern , start_position , target_position)

功能:这个函数返回一个模式的起始位置，因此它的功能非常类似于 INSTR 函数。

新的 REGEXP_INSTR 函数的语法在表 6 中给出。这两个函数之间的主要区别是，REGEXP_INSTR 让您指定一种模式，而不是一个特定的搜索字符串

参数: p1: 目标字符串, pattern: 匹配模式, start_position : 正整数,从第几个满足条件的子串开始搜索 ,target_position : 返回第几个满足条件的子串的位置

返回值: 整数

--注[[:alpha:]]统计字符的个数 [[:digit:]]统计数字的个数

regexp_instr示例

**查询REG_EXP_TEST 表中ID列中出现在字符串末尾的5位数字(有一串字符串必须是五位数字结尾，超过五位也可以，四位就不行) **

SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--或
SELECT R.ID, REGEXP_INSTR(R.ID,'[0-9]{5}$',1,1)as digi FROM REG_EXP_TEST R;
--执行结果:
C##SCOTT@LHRCDB> SELECT R.ID, REGEXP_INSTR(R.ID,'[[:digit:]]{5}$',1,1)as digi FROM REG_EXP_TEST R;

ID                                                       DIGI
-------------------------------------------------- ----------
GGG5454 45HHH46,454?4545FDSFD@#@#@!#GHG                     0
Joe Smith, 10045 Berry Lane, San Joseph, CA 91234          45
Joe Smith                                                   0
10045 91234                                                 7
15888 646455                                                8
asdfasdf fgfgfgfgf                                          0

已选择 6 行。

C##SCOTT@LHRCDB>

regexp_like

名称:regexp_like(p1 , pattern )

功能: 判断某个字符串中是否包括特定模式的子串, 有则返回true ,否则flase

参数: p1: 目标字符串, pattern: 匹配模式

返回值: 布尔值

regexp_like示例

查询REG_EXP_TEST 表中ID列中包括5位数字的记录

SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[[:digit:]]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[[:digit:]]{5}');
--或
SELECT R.ID ,REGEXP_SUBSTR(R.ID,'[0-9]{5}') FROM REG_EXP_TEST R WHERE REGEXP_LIKE(R.ID,'[0-9]{5}');

regexp_count

名称:regexp_count(p1 , pattern )

功能: 统计某个字符串中包括特定模式的子串的个数

参数: p1: 目标字符串, pattern: 匹配模式

返回值: 0或者正整数

regexp_count示例

查询REG_EXP_TEST 表中ID列中包括5位数字的个数

SELECT R.ID ,REGEXP_COUNT(R.ID,'[[:digit:]]{5}')FROM REG_EXP_TEST R;

regexp_replace

名称:regexp_count(p1 , pattern , target_str )

功能: 将字符串中的满足模式的子串替换为目标字符串

参数: p1: 目标字符串, pattern: 匹配模式 ,target_str : 目标字符串

返回值: 字符串

regexp_replace示例

将 'Joe Smith'中间的多个空格替换为1个空格

SELECT REPLACE('Joe Smith',' ')AS replace FROM dual; --将空格替换掉
SELECT REGEXP_REPLACE('Joe Smith',' +',' ')AS replace FROM dual;