C标准库不支持正则表达式,但大部分Linux发行版本都带有第三方的正则表达式函数库。
以常见的<regex.h>
为例:
/*
regcomp将正则表达式编译成适合后续regexec函数搜索的形式
preg指向模式缓冲区,传出参数
regex字符串,传入参数
cflag决定编译类型,可位或:
-REG_EXTENDED扩展正则表达式语法
-REG_ICASE不区分大小写
-REG_NOSUB不存储匹配结果
-REG_NEWLINE识别换行符
*/
int regcomp(regex_t *preg, const char *regex, int cflags);
/*
regexec使用编译好的模式串匹配字符串,nmatch和pmatch用来提供匹配上的位置信息
其中regmatch_t:
typedef struct {
regoff_t rm_so; //匹配的起始
regoff_t rm_eo; //匹配的结尾
} regmatch_t;
eflags位或,可位或:
-REG_NOTBOL
-REG_NOTEOL
-REG_STARTEND
*/
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);
/*
regerror将regcomp和regexec返回的错误码转为错误信息字符串
errorcode是regcomp和regexec的返回值
errbuf是接收错误信息字符串的缓存区,传出参数
*/
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);
/*清空regex_t结构体内容*/
void regfree(regex_t *preg);
使用的例子:
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <regex.h>
#define ARRAY_SIZE(arr) (sizeof((arr)) / sizeof((arr)[0]))
static const char *const str = "1) John Driverhacker;\n2) John Doe;\n3) John Foo;\n";
static const char *const re = "John.*o";
int main()
{
static const char *s = str;
regex_t regex;
regmatch_t pmatch[1];
regoff_t off, len;
if(regcomp(®ex, re, REG_NEWLINE))
exit(EXIT_FAILURE);
printf("String = \"%s\"\n", str);
printf("Matches:\n");
for(int i = 0; ; i++) {
if(regexec(®ex, s, ARRAY_SIZE(pmatch), pmatch, 0))
break;
off = pmatch[0].rm_so + (s - str);
len = pmatch[0].rm_eo - pmatch[0].rm_so;
printf("#%d:\n", i);
printf("offset = %jd; length = %jd\n", (intmax_t) off, (intmax_t) len);
printf("substring = \"%.*s\"\n", len, s + pmatch[0].rm_so);
s += pmatch[0].rm_eo;
}
exit(EXIT_SUCCESS);
}
标签:regex,const,正则表达式,pmatch,C语言,int,rm,REG
From: https://www.cnblogs.com/songlh424/p/18407120