BF:暴力匹配法O(n*m)
如果用暴力匹配的思路
并假设现在
文本串S匹配到 i 位置
模式串P匹配到 j 位置
则有:
如果当前字符匹配成功(即S[i] == P[j])
则i++,j++,继续匹配下一个字符;
如果失配(即S[i]! = P[j])
令i = i - (j - 1),j = 0。
相当于每次匹配失败时,i 回溯,j 被置为0。
S = "BBC ABCDAB ABCDABCDABDE"
p = "ABCDABD"
1.
BBC ABCDAB ABCDABCDABDE
ABCDABD
2.
BBC ABCDAB ABCDABCDABDE
ABCDABD
3.
BBC ABCDAB ABCDABCDABDE
ABCDABD
BBC ABCDAB ABCDABCDABDE
ABCDABD
4.
BBC ABCDAB ABCDABCDABDE
ABCDABD
5.
BBC ABCDAB ABCDABCDABDE
ABCDABD
6.
BBC ABCDAB ABCDABCDABDE
ABCDABD
7.
BBC ABCDAB ABCDABCDABDE
ABCDABD
KMP:可以实现复杂度为O(m+n)
下面先直接给出KMP的算法流程
假设现在
文本串S匹配到 i 位置,
模式串P匹配到 j 位置
如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),
都令i++,j++,继续匹配下一个字符;
如果j != -1,且当前字符匹配失败(即S[i] != P[j]),
则令 i 不变,j = next[j]。
此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。
步骤:
S = "BBC ABCDAB ABCDABCDABDE"
p = "ABCDABD"
1.
BBC ABCDAB ABCDABCDABDE
ABCDABD
2.
BBC ABCDAB ABCDABCDABDE
ABCDABD
3.
BBC ABCDAB ABCDABCDABDE
ABCDABD
BBC ABCDAB ABCDABCDABDE
ABCDABD
4.
BBC ABCDAB ABCDABCDABDE
ABCDABD
5.
BBC ABCDAB ABCDABCDABDE
ABCDABD
6.
BBC ABCDAB ABCDABCDABDE
ABCDABD
7.
BBC ABCDAB ABCDABCDABDE
ABCDABD
8.
BBC ABCDAB ABCDABCDABDE
ABCDABD
9.
BBC ABCDAB ABCDABCDABDE
ABCDABD
....
#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
using namespace std;
const int MAXN=1000;
int next[MAXN];
int plen,slen;
void GetNext(char *p,int plen)
{
int i,j;
next[0]=j=-1;
i=0;
while(i<plen)
{
if( -1 == j ||p[i] == p[j])
{
i++;
j++;
next[i]=j;
}
else
j=next[j];
}
}
int KMP(char *s,char *p,int slen,int plen)
{
int i=0,j=0;
while(i<slen&&j<slen)
{
if(j==-1||s[i]==p[j])
{
i++;
j++;
}
else
j=next[j];
if(j==plen) return i-j;
}
return -1;
}
int main()
{
char s[] = "BBC ABCDAB ABCDABCDABDE";
char p[] = "ABCDABD";
plen = strlen(p);
slen = strlen(s);
GetNext(p,plen);
printf("%d\n",KMP(s,p,slen,plen));
return 0;
}