首页 > 编程语言 >【算法】C++KMP算法的简洁实现

【算法】C++KMP算法的简洁实现

时间:2024-09-25 23:20:10浏览次数:3  
标签:子串 主串 匹配 int 回溯 C++ next 算法 KMP

目录

简介

next数组

匹配

完整代码


简介

对于朴素的字符串匹配算法,如果想在主串中寻找到第一次出现子串的位置,需要依次枚举主串中的每一个位置作为起始位置进行匹配尝试,如果主串中存在许多与子串相似结构的部分,那么朴素算法会进行大量的无用枚举,时间复杂度非常之高。

KMP算法区别于朴素算法的地方就是其在尝试匹配时,匹配失败后不会回溯主串的指针,而是通过一个预处理的next数组去回溯子串的指针,主串的指针会继续向后遍历。

因此KMP算法只会遍历一次主串,这在主串长,子串短的情况下具有非常大的性能优势。

next数组

next数组是用于指挥子串指针会回溯到子串的哪个位置,这个数组需要在执行真正的匹配算法前预处理出来,以下是其预处理的代码

//构造next数组
//m代表子串长度
vector<int> next(m, 0);
for(int i = 0; i < m; i++)
{
    //从当前位置向前寻找子串中最近的和当前字符一样的字符
    //并记录最近的字符的位置到next中当前字符的对应位置上
	for(int j = i - 1; j >= 0; j--)
	{
		if(subStr[j] == subStr[i])
		{
			next[i] = j;
			break;
		}	
	}
}

匹配

接下来通过next数组进行只回溯子串指针的匹配算法

//遍历主串寻找子串位置,不回溯主串,通过next数组回溯模式串
int j = 0;
for(int i = 0; i < n; i++)
{
	//如果匹配,两个指针共同前进
	while(str[i] == subStr[j] && j < m)
	{
		j++;
		i++;
	}
		
	//结束后区分下是while中哪个条件导致的
	//匹配成功
	if(j >= m)
		return i - m;
		
	//匹配出现失败,通过next指针进行回溯
	j = next[j];
}
	
return -1;	//没找到

完整代码

以下是完整代码

#include <iostream>
#include <vector>
using namespace std;

void printer(const vector<int>& arr)
{
	for(int i : arr)
		cout << i << " ";
	cout << endl;
}

int FindKMP(const string& str, const string& subStr)
{
	int n = str.size(), m = subStr.size();
	
	//构造next数组
	vector<int> next(m, 0);
	for(int i = 0; i < m; i++)
	{
		for(int j = i - 1; j >= 0; j--)
		{
			if(subStr[j] == subStr[i])
			{
				next[i] = j;
				break;
			}	
		}
	}
	
	//遍历主串寻找子串位置,不回溯主串,通过next数组回溯模式串
	int j = 0;
	for(int i = 0; i < n; i++)
	{
		//如果匹配,两个指针共同前进
		while(str[i] == subStr[j] && j < m)
		{
			j++;
			i++;
		}
		
		//结束后区分下是while中哪个条件导致的
		//匹配成功
		if(j >= m)
			return i - m;
		
		//匹配出现失败,通过next指针进行回溯
		j = next[j];
	}
	
	return -1;	//没找到
}

int main()
{
	string str = "746381982378";
	string subStr = "82378";
	cout << FindKMP(str, subStr);
}

标签:子串,主串,匹配,int,回溯,C++,next,算法,KMP
From: https://blog.csdn.net/Siro_sama/article/details/142535327

相关文章

  • 【算法题】63. 不同路径 II-力扣(LeetCode)-”如果起点有障碍物,那么便到不了终点“
    【算法题】63.不同路径II-力扣(LeetCode)-”如果起点有障碍物,那么便到不了终点“1.题目下方是力扣官方题目的地址63.不同路径II一个机器人位于一个mxn网格的左上角(起始点在下图中标记为“Start”)。机器人每次只能向下或者向右移动一步。机器人试图达到网格......
  • 【算法】笔试题记录
    哇今天做了道特别有意思的题。编程就给了两道,第一题特别简单,a、b两个数,每次选其中一个数*2,这样操作两次,问最后得到的两数之和的期望值是多少。简单吧?因为每次选择都有两种可能性,操作两次后就会有四种可能的结果(22)。其中有两个结果是重复的(2a,2b),剩下两个分别是(a,4b)和(4a,......
  • 【鸟类识别系统】+计算机毕设项目+卷积神经网络算法+人工智能+深度学习+模型训练+Pyth
    一、介绍鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作......
  • 【动物识别系统】计算机毕设项目案例+Python卷积神经网络算法+模型训练+人工智能+深度
    一、介绍动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现......
  • 面试真题 | 小红书-C++引擎架构
    文章目录1.自我介绍2.项目3.c++多态,如何实现的,虚表、虚表指针存储位置C++多态的实现机制虚表指针的存储位置面试官的深度追问4.explicit关键字explicit关键字的回答面试官可能的追问5.unique_ptr、shared_ptr、weak_ptr的原理,有没有线程安全问题,weak_ptr的解决......
  • c++模板,STL
                                            C++提高编程模板函数模板语法:template用法://自动类型推导mySwap(a,b);//显示指定类型mySwap<int>(a,b);注意事项自动类型推导,必须推导出 一致 的数据类型T,才可......
  • 求最大公约数的三种算法
    #include<iostream>#include<vector>#include<algorithm>usingnamespacestd;intgcdByBruteForce(inta,intb){for(inti=min(a,b);i>0;--i){if(a%i==0&&b%i==0){returni;......
  • 矿山井下/传送带堆料检测AI算法的检测作用、工作原理及其解决方案
    传送带堆料分为两种情况,一种是传送带的井下堆料检测AI算法,一种是传送带上面的堆料检测AI算法,传送带井下堆料检测AI算法是在带式输送机的漏煤下方井下安装摄像仪,通过视频分析检测井下堆煤情况,当洒煤堆积到一定程度后,智慧矿山版ai盒子自动产生报警,并语音通知值班人员,也可通过前端音箱......
  • C++——输入一个字符串,把其中的字符按逆序输出。如输入LIGHT,输出THGIL。用string方法
    没注释的源代码#include<iostream>#include<string.h>usingnamespacestd;intmain(){   stringa;   cout<<"请输入字符串a:";   cin>>a;   intk;   k=a.size();   for(inti=k-1;i>=0;i--)   {       cout<<a[i];......
  • C++——输入三个整数,按照由小到大的顺序输出。用指针方法处理。
    没注释的源代码#include<iostream>usingnamespacestd;voidswap(int*m,int*n);intmain(){   inta,b,c;   int*p1,*p2,*p3;   cout<<"请输入三个整数:"<<endl;   cin>>a>>b>>c;   p1=&a;p2=&b;p3=&c;   ......