首页 > 编程语言 >KMP算法

KMP算法

时间:2023-12-08 22:23:06浏览次数:31  
标签:匹配 charAt int str2 str1 next 算法 KMP

1.暴力匹配

暴力匹配算法的步骤如下:

  1. 遍历主串中的每个可能的起始位置,从第一个字符开始。
  2. 对于每个起始位置,逐个比较主串和模式串中对应位置的字符。
  3. 如果发现不匹配的字符,即主串和模式串中对应位置的字符不相等,将模式串向右移动一个位置,继续比较。
  4. 如果模式串完全匹配主串中的一段子串,即模式串的每个字符都与主串中的对应字符相等,则匹配成功,返回匹配的起始位置。
  5. 如果主串中的所有起始位置都比较完毕,仍然没有找到匹配的子串,则匹配失败,返回-1。
/**
 * @author 缪广亮
 * @version 1.0
 */
public class violenceMatch {
    public static void main(String[] args) {
        String str1 = "硅硅谷 尚硅谷你尚硅 尚硅谷你尚硅谷你尚硅你好";
        String str2 = "尚硅谷你尚硅你~";
        int index = violenceMatch(str1, str2);
        System.out.println("index=" + index);
    }

    //    暴力匹配算法实现
    public static int violenceMatch(String str1, String str2) {
        char[] s1 = str1.toCharArray();
        char[] s2 = str2.toCharArray();
        int s1Len = s1.length;
        int s2Len = s2.length;
        int i = 0;//i索引指向s1
        int j = 0;//j索引指向s2
        while (i < s1Len && j < s2Len) {//保证匹配时不越界
            if (s1[i] == s2[j]) {//匹配ok
                i++;
                j++;
            } else {//匹配失败
                i = i - (j - 1);
                j = 0;
            }
        }
//        判断如果匹配成功
        if (j == s2Len)
            return i - j;
        else
            return -1;
    }
}

2.KMP算法

很详尽的关于KMP算法的文章https://www.cnblogs.com/zzuuoo666/p/9028287.html

KMP算法的步骤如下:

  1. 预处理模式串,计算出部分匹配值(next数组)。
  2. 在主串中进行匹配,逐个比较主串和模式串中的字符。
  3. 如果发现不匹配的字符,即主串和模式串中对应位置的字符不相等,根据已经计算得到的部分匹配值来确定模式串的下一个比较位置。
  4. 根据部分匹配值,将模式串向右移动一定的位数,继续比较。
  5. 如果模式串完全匹配主串中的一段子串,即模式串的每个字符都与主串中的对应字符相等,则匹配成功,返回匹配的起始位置。
  6. 如果主串中的所有起始位置都比较完毕,仍然没有找到匹配的子串,则匹配失败,返回-1。

1.计算子串的部分匹配值表

//    获取到一个字符串(子串)的部分匹配值表
    public static int[] kmpNext(String dest) {
//        创建一个next数组保存部分匹配值
        int[] next = new int[dest.length()];
        next[0] = 0;//如果字符串是长度为1部分匹配值就是0
//        通过i和j两个指针来计算部分匹配值
        for (int i = 1, j = 0; i < dest.length(); i++) {
//            当dest.charAt(i)==dest.charAt(j),我们需要从next[j-1]获取新的j
//            直到我们发现有dest.charAt(i)==dest.charAt(j)成立才退出
//            kmp核心点
            while (j > 0 && dest.charAt(i) != dest.charAt(j))
                j = next[j - 1];
            if (dest.charAt(i) == dest.charAt(j))//满足时,部分匹配值就是+1
                j++;
            next[i] = j;
        }
        return next;
    }

2.kmpSearch

/**
     * @param str1 源字符串
     * @param str2 next 部分匹配表,是子串对应的部分匹配值
     * @return 如果是-1就是没有匹配到,否者返回第一个匹配的位置
     */
    public static int kmpSearch(String str1, String str2, int[] next) {
//        遍历源数组
        for (int i = 0, j = 0; i < str1.length(); i++) {
//            当str1.charAt(i)==str2.charAt(j),我们需要从next[j-1]获取新的j
//            直到我们发现有str1.charAt(i)==str2.charAt(j)成立才退出
//            kmp核心点
            while (j > 0 && str1.charAt(i) != str2.charAt(j))
                j = next[j - 1];
            if (str1.charAt(i) == str2.charAt(j))
                j++;
            if (j == str2.length())
                return i - (j - 1);
        }
        return -1;
    }

测试

public static void main(String[] args) {
    String str1 = "BBC ABCDAB ABCDABCDABDE";
    String str2 = "ABCDABD";
    int[] next = kmpNext(str2);
    System.out.println(Arrays.toString(next));
    int index=kmpSearch(str1,str2,next);
    System.out.println("index="+index);
}

标签:匹配,charAt,int,str2,str1,next,算法,KMP
From: https://www.cnblogs.com/mglblog/p/17889166.html

相关文章

  • 网络流最大流Dinic算法
    感谢董晓老师:博客,b站/*Dinic算法的思路是,用bfs进行分层,限制后面dfs每次的搜索深度,并且,在dfs的过程中,直接把当前这个路走到u的容量限制分给u的各个出边*/#include<iostream>#include<algorithm>#include<cstring>#include<queue>usingnamespacestd;const......
  • 深入研究与优化目标检测算法,以提高其性能与适用性的探索性研究
    基于深度学习的目标检测算法分为2类:TwoStage和OneStage。TwoStage:先预设一个区域,改区域称为regionproposal,即一个可能包含待检测物体的预选框(简称RP),再通过卷积神经网络进行样本分类计算。流程是:特征提取->生成RP->分类/回归定位。常见的TwoStage算法有:R-CNN、SPP-Net、Fa......
  • 杂算法
    updateon2023.11.17NOIP前来复习板子,发现KMP整理的不是很到位,所以更新详细一些。模板题抽象的blog浅显易懂的讲解视频:(dalao讲得太好了\(%%%\))备用网址\(kmp\)(字符串匹配)的概念:主串:被匹配的字符串模式串:匹配的串最长前后缀:一个字符串某个前缀后后缀相同,而且长度尽可......
  • 数据结构与算法----------3
    队列队列也是一种受限制的线性表,只能在一端进行插入,在另一端进行删除。当然也有一种特殊的队列,名叫双端队列,也就是一段既可以插入也可以删除,在另一端也可以插入和删除。这就是双端队列。队列的顺序实现(非环形数组)代码实现//队列的顺序实现(非环形数组)#define_CRT_SECUR......
  • 二分——acwing算法基础课笔记
    个人笔记,欢迎补充、指正。此次完全以个人理解来写。整数二分 整数二分有两种,分别是找左边界和找右边界。 寻找符合要求的左边界:绿色点intbsearch_1(intl,intr){while(l<r){intmid=l+r>>1;//对应下界,最左if(check(mid))r=......
  • 数据结构与算法---------2
    栈栈是一个具有一定操作约束的线性表,只能在一端(栈顶,top)做插入和删除。栈的顺序实现//栈的顺序实现#define_CRT_SECURE_NO_WARNINGS#include<stdio.h>#include<stdlib.h>#include<string.h>#include<math.h>#include<time.h>#include<stdbool.h>#defineuun......
  • KMP
    简介KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。实现构造next[]数组前缀:除最后一个字符外,......
  • 矿山自救器检测的AI算法工作原理是什么?在智慧矿山应用广吗?
    智慧矿山作为当今矿业领域的热门话题,其应用已经逐渐成为行业发展的必然趋势。在智慧矿山中,矿山自救器检测的AI算法是一个重要的组成部分,通过这一技术,可以大大提高矿工的安全水平和生产效率。那么,矿山自救器检测的AI算法工作原理是什么?在智慧矿山应用广泛吗?接下来,我们将从技术原理和......
  • 【EMNLP 2023】基于知识迁移的跨语言机器阅读理解算法
    近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队、达摩院自然语言处理团队合作在自然语言处理顶级会议EMNLP2023上发表基于机器翻译增加的跨语言机器阅读理解算法X-STA。通过利用一个注意力机制的教师来将源语言的答案转移到目标语言的答案输出空间,从而进行深度级别的辅助......
  • React diff 算法详解
    代码参照React16.13.1什么是Diff在render阶段的beginWork函数中,会将上次更新产生的Fiber节点与本次更新的JSX对象(对应ClassComponent的this.render方法返回值,或者FunctionComponent执行的返回值)进行比较。根据比较的结果生成workInProgressFiber,即本次更新的Fiber节......