KMP算法（基于代码随想录）的随笔

时间：2024-03-09 22:14:05浏览次数：38

标签：前缀 int needle 随想录 next KMP 随笔 size

KMP

KMP的主要思想是当出现字符串不匹配时，可以知道一部分之前已经匹配的文本内容，可以利用这些信息避免从头再去做匹配了。

前缀表：起始位置到下标i之前（包括i）的子串中，有多大长度的相同前缀后缀。

那么使用KMP可以解决两类经典问题：

匹配问题：28. 实现 strStr()(opens new window)
重复子串问题：459.重复的子字符串(opens new window)

再一次强调了什么是前缀，什么是后缀，什么又是最长相等前后缀。

最长公共前后缀

前缀：指不包含最后一个字符的所有以第一个字符开头的连续子串。

后缀：指不包含第一个字符的所有以最后一个字符结尾的连续子串。

然后针对前缀表到底要不要减一，这其实是不同KMP实现的方式，我们在KMP精讲 (opens new window)中针对之前两个问题，分别给出了两个不同版本的的KMP实现。

其中主要理解j=next[x]这一步最为关键！

时间复杂度分析

其中n为文本串长度，m为模式串长度，因为在匹配的过程中，根据前缀表不断调整匹配的位置，可以看出匹配的过程是O(n)，之前还要单独生成next数组，时间复杂度是O(m)。所以整个KMP算法的时间复杂度是O(n+m)的。

暴力的解法显而易见是O(n × m)，所以KMP在字符串匹配中极大地提高了搜索的效率。

前缀表不减一来构建next数组，代码如下：

    void getNext(int* next, const string& s) {
        int j = 0;
        next[0] = 0;
        for(int i = 1; i < s.size(); i++) {
            while (j > 0 && s[i] != s[j]) { // j要保证大于0，因为下面有取j-1作为数组下标的操作
                j = next[j - 1]; // 注意这里，是要找前一位的对应的回退位置了
            }
            if (s[i] == s[j]) {
                j++;
            }
            next[i] = j;
        }
    }

构建完next数组后，对字符串匹配的实现代码如下：

class Solution {
public:
    void getNext(int* next, const string& s) {
        int j = 0;
        next[0] = 0;
        for(int i = 1; i < s.size(); i++) {
            while (j > 0 && s[i] != s[j]) {
                j = next[j - 1];
            }
            if (s[i] == s[j]) {
                j++;
            }
            next[i] = j;
        }
    }
    int strStr(string haystack, string needle) {
        if (needle.size() == 0) {
            return 0;
        }
        int next[needle.size()];
        getNext(next, needle);
        int j = 0;
        for (int i = 0; i < haystack.size(); i++) {
            while(j > 0 && haystack[i] != needle[j]) {
                j = next[j - 1];
            }
            if (haystack[i] == needle[j]) {
                j++;
            }
            if (j == needle.size() ) {
                return (i - needle.size() + 1);
            }
        }
        return -1;
    }
};

时间复杂度: O(n + m)
空间复杂度: O(m)

标签：前缀,int,needle,随想录,next,KMP,随笔,size
From： https://www.cnblogs.com/shijili/p/18063460

代码随想录算法训练营第四十一天|01背包问题， 01背包问题—— 滚动数组，分割等和子集
01背包问题，你该了解这些！题目链接：46.携带研究材料（第六期模拟笔试）(kamacoder.com)思路：第一次遇到背包问题，好好记住吧。代码随想录(programmercarl.com)#include<bits/stdc++.h>usingnamespacestd;intmain(){intm,n;cin>>m>>n;vector<int>z(m);vec......
代码随想录第十六天 | ● 104.二叉树的最大深度 559.n叉树的最大深度 ● 111.二叉树
leetcode：104.二叉树的最大深度-力扣（LeetCode）思路：递归判断每次左右节点的是否存在，存在自然加一，return的1就是这样，判断子节点的左右两端是否有节点，统计有的节点数量，也就是左右的高度classSolution{publicintmaxDepth(TreeNoderoot){//后序遍历if......
关于Sed命令随笔
1.Sed工作流程首先sed把当前正在处理的行保存在一个临时缓存区中（也称为模式空间），然后处理临时缓冲区中的行，完成后把该行发送到屏幕上。sed把每一行都存在临时缓冲区中，对这个副本进行编辑，所以不会修改原文件。Sed主要用来自动编辑一个或多个文件；简化对文件的反复操作；编写转换......
代码随想录算法训练营第四天| 24. 两两交换链表中的节点 19.删除链表的倒数第N个节点
24.两两交换链表中的节点https://leetcode.cn/problems/swap-nodes-in-pairs/description/publicListNodeswapPairs(ListNodehead){if(head==null||head.next==null)returnhead;ListNoderes=head.next;ListNodepre=newListNod......
代码随想录算法训练营day17 | leetcode 110. 平衡二叉树、257. 二叉树的所有路径、404
目录题目链接：110.平衡二叉树-简单题目链接：257.二叉树的所有路径-简单题目链接：404.左叶子之和-简单题目链接：110.平衡二叉树-简单题目描述：给定一个二叉树，判断它是否是平衡二叉树示例1：输入：root=[3,9,20,null,null,15,7]输出：true示例2：输入：root=[1,2,2,3,3,null,nul......
代码随想录第十五天 | ● 层序遍历 10 ● 226.翻转二叉树 ● 101.对称二叉树 2 感
leetcode：102.二叉树的层序遍历-力扣（LeetCode）思路：用队列长度控制弹栈的多少，不等于空时获取root，因为传了一个根肯定是1，接下来找左右节点，将根节点弹出，获取下一次的size，一直到空。。。//102.二叉树的层序遍历classSolution{publicList<List<Integer>>resList=newA......
NewStarCTF 2023 公开赛道做题随笔（WEEK1|MISC部分）
第一题下载打开得到TXT文件好的看样子应该是base32，复制到base在线转换看看得到这玩意 base58转换得到出了flag 第二题下载得到一张二维码用隐写软件试试得到一张这个以为是摩斯密码，试试得到有个这玩意，嘶，好像不是试试LSB 得到flag 第三题......
代码随想录算法训练营第四十天|● 343. 整数拆分 ● 96.不同的二叉搜索树
整数拆分题目链接：343.整数拆分-力扣（LeetCode）思路：第一步想的是用递归做，intdigui(intn){if(n==1)returnn;returnmax((n/2)*(n-n/2),digui(n/2)*digui(n-n/2));}可惜的是题目并没有规定一定要分成两份，因此这个思路是不对的，但已经初窥门径。......
代码随想录算法训练营第四十天 | 96.不同的二叉搜索树，343. 整数拆分
343.整数拆分已解答中等相关标签相关企业提示给定一个正整数 n ，将其拆分为 k 个正整数的和（ k>=2 ），并使这些整数的乘积最大化。返回你可以获得的最大乘积。示例1:输入:n=2输出:1解释:2=1+1,1×1=1。......
day58 动态规划part15 代码随想录算法训练营 392. 判断子序列
题目：392.判断子序列我的感悟：理解难点：听课笔记：我的代码：通过截图：代码易错点：老师代码：扩展写法-双指针：classSolution:defisSubsequence(self,s:str,t:str)->bool:#初始化两个指针，分别指向s和t的第一个字符i,j=0,0#......

KMP算法（基于代码随想录）的随笔

KMP

最长公共前后缀

时间复杂度分析

相关文章

赞助商

阅读排行