首页 > 编程语言 >字符串匹配算法-Sunday

字符串匹配算法-Sunday

时间:2022-10-31 16:34:09浏览次数:85  
标签:匹配 needle 算法 Sunday 字符串 haystack size


以往不论是上课还是各种资料书上,看到关于字符串匹配的算法,大抵都是KMP了。然而KMP的next数组理解起来颇为费劲,且容易忘记。在LeetCode刷题中偶然发现了一个叫Sunday的算法,不仅容易理解,且经过其他博主测评,Sunday的效率还要高于KMP算法,因此本文记录一下Sunday算法的思路。

参考资料:

  1. ​Sunday 解法
  2. ​​KMP、BM、Sunday、Horspool、strstr字符串匹配算法的性能比较​​

首先briefly陈述一下问题

字符串匹配算法-Sunday_leetcode

即获得模式串第一次在目标字符串中出现的位置。

Sunday算法的思想是:

  1. 目标字符串中提取和模式串相同长度的待匹配字符串,并判断该待匹配字符串是否与模式串一致;
  2. 若一致,则返回当前待匹配字符串开始的索引即可;
  3. 若不一致,那么对待匹配字符串下一个字符 进行分析,判断它是否出现在模式串中;
  4. 若出现了,那么将模式串右移,直到该字符模式串中最后一次出现的位置和目标字符串中该字符对齐,并进行下一轮迭代;
  5. 若没有出现,那么将模式串右移,模式串的第一个字符移动到待匹配字符串下一个字符 的下一个字符,并进行下一轮迭代;

出于不侵权考虑, 关于示意图请看:https://leetcode-cn.com/problems/implement-strstr/solution/python3-sundayjie-fa-9996-by-tes/

该题C++代码:

class Solution {
public:
int strStr(string haystack, string needle) {
if(needle == "") return 0;
// 用Sunday算法,比KMP容易理解效率还高
// 先建立偏移表
map<char, int> pianyi;
for(int i = 0; i < needle.size(); i++)
{
pianyi[needle[i]] = needle.size() - i;
}
// 开始匹配
for(int i = 0; i < haystack.size();)
{
bool is_fit = true;
for(int j = 0; j < needle.size(); j++)
{
if(haystack[i+j] != needle[j])
{
is_fit = false;
break;
}
}
if(is_fit)
{
return i;
}
else
{
if(i+needle.size() >= haystack.size())
{
return -1;
}
if(pianyi.count(haystack[i+needle.size()]) == 0)
{
i = i + needle.size() + 1;
}
else
{
i += pianyi[haystack[i+needle.size()]];
}
}
}
return -1;
}
};


标签:匹配,needle,算法,Sunday,字符串,haystack,size
From: https://blog.51cto.com/u_15854687/5810313

相关文章

  • 算法竞赛中的小球放盒子问题
    背景:写题的时候遇到过很多关于这类问题的变种题,所以打算总结一下问题分类根据球是否不同,盒子是否不同,盒子是否为空,一共可以分为\(2^{3}\)种情况讨论Problem1题意......
  • Diff算法(面试)
    Diff算法探讨的就是虚拟DOM树发生变化后,生成DOM树更新补丁的方式。对比新旧两株虚拟DOM树的变更差异,将更新补丁作用于真实DOM,以最小成本完成视图更新。 具体流......
  • 字符串和数组的方法
    字符串和数组的方法一.字符串例子varstr='abcdefg'1.length(获取字符串的长度)console.log(str.length);//72.charAt(str)(获取到的是指定位置的字符)console.......
  • 第四届全国大学生算法设计与编程挑战赛(秋季赛)正式赛题解
    没时间写题解了,随便写两笔吧,看不懂可以联系QQ160042137901(Easy)直接暴力枚举每个状态及其所有转移,时间复杂度\((T2^nn^2)\)。02(Easy)二分答案,用一个单调队列或者优先......
  • 算法导论(第23章 最小生成树)
    目录23.1最小生成树的形成23.2\(Kruskal\)算法和\(Prim\)算法\(Kruskal\)算法\(Prim\)算法问题描述:对于一个连通无向图\(G=(V,E)\),为其每条边\((u,v)\inE\),赋予权......
  • Java算法基础 - 单链表详解(文末有配套视频)
    导航​​步骤1只用Java类能实现吗?​​​​步骤2类里面有顾客属性​​​​步骤3排队打饭​​​​步骤4从一个顾客联系到另一个顾客​​​​步骤5加一个next字段​......
  • 力扣HOT100算法题5:最长回文字串
    文章目录​​一、题目​​​​二、方法一:解题思路​​​​三、方法一:代码解析​​​​四、方法二:动态规划​​​​五、方法二:代码解析​​一、题目给你一个字符串s,找到s......
  • Python学习二:字符串
    文章目录​​一、字符串编码转换​​​​1.1使用encode()方法编码​​​​1.2使用encode()方法解码​​​​二、字符串常规操作​​​​2.1拼接字符串​​​​2.2计算字......
  • 实验二 逻辑回归算法实验
    【实验目的】理解逻辑回归算法原理,掌握逻辑回归算法框架;理解逻辑回归的sigmoid函数;理解逻辑回归的损失函数;针对特定应用场景及数据,能应用逻辑回归算法解决实际分类问题。......
  • 机器学习的发展(初级算法梳理一)
    2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜.深度学习开始进行大众的视野中.深度学习其实是机器学习的一个分支,我们今天......