首页 > 其他分享 >28. 找出字符串中第一个匹配项的下标

28. 找出字符串中第一个匹配项的下标

时间:2024-05-29 22:31:28浏览次数:23  
标签:PMT 下标 pattern needle 28 字符串 匹配 haystack

28. 找出字符串中第一个匹配项的下标

在这里插入图片描述

Show Swift Code

func computePMT(_ pattern: String) -> [Int] {  
    let m = pattern.length  
    var pmt = [Int](repeating: 0, count: m)  
    var j = 0  
      
    for i in 1..<m {  
        while j > 0 && pattern[pattern.index(pattern.startIndex, offsetBy: j)] != pattern[pattern.index(pattern.startIndex, offsetBy: i)] {  
            j = pmt[j - 1]  
        }  
        if pattern[pattern.index(pattern.startIndex, offsetBy: i)] == pattern[pattern.index(pattern.startIndex, offsetBy: j)] {  
            j += 1  
        }  
        pmt[i] = j  
    }  
    return pmt  
}  
  
func KMPSearch(_ haystack: String, _ needle: String) -> Int {  
    guard !needle.isEmpty else { return 0 } // 空字符串在所有位置都匹配  
      
    let n = haystack.length  
    let m = needle.length  
    let pmt = computePMT(needle)  
      
    var i = 0 // haystack的索引  
    var j = 0 // needle的索引  
      
    while i < n {  
        if haystack[haystack.index(haystack.startIndex, offsetBy: i)] == needle[needle.index(needle.startIndex, offsetBy: j)] {  
            // 字符匹配,继续比较下一个字符  
            i += 1  
            j += 1  
        } else if j > 0 {  
            // 字符不匹配,且j不是0,则利用pmt回溯  
            j = pmt[j - 1]  
        } else {  
            // 字符不匹配,且j是0,移动haystack的索引  
            i += 1  
        }  
          
        // 如果needle完全匹配,返回haystack中的起始索引  
        if j == m {  
            return i - m  
        }  
    }  
      
    // 没有找到匹配项  
    return -1  
}  
  
// 示例用法  
let haystack = "hello world"  
let needle = "world"  
let index = KMPSearch(haystack, needle)  
print(index) // 输出: 6  
  
let needle2 = "python"  
let index2 = KMPSearch(haystack, needle2)  
print(index2) // 输出: -1

这个 Swift 代码示例中,computePMT 函数用于计算部分匹配表(PMT),而 KMPSearch 函数则利用 PMT 来在 haystack 中搜索 needle。如果找到了 needle,函数返回它在 haystack 中的起始索引(从 0 开始);如果没有找到,则返回 -1。

computePMT(_ pattern: String) -> [Int] 的参数和返回值, 怎么理解 ?

computePMT(_ pattern: String) -> [Int] 是一个 Swift 函数的声明,用于计算给定模式字符串(pattern)的部分匹配表(Partial Match Table,简称 PMT)。我们可以从以下几个方面来理解这个函数的参数和返回值:

参数

  • _ pattern: String:这是函数的唯一参数,名为 pattern,类型为 String。前面的下划线 _ 是一种 Swift 中的命名约定,表示该参数在函数调用时可以省略其名称(即使用位置参数)。但在实际编程中,为了代码的可读性,通常还是推荐为参数命名。

返回值

  • -> [Int]:这表示函数返回一个整数数组(Array<Int>)。这个数组就是部分匹配表(PMT),它记录了模式字符串中每个位置之前的子串的最长相同前后缀的长度。

如何理解部分匹配表(PMT)

部分匹配表(PMT)是 KMP(Knuth-Morris-Pratt)字符串匹配算法中的一个关键组件。KMP 算法利用 PMT 来避免在字符串匹配过程中不必要的字符比较,从而提高算法的效率。

PMT 的构建基于以下观察:

  • 如果模式字符串的某个前缀(不包括整个字符串本身)存在相同的前后缀,那么当这个前缀在主字符串中不匹配时,我们可以将模式字符串向右滑动这个相同前后缀的长度,而不是仅仅滑动一个字符。

例如,对于模式字符串 "ABCDABD"

  • 前缀 "A" 没有相同的前后缀(除了空串),所以 PMT 的第一个元素是 0。
  • 前缀 "AB" 没有相同的前后缀(除了空串),所以 PMT 的第二个元素是 0。
  • 前缀 "ABC" 没有相同的前后缀(除了空串),所以 PMT 的第三个元素是 0。
  • 前缀 "ABCD" 没有相同的前后缀(除了空串),所以 PMT 的第四个元素是 0。
  • 前缀 "ABCDA" 的相同前后缀是 "A",长度为 1,所以 PMT 的第五个元素是 1。
  • 前缀 "ABCDAB" 的相同前后缀是 "AB",长度为 2,所以 PMT 的第六个元素是 2。
  • 前缀 "ABCDABD" 的相同前后缀是 "ABD",长度为 3(注意不是 "AB",因为我们要找的是最长的相同前后缀),所以 PMT 的第七个元素是 3。

因此,对于模式字符串 "ABCDABD",其 PMT 为 [0, 0, 0, 0, 1, 2, 3]。这个 PMT 将在 KMP 算法中用于加速字符串匹配过程。

标签:PMT,下标,pattern,needle,28,字符串,匹配,haystack
From: https://blog.csdn.net/qfeung/article/details/139307419

相关文章

  • 2981. 找出出现至少三次的最长特殊子字符串 I
    题目描述给你一个仅由小写英文字母组成的字符串s。如果一个字符串仅由单一字符组成,那么它被称为特殊字符串。例如,字符串"abc"不是特殊字符串,而字符串"ddd"、"zz"和"f"是特殊字符串。返回在s中出现至少三次的最长特殊子字符串的长度,如果不存在出现至少三次的特......
  • Day 8 | 344.反转字符串 、541. 反转字符串II 、151.翻转字符串里的单词
    344.反转字符串建议:本题是字符串基础题目,就是考察reverse函数的实现,同时也明确一下平时刷题什么时候用库函数,什么时候不用库函数题目链接/文章讲解/视频讲解:https://programmercarl.com/0344.反转字符串.html思考太简单了classSolution:defreverseString(self,......
  • 17.js字符串
    字符串创建1.字面量创建    var字符串名=字符串2.内部构造函数创建    var字符串名=newString('字符串')length属性    只能读取不能设置varstr='abcdfegfgl'console.log(str.length)//10str.length=5......
  • 【leetcode每日一题】——2903. 找出满足差值条件的下标 I——python
    给你一个下标从 0 开始、长度为 n 的整数数组 nums ,以及整数 indexDifference 和整数 valueDifference 。你的任务是从范围 [0,n-1] 内找出  2 个满足下述所有条件的下标 i 和 j :abs(i-j)>=indexDifference 且abs(nums[i]-nums[j])>=valueDi......
  • 5.28应急响应思路流程
    1、恶意外联,ip封禁及溯源准备工作:对恶意ip信息收集,如fofa、钟馗之眼、资产绘测等等;受害者信息收集,如:开放端口,判断入侵点;2、现场调研互联网结构,数据流向,核心交互机(是否有服务器);日志审计:windows系统日志中,wife连接日志可以确认安全事件发生时间;是否有态势感知平台,判断外联时间......
  • 视频汇聚EasyCVR平台视图库GA/T 1400协议与GB/T 28181协议的区别
    在公安和公共安全领域,视频图像信息的应用日益广泛,尤其是在监控、安防和应急指挥等方面。为了实现视频信息的有效传输、接收和处理,GA/T1400和GB/T28181这两个协议被广泛应用。虽然两者都服务于视频信息处理的目的,但它们在实际应用、功能特性和适用范围上却存在显著的区别。今天我......
  • 2024-05-29:用go语言,给定一个只包含正整数的数组 nums,任务是通过多次操作最小化数组的
    2024-05-29:用go语言,给定一个只包含正整数的数组nums,任务是通过多次操作最小化数组的长度。每次操作可以从数组中选择两个不同的下标i和j,使得nums[i]和nums[j]均为正整数。然后,将nums[i]除以nums[j]的余数插入数组末尾,同时删除原始的两个元素。最终要求计算进行操作......
  • 28. 【Java教程】Scanner 类
    一直以来,我们都使用System.out.println()方法向屏幕打印内容,那么如何接收输入的内容呢?本小节所学习的Scanner类就可以实现对输入内容的接收。在本小节,我们将学习Scanner类的定义,如何使用Scanner类以及其常用方法,在学完这些基础知识后,我们会在最后学习一个比较有趣的实例程序。......
  • P10528 [XJTUPC2024] 崩坏:星穹铁道 题解
    头图无语了,猜猜WA哪了不要真头图崩坏:星穹铁道题链这么简单做不对不许玩崩铁!题目大意给你行动的总次数\(n\)和初始战技点数量\(k\),以及编队里四名角色的行动类型,求不同行动方式的方案数。类型如下:思路先考虑dp,分角色类型讨论。设\(f_{i,k}\)表示第\(i......
  • C# String.Format 数值类型格式化字符串 保留两位小数
    统计学中普遍遵循四舍六入五成双例:32.6752-》32.67例:32.6755-》32.67注:String.Format() .framework4.7.2是四舍五入;.net6.net7则符合四舍六入五成双;其余版本没有进行测试。//.framework4.7.2varDistance=32675;vara=String.Format("{0:N2}",Distance/100......