代码随想录二刷字符串
看leetcode这样一道题目:
这道题若是用python库函数直接就秒了。但是那这道题就失去了本身的意义。
题目注意事项中也说了输入字符串S可能存在前导空格、尾随空格或者单词间的多个空格。所以首先是对字符串处理。去除其中的空格。这与之前去除数组中去除特定元素是一样的思路。
所以程序如下:
class Solution:
def reverseWords(self, s: str) -> str:
slow = 0
fast = 0
s = list(s)
while fast < len(s):
if s[fast] != ' ':
if slow!=0:
s[slow] = ' '
slow += 1
while fast < len(s) and s[fast]!=' ':
s[slow] = s[fast]
slow += 1
fast += 1
else:
fast += 1
reversed_s = s[:slow][::-1]
point = 0
for i in range(len(reversed_s)+1):
if i == len(reversed_s) or reversed_s[i] == ' ':
reversed_s[point:i] = reversed_s[point:i][::-1]
point = i + 1
return ''.join(reversed_s)
接下来来看下字符串中的KMP算法。
KMP算法
KMP用途:
KMP主要应用在字符串匹配上。KMP的主要思想是当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。所以如何记录已经匹配的文本内容,是KMP的重点,也是next数组肩负的重任。
上面手写的原理其实还不够好理解。比如上面匹配到b和f是不匹配的。但是模式串中f之前的字符串和文本串中b之前的事一模一样的。并且aabaa的最长相等前后缀为2。说明文本串不用从开头再去遍历。
构造next数组
构造next数组其实就是计算模式串s,前缀表的过程。 主要有如下三步:
- 初始化
- 处理前后缀不相同的情况
- 处理前后缀相同的情况
这里用不减一的前缀表:
class Solution:
def getNext(self, next: List[int], s: str) -> None:
j = 0
next[0] = 0
for i in range(1, len(s)):
while j > 0 and s[i] != s[j]:
j = next[j - 1]
if s[i] == s[j]:
j += 1
next[i] = j
next[i] 表示 i(包括i)之前最长相等的前后缀长度(其实就是j)所以初始化next[0] = j 。
接下来就是处理前后缀不相同的情况:
如果 s[i] 与 s[j+1]不相同,也就是遇到 前后缀末尾不相同的情况,就要向前回退。怎么回退呢?next[j]就是记录着j(包括j)之前的子串的相同前后缀的长度。那么 s[i] 与 s[j+1] 不相同,就要找 j+1前一个元素在next数组里的值(就是next[j])。
前后缀相同的情况:
如果 s[i] 与 s[j + 1] 相同,那么就同时向后移动i 和j 说明找到了相同的前后缀,同时还要将j(前缀的长度)赋给next[i], 因为next[i]要记录相同前后缀的长度。
接下来就来看下leetcode这道题:
具体程序如下:
class Solution:
def getNext(self, next: List[int], s: str) -> None:
j = 0
next[0] = 0
for i in range(1, len(s)):
while j > 0 and s[i] != s[j]:
j = next[j - 1]
if s[i] == s[j]:
j += 1
next[i] = j
def strStr(self, haystack: str, needle: str) -> int:
if len(needle) == 0:
return 0
next = [0] * len(needle)
self.getNext(next, needle)
j = 0
for i in range(len(haystack)):
while j > 0 and haystack[i] != needle[j]:
j = next[j - 1]
if haystack[i] == needle[j]:
j += 1
if j == len(needle):
return i - len(needle) + 1
return -1
标签:slow,后缀,needle,随想录,len,next,二刷,fast,字符串
From: https://www.cnblogs.com/bathwind/p/18342182