首页 > 其他分享 >【滑动窗口】无重复字符的最长字串、找到字符串中所有字母异位词、串联所有单词的子串

【滑动窗口】无重复字符的最长字串、找到字符串中所有字母异位词、串联所有单词的子串

时间:2023-11-30 21:46:50浏览次数:32  
标签:子串 字符 窗口 int 异位 字串 words 字符串

一、无重复字符的最长子串

题目描述

定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。

题目链接:无重复字符的最长子串

示例 1:
输入: s = "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。

示例 2:
输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。

示例 3:
输入: s = "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。

请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。

思路:运用滑动窗口记录当前窗口内已经出现的字符,窗口右边向右移动,如果遇到之前重复字符,则把窗口左边右移,直至重复字符挪出窗口。重复此操作直至窗口右边抵达字符串末尾。

class Solution {
public:
    int lengthOfLongestSubstring(string s) {
        //窗口内当前出现过的字符
        std::unordered_set<char> curstr;
        int maxlen = 0;
        int left = 0, right = 0;
        int len = s.size();
        while (right < len)
        {
            //如果遇到了重复字符,就把窗口左边右移,直到重复字符被移出
            while (curstr.find(s[right]) != curstr.end())
                curstr.erase(s[left++]);
            curstr.insert(s[right]);
            maxlen = std::max(maxlen, right - left + 1);
            ++right;
        }
        return maxlen;
    }
};

二、找到字符串中所有字母异位词

题目描述

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。

题目链接:找到字符串中所有字母异位词

示例 1:
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。

示例 2:
输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。

思路:定义一个滑动窗口,内部记录的是所有在窗口内出现过的字符,向右移动整个窗口,新进窗口的字符的出现次数+1,被移出窗口的字符的出现次数-1,如果窗口内的字符出现次数等于目标字符串的字符出现次数,则为一个解。重复此步骤,直至窗口右边达到终点。

class Solution {
public:
    vector<int> findAnagrams(string s, string p) {
        int len = s.size();
        int lookuplen = p.size();
        if (lookuplen > len)
            return {};
        vector<int> scount(26);
        vector<int> pcount(26);
        for (int i = 0; i < lookuplen; ++i)
        {
            ++scount[s[i] - 'a'];
		    ++pcount[p[i] - 'a'];
        }

        vector<int> res;
        if (scount == pcount)
            res.emplace_back(0);
        for (int i = 0; i < len - lookuplen; ++i)
        {
            ++scount[s[i + lookuplen] - 'a'];
            --scount[s[i] - 'a'];
            if (scount == pcount)
                res.emplace_back(i + 1);
        }

        return res;
    }
};

三、串联所有单词的子串

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。
s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

题目链接:串联所有单词的子串

例如,如果 words = ["ab","cd","ef"], 那么 "abcdef", "abefcd","cdabef", "cdefab","efabcd", 和 "efcdab" 都是串联子串。 "acdbef" 不是串联子串,因为他不是任何 words 排列的连接。
返回所有串联子串在 s 中的开始索引。你可以以 任意顺序 返回答案。

示例 1:
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:因为 words.length == 2 同时 words[i].length == 3,连接的子字符串的长度必须为 6。
子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。
子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。
输出顺序无关紧要。返回 [9,0] 也是可以的。

示例 2:
输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
解释:因为 words.length == 4 并且 words[i].length == 4,所以串联子串的长度必须为 16。
s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
所以我们返回一个空数组。

示例 3:
输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]
解释:因为 words.length == 3 并且 words[i].length == 3,所以串联子串的长度必须为 9。
子串 "foobarthe" 开始位置是 6。它是 words 中以 ["foo","bar","the"] 顺序排列的连接。
子串 "barthefoo" 开始位置是 9。它是 words 中以 ["bar","the","foo"] 顺序排列的连接。
子串 "thefoobar" 开始位置是 12。它是 words 中以 ["the","foo","bar"] 顺序排列的连接。

思路:由于words 中所有字符串 长度相同,我们把字符串s按照words中字符串的长度进行拆解,这样就可以把每一个字符串,看成是上一题中的一个字符,即可用类似上一题的解法。拆解字符串时,有从第0个位置开始一直到words中一个字符串长度减一种拆解方案。定义一个滑动窗口,内部记录的是所有在窗口内出现过的字符串,向右移动整个窗口,新进窗口的字符串的出现次数+1,被移出窗口的字符串的出现次数-1,如果窗口内的字符串出现次数等于目标字符串的字符串出现次数,则为一个解。重复此步骤,直至窗口右边达到终点。

class Solution {
public:
	vector<int> findSubstring(string s, vector<string>& words) {
		int slen = s.size();
		int wordslen = words.size();
		int onewordlen = words[0].size();
		if (slen < onewordlen * wordslen)
			return {};
		//滑动窗口内部的字符串出现的次数
		std::unordered_map<std::string, int> lookupstrtimes;
		//目标字符串出现的次数
		std::unordered_map<std::string, int> targetstrtimes;
		for (auto &str : words)
		{
			++targetstrtimes[str];
		}

		vector<int> res;
		//从0到onewordlen长度进行拆解
		for (int index = 0; index < onewordlen; ++index)
		{
			vector<string> curstr;
			//
			for (int i = index; i < slen; i += onewordlen)
			{
				if (i + onewordlen > slen)
					break;
				//进行拆解
				curstr.push_back(s.substr(i, onewordlen));
			}
			int curlen = curstr.size();
			if (curlen < wordslen)
				continue;
			lookupstrtimes.clear();
			for (int i = 0; i < wordslen; ++i)
			{
				++lookupstrtimes[curstr[i]];
			}
			if (lookupstrtimes == targetstrtimes)
				res.emplace_back(index);
			for (int i = 0; i < curlen - wordslen; ++i)
			{
				++lookupstrtimes[curstr[i + wordslen]];
				if (--lookupstrtimes[curstr[i]] == 0)
					lookupstrtimes.erase(curstr[i]);//必须erase,哪怕是0,由于目标字符串的map中没有这个key会判断两个map不相等
				if (lookupstrtimes == targetstrtimes)
					res.emplace_back(index + (i + 1) * onewordlen);
			}
		}

		return res;
	}
};

标签:子串,字符,窗口,int,异位,字串,words,字符串
From: https://www.cnblogs.com/zhonglimo/p/17868429.html

相关文章

  • [LettCode-中等] 字母异位词分组
    这是一道中等难度题,首先我们来了解一下,什么是字母异位词 =》由重新排列源单词的所有字母得到一个新单词字母异位词=》它是这个意思,比如说一个字符串由3个字符abc组成,就是"abc",现在我把组成这个字符串的字母顺序随意调换,比如变成"bac","bca","cab"等,这几个词就是字母异位......
  • [3] 无重复字符的最长子串
    /***@param{string}s*@return{number}*/varlengthOfLongestSubstring=function(s){letmax=0;letnum=0;lethasp;consthashMap=newMap()for(leti=0;i<s.length;i++){hasp=s.charAt(i);if(hashMap.get(hasp......
  • 代码随想录算法训练营第六天 |● 哈希表理论基础 ● 242.有效的字母异位词 ● 349.
    今日学习的文章链接和视频链接https://programmercarl.com/哈希表理论基础.html242.有效的字母异位词varisAnagram=function(s,t){if(s.length!==t.length)returnfalseletmap=newMap();for(letcharofs){if(!map.get(char)){......
  • 76. 最小覆盖子串
    最小覆盖子串给你一个字符串s、一个字符串t。返回s中涵盖t所有字符的最小子串。如果s中不存在涵盖t所有字符的子串,则返回空字符串""。注意:对于t中重复字符,我们寻找的子字符串中该字符数量必须不少于t中该字符数量。如果s中存在这样的子串,我们保证它是......
  • 找到字符串中所有字母异位词
    找到字符串中所有字母异位词给定两个字符串s和p,找到s中所有p的异位词的子串,返回这些子串的起始索引。不考虑答案输出的顺序。异位词指由相同字母重排列形成的字符串(包括相同的字符串)。示例1:输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0......
  • PTAC语言删除字符串中的字串
    这是题目。初见觉得还好,谁知道越分析越操蛋暗含深意。仔细看,假设我们通过遍历s1删除了两个显性的cat,哎,剩下的是什么Tomisamalecat咋样,牛逼不。说明这题肯定会出现删除一次不够的样例sample。假设我们熟知C语言中#include<string.h>中的strcat,strstr,strcpy等函数,那么这题可以比......
  • leetcode hot100-02 字母异位词分组
    题目:字母异位词分组难度:中等地址:https://leetcode.cn/classic/problems/group-anagrams/description/描述:给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。字母异位词 是由重新排列源单词的所有字母得到的一个新单词。过程:1、首先啥叫......
  • 2023-11-11:用go语言,字符串哈希+二分的例题。 给定长为 n 的源串 s,以及长度为 m 的模式
    2023-11-11:用go语言,字符串哈希+二分的例题。给定长为n的源串s,以及长度为m的模式串p,要求查找源串中有多少子串与模式串匹配,s'与s匹配,当且仅当s'与s长度相同,且最多有k个位置字符不同。其中1<=n,m<=10^6,0<=k<=5。来自左程云。答案2023-11-11:go代码用灵捷3.5......
  • 2023-11-11:用go语言,字符串哈希+二分的例题。 给定长为 n 的源串 s,以及长度为 m 的模式
    2023-11-11:用go语言,字符串哈希+二分的例题。给定长为n的源串s,以及长度为m的模式串p,要求查找源串中有多少子串与模式串匹配,s'与s匹配,当且仅当s'与s长度相同,且最多有k个位置字符不同。其中1<=n,m<=10^6,0<=k<=5。来自左程云。答案2023-11-11:go代码用......
  • 9.找到字符串中所有字母异位词
    题目概述:给定字符串s,p,找到s字符串子串中所有p的异位词,返回该字串的起始位置。异位词:由相同字母组成。解题思路:由于其给定了p,所以枚举s中和p长度相同的子串,并判断是否为p的异位词(将p和子串都进行排序处理,再使用equals判断)。需要注意的是java中的substring(i,j)方法,获取的是[i,j)......