本系列所有题目均为Acwing课的内容,发表博客既是为了学习总结,加深自己的印象,同时也是为了以后回过头来看时,不会感叹虚度光阴罢了,因此如果出现错误,欢迎大家能够指出错误,我会认真改正的。同时也希望文章能够让你有所收获,与君共勉!
字符串哈希
给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1
,r1
,l2
,r2
,请你判断 [l1,r1]
和 [l2,r2]
这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 n 和 m,表示字符串长度和询问次数。
第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。
接下来 m 行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 1 开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
算法原理
字符串哈希,能够将不同的字符串映射到不同的数字,对形如 \(X_1X_2....X_n\) 的字符串,采用字符的ascii 码乘上 P 的次方,也就是使用P进制来计算哈希值。
映射公式\((X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ\),这样就能以字符串的哈希值来判断字符串相等啦,构造一个字符串哈希值的时间复杂度为\(O(n)+O(m)\),在较长字符串比较中比KMP匹配的\(O(n)O(m)\)要快多啦。
注意:
- 字符不能映射为0,0的p进制数依然是0
- 数学证明设置P为131质数就会减少哈希冲突的概率
那么怎么求一个子字符串的哈希值呢,已知h[l]
,h[r]
怎么求他们之间子字符串的哈希值呢?
我们可以将R位的哈希值往左移(往左移要除的,因为这时前缀哈希,从左往右的P进制)即l往右移(这时候就要乘)\(h[l-1]\times{P^{r-l+1}}\),把他跟L位的哈希值对齐,就可以用相减就可以得到它们之间字符串的哈希值了.
前缀和\(h[i+1]=h[i]P+s[i]\),其中\(i\in{[0,n-1]}\)。
区间和公式:\(h[l,r] = h[r]-h[l-1]\times{P^{r-l+1}}\)
代码实现
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
typedef unsigned long long ULL;
const int N = 1e5+5,P = 131 ;// 13331
ULL h[N],p[N];
char str[N];
int n,m;
ULL get(int l,int r){
return h[r] - h[l-1]*p[r-l+1];
}
int main()
{
scanf("%d%d",&n,&m);
scanf("%s",str+1);
p[0] = 1;
for(int i=1; i<=n ; ++i){
h[i] = h[i-1] + s[i];
p[i] = p[i-1] * P; // P进制的每一位的进位数
};
while(m--){
int l1,r1,l2,r2;
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
if(get(l1,r1) == get(l2,r2)) puts("Yes");
else puts("No");
}
return 0;
}
标签:11,ULL,2022,包含,int,18,哈希,字符串,include
From: https://www.cnblogs.com/WangChe/p/16905173.html