Hash
概念
字符串hash函数把一个任意长度的字符串映射成一个非负整数, 并且 冲突概率很小 .
取一个固定值 p ,把字符串看作 p 进制数 , 并分配一个大与 0 的 数值, 代表每种字符 给定一个字符串S=s1s2s3..sn,对字母x,我们规定idx(x)=x−′a′+1。一般来说 ,我们p的值取 131 或者 13331 ,此时 Hash 值产生冲突的概率极低 ,只要hash 值相同我们就可以认为两个字符串是相等的. 然后还有一个固定值 M ,求出p 进制数对 M的余数,作为字符串的hash 值. 通常 M 取
, 即直接使用 unsigned long long 类型存储这个 hash 值, 在计算时不处理算数溢出问题 ,产生溢出时相当于自动对
取模, 这样可以避免低效的取模运算 。
求字符串的哈希值
如果我们已经知道字符串 s 的 hash 值为 H(s) , 比如 "abcd" . 那么它的 hash 值为 ( s[0] -'a'+1) *p^3 +(s[1] -'a' +1)*p^2 + (s[2]-'a'+1)*p^1 +(s[3]-'a'+1)*p^0 , 其中 p 可以取 131 或者 13331 .
如果 s1 = 'e' ;
那么 hash (s+s1) = hash(s)*P +4;
如果已知字符串 S 的hash值为H(S) , 新字符串 S+T 的hash 值为 H(S+T) , 那么 H(T) =(H(S+T) -H(S)*p^(length(T)) mod M ;
例题 138. 兔子与兔子
很久很久以前,森林里住着一群兔子。
有一天,兔子们想要研究自己的 DNA 序列。
我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。
然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。
注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。
输入格式
第一行输入一个 DNA 字符串 S。
第二行一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
输出格式
对于每次询问,输出一行表示结果。
如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。
数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std ;
typedef long long LL ;
const int MAX = 1000010 ;
typedef unsigned long long ULL ;
char s[MAX] ;
ULL f[MAX], p[MAX] ;
int main(){
int n ,q ;
scanf("%s",s+1);
p[0] = 1 ;
cin >> n ;
for(int i = 1 ; i<=strlen(s+1) ; i++ ) {
f[i] = f[i-1] *131+(s[i]-'a'+1) ;
p[i] = p[i-1]*131 ;
}
for(int i = 1 ; i<=n ; i++) {
int l1 ,r1 , l2 ,r2 ;
scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
if(f[r1]-f[l1-1]*p[r1-l1+1] == f[r2]-f[l2-1]*p[r2-l2+1]){
cout<<"Yes"<<endl ;
}
else{
cout<<"No"<<endl ;
}
}
return 0 ;
}
标签:hash,int,DNA,long,兔子,字符串,Hash From: https://blog.51cto.com/u_15970235/6064425