题意简述
有一个字符串 \(s\) 和 \(n\) 条限制,每条限制给出字符串 \(t_i\) 和两个整数 \(l_i,r_i\),要求一个字符串要满足在 \(t_i\) 中的出现次数要在 \([l_i,r_i]\) 之间。求 \(s\) 有多少本质不同的子串满足所有限制。
\(|s|,\max |t|\le 5\times10^4,n\le 10\)
分析
“本质不同的子串”直接考虑 SA,对于一个后缀(左端点)\(i\),该后缀贡献的“本质不同的子串”的右端点范围为 \([i+height_{rk_i},n]\),因为后缀 \(i\) 与后缀 \(sa_{rk_{i-1}}\) 的最长公共前缀长度为 \(height_{rk_i}\),右端点在 \([i,i+height_{rk_i})\) 就是后缀 \(sa_{rk_{i-1}}\) 的前缀,故已经出现过。
考虑这 \(n\) 条限制。将所有 \(t_i\) 与 \(s\) 用奇怪字符隔开后拼接做 SA,根据 sa 数组的优美性质,一个字符串一定出现在 sa 数组上的一段连续区间。要计算在 \(t_i\) 中的出现次数,就相当于求 sa 数组区间中的后缀属于 \(t_i\) 的个数,这个可以用前缀和来维护。进一步地,我们发现当左端点(后缀)固定,子串长度越长,出现次数越少,启示我们二分满足上下界的位置。二分判定时再套二分查找 height 数组上左右端第一个 \(height_i<k\) 的位置(\(k\) 是二分值),求出 sa 数组中该区间中属于 \(t_i\) 的后缀的出现次数。
最后一点,由于我们是在所有串中做 SA,而“本质不同的子串”中 \(rk_{i-1}\) 的后缀是相对于原串 \(s\) 来说的,这里要注意一下。
这道题就做完了,强烈建议配合代码使用。时间复杂度 \(O(|s| \log^2 |s|+n^2|s|)\)。
点击查看代码
//#pragma comment(linker, "/stack:200000000")
//#pragma GCC optimize("Ofast")
//#pragma GCC target("sse,sse2,sse3,ssse3,sse4,popcnt,abm,mmx,avx,tune=native")
#include<iostream>
#include<cstdio>
#include<cstring>
#include<string>
#include<algorithm>
#include<cmath>
#include<map>
#include<unordered_map>
#include<vector>
#include<queue>
#include<bitset>
#include<set>
#include<ctime>
#include<random>
#define x1 xx1
#define y1 yy1
#define IOS ios::sync_with_stdio(false)
#define ITIE cin.tie(0);
#define OTIE cout.tie(0);
#define FlushIn fread(Fread::ibuf,1,1<<21,stdin)
#define FlushOut fwrite(Fwrite::obuf,1,Fwrite::S-Fwrite::obuf,stdout)
#define PY puts("Yes")
#define PN puts("No")
#define PW puts("-1")
#define P__ puts("")
#define PU puts("--------------------")
#define popc __builtin_popcount
#define pii pair<int,int>
#define mp make_pair
#define fi first
#define se second
#define gc getchar
#define pc putchar
#define pb emplace_back
#define lowb lower_bound
#define uppb upper_bound
#define rep(a,b,c) for(int a=(b);a<=(c);a++)
#define per(a,b,c) for(int a=(b);a>=(c);a--)
#define reprange(a,b,c,d) for(int a=(b);a<=(c);a+=d)
#define perrange(a,b,c,d) for(int a=(b);a>=(c);a-=d)
#define graph(i,j,k,l) for(int i=k[j];i;i=l[i].nxt)
#define lowbit(x) (x&-x)
#define lson(x) (x<<1)
#define rson(x) (x<<1|1)
#define mem(x,y) memset(x,y,sizeof x)
//#define double long double
//#define int long long
//#define int __int128
using namespace std;
typedef long long i64;
bool greating(int x,int y){return x>y;}
bool greatingll(long long x,long long y){return x>y;}
bool smallingll(long long x,long long y){return x<y;}
namespace Fread {
const int SIZE=1<<21;
char ibuf[SIZE],*S,*T;
inline char getc(){if(S==T){T=(S=ibuf)+fread(ibuf,1,SIZE,stdin);if(S==T)return '\n';}return *S++;}
}
namespace Fwrite{
const int SIZE=1<<21;
char obuf[SIZE],*S=obuf,*T=obuf+SIZE;
inline void flush(){fwrite(obuf,1,S-obuf,stdout);S=obuf;}
inline void putc(char c){*S++=c;if(S==T)flush();}
struct NTR{~NTR(){flush();}}ztr;
}
/*#ifdef ONLINE_JUDGE
#define getchar Fread::getc
#define putchar Fwrite::putc
#endif*/
inline int rd(){
int x=0,f=1;char ch=getchar();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
while(ch>='0'&&ch<='9'){x=x*10+ch-48;ch=getchar();}return x*f;
}
inline void write(i64 x,char ch='\0'){
if(x<0){x=-x;putchar('-');}
int y=0;char z[40];
while(x||!y){z[y++]=x%10+48;x/=10;}
while(y--)putchar(z[y]);if(ch!='\0')putchar(ch);
}
bool Mbg;
const int maxn=6e5+5,maxm=5e4+5,maxk=15,inf=0x3f3f3f3f;
const long long llinf=0x3f3f3f3f3f3f3f3f;
int n,k,len;
short str[maxn];
char t[maxk][maxm];
int tp[maxn];
int L[maxk],R[maxk];
namespace suffix_array{
int sa[maxn],rk[maxn],hi[maxn];
int id[maxn],nrk[maxn],prk[maxn<<1],cnt[maxn];
bool qwq(int x,int y,int z){return prk[x]==prk[y]&&prk[x+z]==prk[y+z];}
int f[maxn][20];
void SA(){
int m=127+k;
rep(i,1,n)cnt[rk[i]=str[i]]++;
rep(i,2,m)cnt[i]+=cnt[i-1];
per(i,n,1)sa[cnt[rk[i]]--]=i;
for(int j=1,p;j<n;j<<=1,m=p){
p=0;rep(i,n-j+1,n)id[++p]=i;
rep(i,1,n)if(sa[i]>j)id[++p]=sa[i]-j;
rep(i,1,m)cnt[i]=0;
rep(i,1,n)cnt[nrk[i]=rk[id[i]]]++;
rep(i,2,m)cnt[i]+=cnt[i-1];
per(i,n,1)sa[cnt[nrk[i]]--]=id[i];
rep(i,1,n)prk[i]=rk[i];
p=0;rep(i,1,n)rk[sa[i]]=qwq(sa[i],sa[i-1],j)?p:++p;
if(p==n)break;
}
int h=0;
rep(i,1,n){
if(h)--h;
while(str[i+h]==str[sa[rk[i]-1]+h])++h;
hi[rk[i]]=h;
}
rep(i,1,n)f[i][0]=hi[i];
int M=log2(n);
rep(j,1,M)rep(i,1,n-(1<<j)+1)f[i][j]=min(f[i][j-1],f[i+(1<<(j-1))][j-1]);
}
int query(int l,int r){
if(l>r)return inf;
int p=log2(r-l+1);
return min(f[l][p],f[r-(1<<p)+1][p]);
}
int lcp(int x,int y){
int rx=rk[x],ry=rk[y];
if(rx>ry)swap(rx,ry);
return query(rx+1,ry);
}
}using namespace suffix_array;
int s[maxn][maxk],sas[maxn];
bool ck(int x,int g){//height>=g
int l=2,r=x,lft=x+1,rht=x;
while(l<=r){
int mid=l+r>>1;
if(query(mid,x)>=g)lft=mid,r=mid-1;
else l=mid+1;
}
lft--,l=x+1,r=n;
while(l<=r){
int mid=l+r>>1;
if(query(x+1,mid)>=g)rht=mid,l=mid+1;
else r=mid-1;
}
rep(i,1,k)if(s[rht][i]-s[lft-1][i]>R[i])return 0;
return 1;
}
bool cck(int x,int g){
int l=2,r=x,lft=x+1,rht=x;
while(l<=r){
int mid=l+r>>1;
if(query(mid,x)>=g)lft=mid,r=mid-1;
else l=mid+1;
}
lft--,l=x+1,r=n;
while(l<=r){
int mid=l+r>>1;
if(query(x+1,mid)>=g)rht=mid,l=mid+1;
else r=mid-1;
}
rep(i,1,k)if(s[rht][i]-s[lft-1][i]<L[i])return 0;
return 1;
}
void solve_the_problem(){
scanf("%s %d",t[0]+1,&k);len=strlen(t[0]+1);
rep(i,1,k)scanf("%s %d %d",t[i]+1,&L[i],&R[i]);
rep(i,1,len)str[++n]=t[0][i];
rep(i,1,k){
str[++n]='z'+i;
int Len=strlen(t[i]+1);
rep(j,1,Len)str[++n]=t[i][j],tp[n]=i;
}
SA();
// rep(i,1,n)write(sa[i],32);P__;
// rep(i,1,n)write(hi[i],32);P__;
rep(i,1,n)rep(j,1,k)s[i][j]=s[i-1][j]+(tp[sa[i]]==j);
int tot=0;
rep(i,1,n)if(sa[i]<=len)sas[++tot]=sa[i];
// rep(i,1,n)write(sas[i],32);P__;
int ans=0;
rep(j,1,len){
int i=sas[j];
int h=(j==1?i:i+lcp(sas[j-1],i));
// write(h,32);
int l=h,r=len,res=-1,rem=-1;
while(l<=r){
int mid=l+r>>1;
if(ck(rk[i],mid-i+1))res=mid,r=mid-1;
else l=mid+1;
}
l=h,r=len;
while(l<=r){
int mid=l+r>>1;
if(cck(rk[i],mid-i+1))rem=mid,l=mid+1;
else r=mid-1;
}
// write(rem,32),write(res,10);
if(rem==-1||res==-1||res>rem)continue;
ans+=rem-res+1;
}
write(ans);
}
bool Med;
signed main(){
// freopen(".in","r",stdin);freopen(".out","w",stdout);
// fprintf(stderr,"%.3lfMB\n",(&Mbg-&Med)/1048576.0);
int _=1;while(_--)solve_the_problem();
}
/*
aba
0
*/