SGU 505

这里讲两种做法，一个在线，一个离线。

在线

我们分别考虑前缀和后缀。有一个比较重要的结论，就是把 \(s\) 按照字典序排序以后，相同前缀的出现位置（其实就是 rank）是连续的。\(s\) 翻过来，相同后缀的也是连续的。

这样我们就可以求出每一个询问前缀和后缀对应的区间是什么，然后就要求区间重合的数有多少个就可以了。一个做法是，设两个排完序的 \(id\) 为 \(p,q\)，我们把 \(p\) 弄成在 \(q\) 中出现的位置，这样就要求 \(p\) 区间内在一个范围内数的个数。

现在的问题是给定一个数组 \(a\)，询问 \(a_{l\sim r}\) 中 \(c\le a_i\le d\) 的个数，也就是小于 \(d\) 的个数减去小于 \(c-1\) 的个数。可以用主席树维护。（也可以分块，但是这样就是 \(\mathcal{O}(n\sqrt{n}\log n)\) 的了，不知道能不能过）

还有一个可能的问题是查找前缀/后缀对应区间。这个用二分有可能特判比较多（端点的特判是不是这个前缀/后缀），所以我们可以直接用一个 trie，每一个节点记录对应到这个点的区间。

可能要卡一点空间。代码不算难写。

#include <bits/stdc++.h>

using namespace std;

using ll = long long;

const int N = 1e5+5;

int n,val[N],idx[N];

struct node {
	string s;
	int id;
	bool operator < (const node &a) const{
		return s<a.s;
	}
} a[N],ra[N];

string s[N],rs[N];

int rt[N],cnt;

struct tnode {
	int l,r,sum;
} t[N*20];

void upd(int l,int r,int &x,int y,int pos){
	t[++cnt]=t[y];
	t[cnt].sum++;
	x=cnt;
	if (l==r){
		return;
	}
	int mid=l+r>>1;
	if (pos<=mid){
		upd(l,mid,t[x].l,t[y].l,pos);
	}
	else{
		upd(mid+1,r,t[x].r,t[y].r,pos);
	}
}

int qy(int l,int r,int x,int y,int k){
	if (k==0){
		return 0;
	}
	if (r<=k){
		return t[y].sum-t[x].sum;
	}
	int mid=l+r>>1;
	if (k<=mid){
		return qy(l,mid,t[x].l,t[y].l,k);
	}
	else{
		return t[t[y].l].sum-t[t[x].l].sum+qy(mid+1,r,t[x].r,t[y].r,k);
	}
}

struct trie {
	int ch[N*10][26],mn[N*10],mx[N*10],tot=1;
	void init(){
		for (int i=0; i<N*10; i++){
			mn[i]=1e9;
			mx[i]=-1e9;
		}
	}
	void ins(string s,int id){
		int cur=1;
		for (auto c : s){
			if (!ch[cur][c-'a']){
				ch[cur][c-'a']=++tot;
			}
			mn[cur]=min(mn[cur],id);
			mx[cur]=max(mx[cur],id);
			cur=ch[cur][c-'a'];
		}
		mn[cur]=min(mn[cur],id);
		mx[cur]=max(mx[cur],id);
	}
	pair<int,int> seg(string s){
		int cur=1;
		for (auto c : s){
			if (!ch[cur][c-'a']){
				return {-1,-1};
			}
			cur=ch[cur][c-'a'];
		}
		return {mn[cur],mx[cur]};
	}
} ta,tr;

int main(){
	ios::sync_with_stdio(false);
	cin.tie(0);

	cin>>n;
	for (int i=1; i<=n; i++){
		cin>>a[i].s;
		a[i].id=i;
		ra[i].s=a[i].s;
		reverse(ra[i].s.begin(),ra[i].s.end());
		ra[i].id=i;
	}
	sort(a+1,a+1+n);
	sort(ra+1,ra+1+n);
	for (int i=1; i<=n; i++){
		s[i]=a[i].s;
		rs[i]=ra[i].s;
		idx[ra[i].id]=i;
	}
	for (int i=1; i<=n; i++){
		val[i]=idx[a[i].id];
	}
	for (int i=1; i<=n; i++){
		upd(1,n,rt[i],rt[i-1],val[i]);
	}
	ta.init();
	tr.init();
	for (int i=1; i<=n; i++){
		ta.ins(s[i],i);
		tr.ins(rs[i],i);
	}
	int q;
	cin>>q;
	while (q--){
		string x,y;
		cin>>x>>y;
		reverse(y.begin(),y.end());
		auto u=ta.seg(x);
		auto v=tr.seg(y);
		if (u.first==-1 || v.first==-1){
			cout<<"0\n";
			continue;
		}
		int ans=qy(1,n,rt[u.first-1],rt[u.second],v.second);
		ans-=qy(1,n,rt[u.first-1],rt[u.second],v.first-1);
		cout<<ans<<"\n";
	}
	return 0;
}

离线

这个是用 ACAM 的做法。首先复习一下 ACAM 能做什么：求一个文本串里面出现其他串的个数，多次询问。

如果我们把一个串写成 \(s_i|s_i\) 的形式（如 ab 写成 ab|ab），然后查询相当于问有没有一个 \(suf|pre\) 的子串。我们把所有的文本串用 ,（或其他字符）连成一个长串，就可以直接查询了！

这个除了模板的程序会更好写，但是唯一劣势是离线。

Credit: Codeforces @cayaxi09.

#include <bits/stdc++.h>

using namespace std;

using ll = long long;

const int N = 5e5+5;

int n;
string T,s[N];
int ch[N][30],tag[N],fa[N],ans[N];
int cnt,vis[N],in[N],mp[N];

void init(){
	cnt=1;
	for (int i=0; i<N; i++){
		memset(ch[i],0,sizeof ch[i]);
		tag[i]=fa[i]=0;
	}
	for (int i=0; i<N; i++){
		vis[i]=0;
	}
}

int get(char c){
	if ('a'<=c && c<='z'){
		return c-'a';
	} 
	if (c=='|'){
		return 26;
	}
	return 27;
}

void ins(string s,int id){
	int cur=1;
	for (int i=0; i<s.size(); i++){
		int c=get(s[i]);
		if (!ch[cur][c]){
			ch[cur][c]=++cnt;
		}
		cur=ch[cur][c];
	}
	if (!tag[cur]){
		tag[cur]=id;
	}
	mp[id]=tag[cur];
}

void get_fail(){
	queue<int> q;
	q.push(1);
	for (int i=0; i<28; i++){
		ch[0][i]=1;
	}
	fa[1]=0;
	while (!q.empty()){
		int u=q.front();
		q.pop();
		for (int i=0; i<28; i++){
			if (!ch[u][i]){
				ch[u][i]=ch[fa[u]][i];
			}
			else{
				fa[ch[u][i]]=ch[fa[u]][i];
				in[fa[ch[u][i]]]++;
				q.push(ch[u][i]);
			}
		}
	}
}

void qy(string s){
	int cur=1;
	for (int i=0; i<s.size(); i++){
		int c=get(s[i]);
		int z=ch[cur][c];
		ans[z]++;
		cur=z;
	}
}

void sol(){
	queue<int> q;
	for (int i=1; i<=cnt; i++){
		if (!in[i]){
			q.push(i);
		}
	}
	while (!q.empty()){
		int u=q.front();
		q.pop();
		vis[tag[u]]=ans[u];
		in[fa[u]]--;
		ans[fa[u]]+=ans[u];
		if (!in[fa[u]]){
			q.push(fa[u]);
		}
	}
}

int main(){
	ios::sync_with_stdio(false);
	cin.tie(0);

	cin>>n;
	init();
	for (int i=1; i<=n; i++){
		string t;
		cin>>t;
		T+=t;
		T+="|";
		T+=t;
		T+=",";
	}
	int q;
	cin>>q;
	for (int i=1; i<=q; i++){
		string x,y;
		cin>>x>>y;
		s[i]=y+"|"+x;
		ins(s[i],i);
	}
	get_fail();
	qy(T);
	sol();
	for (int i=1; i<=q; i++){
		cout<<vis[mp[i]]<<"\n";
	}
	return 0;
}

标签：cur,int,SGU,后缀,ra,using,505,前缀
From： https://www.cnblogs.com/SFlyer/p/18295142

在线

离线

相关文章

赞助商

阅读排行