首页 > 其他分享 >【字符串】区间本质不同子串个数

【字符串】区间本质不同子串个数

时间:2024-02-01 22:12:49浏览次数:35  
标签:子串 ll 个数 pos mid leq 区间 端点 字符串

题目描述

给定一个字符串 \(S\) ,\(m\) 次询问,每次询问 \(S_{[l,r]}\) 中有多少个本质不同的子串。

\(1 \leq |S| \leq 10^5,1 \leq m \leq 2 \times 10^5\) 。

算法描述

考虑 HH的项链 那道题,扫描右端点,维护对于某些串,能贡献的最大的左端点。

假设有一个长为 \(len\) 的串,最后一次是在 \(x\) 出现,容易发现此时右端点已经扫过 \(x\) ,所以左端点在 \([1,x - len + 1]\) 就可以贡献一个。

考虑建出 \(S\) 的 SAM,每次跳到前缀 \([1,r]\) 相应的节点 \(x\) ,考虑从节点 \(x\) 到根的整条路径的 \(lst\) 都应该改成 \(r\) 。这种拉通染色很像 LCT 的 access 操作。用 LCT 维护这个东西,每次以一个 splay 为单位向上跳,由于现在节点为当前实链最底端的点,可以知道这条实链代表的最长长度 \(lmax\) ,splay 后取父亲可以得到这条实链最短长度 \(lmin = len_{fa} + 1\)。

相当于减去 \([lmin,lmax]\) 长度先前出现的贡献,由于是到根,所以对于 \([1,r]\) 长度都加上在 \(r\) 出现的贡献。

仔细研究贡献,假设 \([x,y]\) 长度在 \(z\) 最后一次出现,相当于对于 \(l \in [z - y + 1,z - x + 1]\) ,\(l\) 每增加一个,本质不同的串就多一个。

对于 \(l \in [1,z - y]\) ,贡献都不变。

神秘地,由于右端点一直在向右单调增,我们可以在线段树上将 \([z - y + 1,z - x + 1]\) 区间 \(+1\) ,查询查 \([l,r]\) 区间和即可。手摸各种情况发现这样是对的!

这其实是将等差数列加、单点查变成了区间加、区间查。

一开始全部设成虚边,然后 LCT 维护即可。

时间复杂度 \(\Theta(n \log^2 n + q\log n)\) ,细节详见代码。

#include<bits/stdc++.h>
using namespace std;
const int N = 2e5 + 5;
char s[N];
int n,m;
typedef long long ll;
ll ans[N];
struct Q{
	int l,r,id;
}q[N];
struct Segment_Tree{
	ll tag[N << 2],a[N << 2];
	inline void pushdown(int pos,int l,int r)
	{
		int mid = (l + r) >> 1;
		a[pos << 1] += (mid - l + 1) * tag[pos]; tag[pos << 1] += tag[pos];
		a[pos << 1 | 1] += (r - mid) * tag[pos]; tag[pos << 1 | 1] += tag[pos];
		tag[pos] = 0; 
	}
	inline void pushup(int pos) {a[pos] = a[pos << 1] + a[pos << 1 | 1];}
	inline void modify(int l,int r,int L,int R,ll k,int pos)
	{
		if(L <= l && r <= R) {a[pos] += k * (r - l + 1); tag[pos] += k; return;}
		int mid = (l + r) >> 1;
		pushdown(pos,l,r);
		if(L <= mid) modify(l,mid,L,R,k,pos << 1);
		if(R > mid) modify(mid + 1,r,L,R,k,pos << 1 | 1);
		pushup(pos);
	}
	inline ll query(int l,int r,int L,int R,int pos)
	{
		if(L <= l && r <= R) return a[pos];
		pushdown(pos,l,r);
		int mid = (l + r) >> 1; ll ret = 0;
		if(L <= mid) ret += query(l,mid,L,R,pos << 1);
		if(R > mid) ret += query(mid + 1,r,L,R,pos << 1 | 1);
		pushup(pos);
		return ret; 
	}
}sgt;
struct SAM{
	struct Node{
		int son[26],link,len;
	}a[N];
	int lst = 1,tot = 1;
	inline void ist(char c)
	{
		int cur = ++tot; a[cur].len = a[lst].len + 1;
		int p = lst,q;
		lst = cur;
		while(p && !a[p].son[c - 'a']) a[p].son[c - 'a'] = cur,p = a[p].link;
		if(!p) {a[cur].link = 1; return;}
		q = a[p].son[c - 'a'];
		if(a[q].len == a[p].len + 1) {a[cur].link = q; return;}
		
		int np = ++tot;
		memcpy(a[np].son,a[q].son,sizeof(a[q].son));
		a[np].len = a[p].len + 1;
		a[np].link = a[q].link;
		while(p && a[p].son[c - 'a'] == q) a[p].son[c - 'a'] = np,p = a[p].link;
		a[q].link = np; a[cur].link = np;
	}
}sam;
struct LCT{
	struct Node{
		int son[2],fa,val,tag;
	}a[N];
	inline void change(int x,int v) {a[x].val = v; a[x].tag = v;}
	inline void pushdown(int x) {if(!a[x].tag) return; if(a[x].son[0]) change(a[x].son[0],a[x].tag); if(a[x].son[1]) change(a[x].son[1],a[x].tag); a[x].tag = 0;}
	inline int which(int x) {return (x == a[a[x].fa].son[1]);}
	inline bool isroot(int x) {return (x != a[a[x].fa].son[0] && x != a[a[x].fa].son[1]);}
	inline void rorate(int x)
	{
		int y = a[x].fa,z = a[y].fa,dir = which(x);
		a[y].son[dir] = a[x].son[dir ^ 1];
		if(a[x].son[dir ^ 1]) a[a[x].son[dir ^ 1]].fa = y;
		a[x].fa = z;
		if(!isroot(y)) a[z].son[which(y)] = x;
		a[y].fa = x;
		a[x].son[dir ^ 1] = y;
	}
	inline void splay(int x)
	{
		static int st[N],top = 0; top = 0;
		int tmp = x;
		while(tmp) st[++top] = tmp,tmp = a[tmp].fa;
		while(top) pushdown(st[top]),top--;
		while(!isroot(x))
		{
			if(!isroot(a[x].fa))
				rorate((which(x) ^ which(a[x].fa)) ? x : a[x].fa);
			rorate(x);
		}	
	} 
	inline void access(int x,int nv)
	{
		for(int rc = 0;x;rc = x,x = a[x].fa)
		{
			splay(x);
			a[x].son[1] = rc;
			if(a[x].val) sgt.modify(1,n,a[x].val - sam.a[x].len + 1,a[x].val - sam.a[a[x].fa].len,-1,1);
			change(x,nv);
		}
		sgt.modify(1,n,1,nv,1,1);
	}
}lct;
int main()
{
	scanf("%s",s + 1);
	n = strlen(s + 1);
	for(int i = 1;i <= n;i++) sam.ist(s[i]);
	scanf("%d",&m);
	for(int i = 1;i <= m;i++)
		scanf("%d%d",&q[i].l,&q[i].r),q[i].id = i;
	for(int i = 2;i <= sam.tot;i++) lct.a[i].fa = sam.a[i].link;
	sort(q + 1,q + m + 1,[&](Q x,Q y) {return x.r < y.r;});
	for(int i = 1,j = 1,np = 1;i <= n;i++)
	{
		np = sam.a[np].son[s[i] - 'a'];
		lct.access(np,i);
		while(j <= m && q[j].r == i) ans[q[j].id] = sgt.query(1,n,q[j].l,q[j].r,1),j++;
	}
	for(int i = 1;i <= m;i++) printf("%lld\n",ans[i]);
	return 0;
 } 

标签:子串,ll,个数,pos,mid,leq,区间,端点,字符串
From: https://www.cnblogs.com/TheLastCandy/p/18002226

相关文章

  • PAT乙级-1002(写出这个数)
    读入一个正整数n,计算其各位数字之和,用汉语拼音写出和的每一位数字。输入格式:每个测试输入包含1个测试用例,即给出自然数n的值。这里保证n小于10的100次方输出格式:在一行内输出n的各位数字之和的每一位,拼音数字间有1空格,但一行中最后一个拼音数字后没有空格。输入......
  • 【技巧总结】java整数,字符串,数组之间的相互转换(持续更新)
    字符串转换为int类型给定一个字符串Stringstr="1234";转为转数字1234valueOf()Integernum=Integer.valueOf(str);返回的是包装类对象,可以进行调用对象方法可以用toString()方法。​parseIntintnum=Integer.parseInt(str)返回的是基本数据类型字符串......
  • 代码随想录算法训练营第九天| 28. 实现 strStr() 459.重复的子字符串 字符串总结 双
     28.实现strStr()给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从0开始)。如果 needle 不是 haystack 的一部分,则返回  -1 。题目链接:28.找出字符串中第一个匹配项的下标-力扣(LeetCode)思路:标......
  • C# 自己写的编码机制,将任意字节数组和可打印中文字符串相互转换
    正常情况下咱们可以用Base64将字节数组转成可打印字符串,但是有的时候咱们需要编码后具有一定的保密性,很明显Base64就不适用了,网上有个与熊论道就挺有意思的,于是我也研究学习了下,自己实现了一个将字节流编码为可打印(可拷贝)中文字符串的功能,反之,也能将中文字符串解码为原始字节流......
  • 页面跳转传参,携带的数值型数据会转成是字符串
    onLoad(options){let{limit,index}=optionsindex=Number(index);limit=Number(limit)console.log(options); //获取视频页面数据wx.cloud.callFunction({name:'getMedia',data:{sort:'video',......
  • 交替字符串排列
    defalternative_string_arrange(first_str:str,second_str:str)->str:"""返回两个字符串的交替排列。:paramfirst_str:第一个字符串:paramsecond_str:第二个字符串:return:交替排列后的字符串>>>alternative_string_arrange("ABCD&qu......
  • db2主备部署hadr(单个数据库)
    主库:192.168.1.135host135从库:192.168.1.134host134 说明:a.主库已经运行并有数据库DB_HXL可以使用如下命令查看:db2listdatabasedirectory b.主数据库已经处于归档模式,做了主备后,备库也会是归档模式,归档路径与主库配置的是一样的,这就需要备库提前有相应的目录.d......
  • 指针扫描型字符串算法
    【最小表示法】最小表示法循环表示:从一个位置开始向后遍历,到末尾再倒回去最前面。一个字符串(数组)一共有\(n\)个。最小表示法就是最小的循环表示。例如,31491的最小表示法是13149.如果我们用打擂台比大小的方式,因为字符串之间比较需要时间,总共是\(O(n^2)\)的,太慢......
  • 字符串算法学习笔记
    \(\text{Pt.}1\)基础一、进制哈希二、Manacher三、Trie\(\text{Pt.}2\)自动机自动机是什么?它是一个对“信息序列”进行判定的数学模型。“信息序列”可以很随意,比如一个二进制数,比如一个字符串。而“判定”也可以很随意,比如判定一个二进制数是不是奇数,判定当前字符串是......
  • 初等字符串
    $CuO+CO\triangleqCu+CO_2$初等字符串字符串Hash\(\bf{Hash}:\)一种好用又cd的算法\(·First\)如果要比较两个字符串的大小,开\(string\)两两比较是\(O(n)\)の算法如果进行\(m\)次比较的话$O(m\timesn)$显然去世考虑\(O(m)\)の算法,即让比较过程变为\(O(1)\)......