首页 > 其他分享 >数据结构大乱炖

数据结构大乱炖

时间:2023-03-18 13:33:52浏览次数:49  
标签:大乱 int lowbit 复杂度 查询 区间 数据结构 ll

线段树

基本思想

将 [1,n] 分解成若干特定的子区间(数量不超过 4×n),然后,将每个区间 [l,r] 都分解为
少量特定的子区间,通过对这些少量子区间的修改或者统计,来实现快速对 [l,r] 的修改或者统计。

可以解决的问题

满足加法性质的运算的区间问题,如区间和,区间异或,区间 $\gcd$ 等。

不能解决的问题

区间众数等不符合区间加法性质的问题。

原理与实现

线段树通过递归将 $[l,r]$ 的一个区间分为 $[l,mid],[mid+1,r]$,直到 $l=r$。

如果根的高度为 $1$,那么对于区间 $[1,n]$ 建立这棵线段树的高度最高为 $\lfloor{\log (n-1)}\rfloor+2$。

通过一张图来解释线段树对于 $[1,9]$ 的建树过程。

单点查询

单点查询实际上就是定位到线段树的叶子结点。

我们现在假设我们需要定位到 $x$,那么我们就是去找 $[x,x]$ 这个区间。考虑递归,如果 $x \le mid$,显然 $[x,x]$ 在右子树中,反之则在左子树中。

单点修改

进行单点修改,首先也需要定位到这个结点(同单点查询)。然后修改完成后,我们需要一路往上更新,这样才能保证线段树的正确性。

区间查询

假设查询区间为 $[l,r]$,我们从 $[1,n]$ 开始递归查询 $[L,mid]$ 与 $[mid+1,R]$。此时对递归区间进行分类讨论:

  1. 当前区间被目标区间完全包含。此时直接返回当前区间的值即可。

  2. 当前区间与目标区间无交集。此时返回 $0$。

  3. 当前区间没有被目标区间包含且有交。此时递归处理左子树与右子树。

区间修改

需要进行区间修改的时候,我们需要引入一个新东西:懒标记。

对于一个区间 $[l,r]$来说,我们如果每次都更新区间中的每一个值,那样的话更新的复杂度将会是 $O(n \log n)$。

这个复杂度甚至比暴力还高。所以我们引入了懒标记。

懒标记的主要原理是区间修改操作时先对这个区间打上标记,暂时不进行更新,若之后需要用到该节点的信息时再进行更新。

单打标记的复杂度为一个常数。

时空复杂度

单次操作时间复杂度为 $O(\log n)$。

空间复杂度为 $O(4n)$。

模板

这里以区间加法为例。

struct node{
	int l,r;
	ll v,tag;
}a[400001];
int n,m;
ll t[100001],sum[100001];
int ls(int u){
	return u<<1;
}
int rs(int u){
	return (u<<1)|1;
}
bool inrange(int L,int R,int l,int r){
	return (L<=l)&&(r<=R);
}
bool outofrange(int L,int R,int l,int r){
	return (R<l)||(r<L);
}
void build(int u,int L,int R){
	a[u]=(node){L,R,sum[R]-sum[L-1],0};
	if(L!=R){
		int M=L+R>>1;
		build(ls(u),L,M);
		build(rs(u),M+1,R);
	}
}
void pushup(int u){
	a[u].v=a[ls(u)].v+a[rs(u)].v;
}
void pushdown(int u){
	int L=a[u].l,R=a[u].r,M=L+R>>1,K=a[u].tag;
	if(L==R) return ;
	a[u].tag=0;
	a[ls(u)].tag+=K;
	a[rs(u)].tag+=K;
	a[ls(u)].v+=K*(M-L+1);
	a[rs(u)].v+=K*(R-M); 
}
void update(int u,int L,int R,ll k){
	if(a[u].tag) pushdown(u);
	if(inrange(L,R,a[u].l,a[u].r)){
		a[u].tag+=k;
		a[u].v+=k*(a[u].r-a[u].l+1);
		pushdown(u);
	}
	else if(!outofrange(L,R,a[u].l,a[u].r)){
		update(ls(u),L,R,k);
		update(rs(u),L,R,k);
		pushup(u);
	}
}
ll search(int u,int L,int R){
	if(a[u].tag) pushdown(u);
	if(inrange(L,R,a[u].l,a[u].r)){
		return a[u].v;
	}
	else if(!outofrange(L,R,a[u].l,a[u].r)){
		return search(ls(u),L,R)+search(rs(u),L,R);
	}
	else return 0ll;
}

题目

P3372P3373P1253P4145P1198P1531P1471P1972P1438

树状数组

基本思想

树状数组的核心思想是将一个需要操作的区间分解成若干小区间,在维护的时候,直接对这些小区间进行处理,在查询的时候再将这些区间组装成我们想要的区间。

可以解决的问题

满足减法性质的运算的区间问题,如区间和,区间异或等。

不能解决的问题

区间众数,区间 $\gcd$ 等不符合区间加法性质的问题。

原理与实现

这个玩意大概长成这个样子:

(这里用了百度的图片)

它就是一个特殊的前缀和数组。

仔细观察红色框内与灰色框的关系:

$c_1=a_1$

$c_2=a_1+a_2$

$c_3=a_3$

$c_4=a_1+a_2+a_3+a_4$

$c_5=a_5$

$c_6=a_5+a_6$

$c_7=a_7$

$c_8=a_5+a_6+a_7+a_8$

于是可以发现以下规律:

$c_i=a_{i-2k+1}+a_{i-2k+2}+\dots+a_i$

那么找出 $i$ 的二进制下最低位的 $1$ ,然后一步步往上更新便可实现 $O(\log n)$ 单点修改。

那么问题来了,怎么获取最低位的 $1$?

这时候就要引入 $lowbit$ 函数了。原理如下:

先假设该数最低位的 $1$ 在第 $k$ 位上,则按位取反的二进制的第 $k$ 位为 $0$,$0$ 到 $k-1$ 位全部为1。由于进位,$0$ 到 $k-1$ 位全部为 $0$,第 $k$ 位为 $1$,剩下的数位仍然和原来相反。那么 x&(-x) 自然就只剩下最低位的 $1$ 以及它后面的 $0$ 构成的数值了。

知道了以上知识以后,便可以写出修改函数:

void add(int x,ll y){//在位置x的数加上y
	for(int i=x;i<=n;i+=lowbit(i)){
		c[i]+=y;
	}
}

那么上面那个公式可以这么写:

$c_i=\sum^i_{j=i-lowbit(i)+1} a_i$

那么在跑代码的过程中,数据结构内部发生了啥?这里用 $add(5,1)$ 来举例:

可以看到,我们要想单点修改 $a[5]$,则需修改所有包含 $a[5]$ 的区间值,在本例中即为 $c[5],c[6],c[8]$。

区间查询

利用前缀和思想,我们可以知道求 $a_x$ 到 $a_y$ 的和就是求 $a_1$ 到 $a_y$ 的和减去 $a_1$ 到 $a_{x-1}$ 的和。

那么把问题拆开来看,如何求 $a_1$ 到 $a_x$ 的和?

我们可以先将 $c_i$ 加入答案,此时我们的问题变成了求 $a_1$ 到 $a_i-lowbit(i)$ 的和。

那么我们接下来可以将 $c_{i-lowbit(i)}$ 加入答案。

不断重复以上操作,直到 $i$ 变为 $0$。那么此时我们已经得到答案。

代码如下:

ll search(int x,int y){//查询x到y的和
	int sum1=0,sum2=0;
	for(int i=x-1;i;i-=lowbit(i)){
		sum1+=c[i];
	}
	for(int i=y;i;i-=lowbit(i)){
		sum2+=c[i];
	}
	return sum2-sum1;
}

我们还是来看看树状数组内部发生的事情,这里拿查询区间 $[4,6]$ 举例。

可以看到每一步中,都把 $x$ 变成了 $lowbit(x)$,结合 $lowbit$ 函数的概念,相当于不断去掉 $x$ 二进制中最低位的那个 $1$。由于 $i$ 的二进制表示位数不超过 $\log i$,所以单点查询复杂度为 $O(\log n)$。

模板

#include <bits/stdc++.h>
#define ll long long
#define lowbit(x) ((x)&(-x))
using namespace std;
int n,m;
ll a[500001],c[500001];
void add(int x,ll k){
	for(int i=x;i<=n;i+=lowbit(i)){
		c[i]+=k;
	}
}
ll search(int x,int y){
	int sum1=0,sum2=0;
	for(int i=x-1;i;i-=lowbit(i)){
		sum1+=c[i];
	}
	for(int i=y;i;i-=lowbit(i)){
		sum2+=c[i];
	}
	return sum2-sum1;
}
int main(){
	scanf("%d%d",&n,&m);
	for(int i=1;i<=n;i++){
		scanf("%lld",&a[i]);
		add(i,a[i]);
	}
	for(int i=1;i<=m;i++){
		int op;
		scanf("%d",&op);
		if(op==1){
			int x;
			ll k;
			scanf("%d%lld",&x,&k);
			add(x,k);
		}
		else{
			int x,y;
			scanf("%d%d",&x,&y);
			printf("%lld\n",search(x,y));
		}
	}
    return 0;
}

题目

P3374P3368P3372P4939P5057CF652DCF61ESP3267P3531

ST表

基本思想

预处理+倍增。

可以解决的问题

满足不重复贡献的问题,如 RMQ 问题与区间 $\gcd$。

不能解决的问题

不满足不重复贡献性质,如区间和。

因为 ST 表需要预处理,所以也不能处理动态区间问题。

动态RMQ还是写带修莫队罢

原理与实现

预处理

使用一个二维数组存储一定范围信息,例如 $f_{i,j}$ 表示区间 $[i, i+2^j)$的信息。预处理的主要思想为倍增。一个区间的最值来自在左半部分与右半部分的最值。

for(int i=1;(1<<i)<=n;i++){
	for(int j=1;j<=n;j++){
		if(j+(1<<i)-1<=n){
			st[j][i]=max(st[j][i-1],st[j+(1<<(i-1))][i-1]);
		}
	}
}

查询

对于区间 $[l,r]$,我们令 $k=\log(r−l+1)$,那么 $[l+2k,r−2k+1]$ 必然会覆盖原来的区间,尽管可能会有重叠部分,但因为满足不重复贡献性质,所以并不影响结果。

for(int i=1;i<=m;i++){
	int l,r,k;
	scanf("%d%d",&l,&r);
	k=log2(r-l+1);
    printf("%d\n",max(st[l][k],st[r-(1<<k)+1][k]));
}

模板

#include<bits/stdc++.h>
using namespace std;
int n,m,a[100001],st[100001][31];
int main(){
	scanf("%d%d",&n,&m);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i]);
		st[i][0]=a[i];
	}
	for(int i=1;(1<<i)<=n;i++){
		for(int j=1;j<=n;j++){
			if(j+(1<<i)-1<=n){
				st[j][i]=max(st[j][i-1],st[j+(1<<(i-1))][i-1]);
			}
		}
	}
	for(int i=1;i<=m;i++){
		int l,r,k;
		scanf("%d%d",&l,&r);
		k=log2(r-l+1);
	    printf("%d\n",max(st[l][k],st[r-(1<<k)+1][k]));
	}
	return 0;
}

题目

P3865P2471P2216

并查集

基本思想

通过合并操作来快速查询一个元素是否在一个集合中。

可以解决的问题

  1. 某些集合问题。如[ABC293D][def]。

  2. 图的联通性问题。如P1197

  3. 最小生成树。

原理与实现

初始化

我们设 $f_i$ 为 $i$ 的父亲节点。

一开始显然每个节点都只会有这一个元素,所以每个节点的父节点初始化为自己。

for(int i=1;i<=n;i++){
	f[i]=i;
}

合并

如果要合并 $x$ 和 $y$ 所在的集合,很容易想到直接把 $f_x$ 设为 $y$ 就可以了。

查询

查询 $x$ 与 $y$ 是否在同一个集合,只要我们在并查集上爬树,如果他们有公共祖先则在一个集合。

路径压缩

为什么要路径压缩?

考虑并查集的这种情况:

这样的话,每次查询操作的时间复杂度就会退化为线性。

那么怎么进行路径压缩?

我们每次查询的时候直接把查询一路上的所有点的 $f$ 值直接设为最终查询的结果即可。

我们对上图进行路径压缩:

这样我们每次查询的时间复杂度就会变为 $O(1)$,大大优化了查询的效率。

模板

int find(int x){
	if(f[x]!=x){
		f[x]=find(f[x]);
	}//路径压缩
	return f[x];	
}
void uunion(int x,int y){
	f[find(x)]=find(y);
}
void init(){
    for(int i=1;i<=n;i++){
		f[i]=i;
	}
}

题目

P1111P1197P1455P1536ABC293DP1892P2078P2256P2294P2814

标签:大乱,int,lowbit,复杂度,查询,区间,数据结构,ll
From: https://www.cnblogs.com/luqyou/p/17229809.html

相关文章

  • 数据结构-->链表_01
    首次书写链表有关的知识,先来明确什么是链表?链表是一种物理存储结构上非连续,非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的举一个形象化的现实生活中......
  • Qz学算法-数据结构篇(非线性结构、树)
    非线性结构非线性结构包括:二维数组,多维数组,广义表,树结构,图结构树树结构为什么需要树结构数组存储方式的分析优点:通过下标方式访问元素,速度快。对于有序数组,还可使用二分查找......
  • 回顾集合及其数据结构
    集合1.集合的体系Collection集合分为单列集合Collection和双列集合MapCollection只有增删功能没有改查功能,特点是单列集合所有共性功能,有三种遍历方式(1.迭代器2.增......
  • 【数据结构】B树与B+树
    简介:本文主要介绍了B树和B+树的插入、删除操作。一、B树在1970年,Bayer&McCreight发表的论文《ORGANIZATIONANDMAINTENANCEOFLARGEORDEREDINDICES》(大型有序索引......
  • 数组模拟环形队列java(数据结构与算法)
    思路:背景队列有两种实现方式:1、数组,2、链表在数组实现队列时,有的教科书中只说了队列满的条件是(rear+1)%manSize=front这个公式真让人摸不着头脑原来:这是数组模拟环......
  • 01. 数据结构概述
    一、什么是数据结构  数据结构(DataStructure)是计算机中存储、组织数据的方式,它是数据对象、以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可......
  • 【数据结构】栈与队列 - 习题
    其实是老师布置的作业。稍微写了些注释,然后直接把代码扔上来,希望能帮到有需要的同学。拒绝抄作业,写那么多注释就是让你来读懂代码的。栈-使用C++类实现//使用C++类......
  • 【Python】数据结构:集合
    1.集合Python中的集合与数学上的集合是一致的,不允许有重复元素,而且可以进行交集、并集、差集等运算。2.创建集合#字面量方式set1={1,2,3,3,3,2}print(set1)......
  • 数据结构-C语言
    一、基本定义1、数据数据:是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。数据结构:是相互之间存在一种或多种特定关系......
  • 数据结构笔记
    数据结构笔记二叉树遍历方式:前序遍历:打印-左-右中序遍历:左-打印-右后序遍历:左-右-打印Pair头文件:#includepair<类型1,类型2>变量名;pair<int,int>a(......