首页 > 其他分享 >线段树学习笔记

线段树学习笔记

时间:2024-06-13 21:11:22浏览次数:11  
标签:log int 线段 笔记 节点 学习 区间 复杂度

线段树(Segment Tree)是一种基于分治思想的数据结构,可以在 \(\mathcal{O}(\log~n)\) 的时间内完成区间修改区间查询等操作。

1.1 线段树基础

此部分介绍普通线段树的基本思想与操作。

1.1.1 基本思想

线段树本质上就是一棵二叉树,它的每一个节点表示一段区间的信息,对于一个长度不为 \(1\) 的区间 \([l,r]\) ,它的左右儿子分别表示 \([l,\lfloor \frac{l+r}{2} \rfloor]\) 和 \([\lfloor \frac{l+r}{2} \rfloor+1,r]\) 的信息,这样我们就把整个序列划分成了一个树形结构。

当我们维护好线段树后,对于每一次询问,便可以利用已知的节点合并成我们想要的答案。例如我们想要知道区间 \([4,9]\) 的信息,我们只需要知道区间 \([4,6]\) 与区间 \([7,9]\) 的信息即可,极大地优化了时间复杂度。而对于修改,只需要修改影响到的节点即可,具体操作可见下文。

总结一下,线段树的基本思想实质上是一种基于二进制拆分,利用分治思想,归并得到答案的方法。

1.1.2 基本操作

为了方便起见,我们举一个具体的问题:

有一个长度为 \(n\) 的序列 \(a\) ,要求支持以下两种操作:

  1. 将某区间每一个数加上 \(k\)。
  2. 求出某区间每一个数的和。

其中 \(1 \le n \le {10}^5\) 。

建树

首先我们考虑如何确定点的编号,由线段树的定义可知,线段树实质就是一棵二叉树,所以我们考虑用二叉树的编号方式给线段树编号,具体方法如下:

  • 对于一个编号为 \(x\) 的点,其左儿子的编号为 \(2 \times x\) ,其右儿子的编号为 \(2 \times x +1\) 。

接下来就是确定每个节点的左右区间边界,依据线段树的定义可知:

  • 对于一个长度不为 \(1\) 的区间 \([l,r]\) ,它的左右儿子管辖的区间分别为 \([l,\lfloor \frac{l+r}{2} \rfloor]\) 和 \([\lfloor \frac{l+r}{2} \rfloor+1,r]\) 。

具体实现时,显然需要用到递归的方法,从编号为 \(1\) 管辖区间为 \([l,r]\) 的根节点开始,每次依据上述方法更新其左右儿子,如果当前节点区间长度为 \(1\) ,那么它就是叶子节点,他的区间和直接从序列 \(a\) 赋值即可,否则当左右儿子递归结束返回时,需要合并其两个子节点的信息,具体代码如下:

#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int N=1e5+10;
int n,q;
ll a[N];
struct Tree
{
	int l,r,sz;
	ll sum,lazy;
}T[N<<2];//需要维护的基本信息
void push_up(int x)//上浮操作
{
	T[x].sum=T[x<<1].sum+T[x<<1|1].sum;
} 
void init(int l,int r,int x)
{
	T[x]={l,r,r-l+1,0,0};
	if(l==r)
	{
		T[x].sum=a[l];
		return;
	}
	int mid=l+r>>1;
	init(l,mid,x<<1);
	init(mid+1,r,x<<1|1);
	push_up(x);//归并得到x的信息
	return;
}

其中 push_up 操作的含义是将儿子的节点信息合并得到父节点的信息,它被称为上浮操作。

接下来,我们分析一下建树的时间复杂度与空间复杂度。关于空间复杂度,需要考虑建树的过程中一共开了多少个点,我们具体分析一下:

首先,为方便起见,称根节点为第 \(0\) 层。易可以看出线段树一共有 \(\lceil \log_2 n \rceil\) 层,又由于其是一棵完全二叉树,所以共有 \(\sum\limits_{i=0}^{\lceil \log_2 n \rceil} 2^i = 2^{\lceil \log_2 n \rceil+1}-1\) 个节点,其中 \(\lceil \log_2 n \rceil\) 最大能取到 \(\log_2 n+1\),所以最多共有 \(2^{\log_2 n+2}-1=4 \times n-1\) 个节点,所以空间复杂度也是 \(\mathcal{O}(n)\) 级别的,但是线段树开空间的时候需要开 \(4\) 倍空间。

关于时间复杂度,由于一共遍历了 \(4 \times n-1\) 个节点,所以时间复杂度显然是 \(\mathcal{O}(n)\) 的。

区间查询

建好线段树后,我们便可以在线段树上进行区间查询。由于二进制的性质,对于区间 \([l,r]\) ,我们可以将其拆分成最多 \(\log n\) 个区间,只要在线段树上找到这些区间,并将他们归并起来,我们便可以得到答案了。

区间查询我们同样使用递归算法,实现如下:

ll query(int l,int r,int x)//我们要查询区间[l,r],现在到达的节点编号为x
{
	ll ans=0;
	if(l<=T[x].l&&T[x].r<=r)//如果说这个区间被需要查询的区间完全包含,那么就直接返回
	{
		return T[x].sum;
	}
	int mid=T[x].l+T[x].r>>1;
	if(l<=mid) ans+=query(l,r,x<<1);//如果左区间与需查询区间有交集,递归左区间。
	if(r>mid) ans+=query(l,r,x<<1|1);//右区间同理
	return ans;
}

区间查询的复杂度是 \(\mathcal{O}(\log n)\) 的,具体证明如下:

由于查询区间是连续的,所以在每一层中,只有最左边和最右边的节点所代表的区间才有可能没有被完全覆盖,那么传到下一层的时候,最多只有 \(4\) 个节点。同理,查询时每一层最多也只能访问 \(4\) 个节点。由于树共有 \(\lceil \log_2 n \rceil\) 层,复杂度显然是 \(\mathcal{O}(\log n)\) 的,命题得证。

区间修改与懒惰标记的应用

对于区间修改,最直接的方法就是将被修改区间 \([l,r]\) 完全覆盖的所有节点都修改一遍,但这种方法的复杂度我们显然无法承受。于是我们引入一种方法,称为懒惰标记

对于一个被修改区间完全覆盖的节点,显然它的所有子孙节点也被完全覆盖。此时我们考虑不修改它的子孙节点的信息,而是在此节点打一个标记,等到需要用到它的子孙节点的信息时在依据此节点的标记修改它们,这样可以大大减少时间复杂度。由于这是一种通过延迟对节点信息的更改的方法,故被称为懒惰标记

加入了懒惰标记之后,易发现它的复杂度与区间查询的复杂度是一样的,故为 \(\mathcal{O}(\log n)\) 。

知道了它的思想,我们便可以具体实现出来:

void f(ll num,int x)
{
	T[x].sum+=num*T[x].sz;
	T[x].lazy+=num;
}//将具体如何修改写成函数,更加便利
void push_down(int x)
{
	if(T[x].lazy==0)
	{
		return;
	}
	f(T[x].lazy,x<<1);
	f(T[x].lazy,x<<1|1);
	T[x].lazy=0;
}//下沉操作
void modify(int l,int r,int x,ll num)
{
	if(l<=T[x].l&&T[x].r<=r)
	{
	    f(num,x);//如果完全包含,打上标记,仅修改此节点的信息
	    return;//直接返回,不修改子孙节点
	}
	push_down(x);//需要用到x儿子的信息,取消标记,下放信息
	int mid=T[x].l+T[x].r>>1;
	if(l<=mid) modify(l,r,x<<1,num);
	if(r>mid) modify(l,r,x<<1|1,num);
	push_up(x);//上浮操作,归并得到x节点的信息。
	return;
}

其中 push_down 操作被称为下沉操作,具体含义是取消当前节点的标记,将修改下放到左右儿子。

引入了懒惰标记之后,我们发现区间查询操作也需要修改一下,具体见下文:

ll query(int l,int r,int x)
{
	ll ans=0;
	if(l<=T[x].l&&T[x].r<=r)
	{
		return T[x].sum;
	}
	push_down(x);//我们下文需要用到x子节点的信息,但有可能还未更改,故进行一步下沉操作。
	int mid=T[x].l+T[x].r>>1;
	if(l<=mid) ans+=query(l,r,x<<1);
	if(r>mid) ans+=query(l,r,x<<1|1);
	return ans;
}

1.1.3 练习

标签:log,int,线段,笔记,节点,学习,区间,复杂度
From: https://www.cnblogs.com/zhuluoan/p/18246762

相关文章

  • 小红书电商实战营:小红书笔记带货和无人直播,24年6月新课
    课程目录1.我的电商创业经历(余文)_.mp42.为什么现在是入局小红书的最佳红利期(余文)_.mp43,.如何打造高利润直摇间_.mp44.无人直播业务总结(余文)_.mp45.如何用笔记打爆直播间_.mp46.如何根据不同的业务阶段搭建核心团队(理论)_.mp47.学员案例分享_.mp408.学员手册介绍_.mp41......
  • hive函数学习
    复制粘贴到MD文档中查看更方便Hive函数学习目录Hive函数学习SQL练习Hive常用函数关系运算数值计算条件函数(主要使用场景是数据清洗的过程中使用,有些构建表的过程也是需要的)日期函数重点!!!字符串函数Hive中的wordCount1.1 Hive窗口函数1.1.1 聚合开窗函数聚合开窗函数实战:实战1......
  • 隐语课程学习笔记6-逻辑回归LR与广义线性模型GLM开发实践
    隐语第6课,开始介绍具体的机器学习算法以及使用隐语模型进行真实数据的建模实验。首先介绍广义线性模型,广义线性模型(GLM)是线性模型的扩展,通过联系函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。它的特点是不强行改变数据的自然度量,数据可以具有非线性和非......
  • 隐语课程学习笔记5-隐私保护机器学习算法概要
    隐语课程第5课,简单介绍了隐语的算法能力,包括预处理、隐私求交、决策树模型、线性回归模型、神经网络模型,并且支持数据水平切分(横向联邦)、垂直切分(纵向联邦)、混合切分(横纵向联邦)。隐语提供了包括对DataFrame的封装,以及提供联邦ndarray的封装,和python的使用基本一致,上手较快,比......
  • [论文学习] 全密态数据库密态计算关键技术综述
    原文链接全密态数据库的功能和挑战其概述。全密态数据库的应用个场景和3种典型架构。后续3章对3种架构的关键技术做总结和分析。基于软件的加密方案。基于可信硬件TEE的关键技术。基于软硬融合的关键技术。保护访问模式的相关技术的总结分析。未来展望全密态数据库概述......
  • pwn学习-栈迁移
    栈迁移:简单理解就是在栈溢出的时候可溢出的字符过少,只能溢出ebp和ret的地址,可以使用leave_ret这个gadget来实现栈的迁移。在栈中,默认情况下汇编语言在栈结束的时候都默认会执行一次leave和ret指令,我们利用这个特性将返回地址修改为leave_ret的gadget,将会执行两次leave和ret的操......
  • CPN Tools学习——时间和队列【重要】
    -TimedColorSets时间颜色集-TokenStamps令牌时间戳-EventClock全局/事件/模拟时钟-TimeDelaysonTransitions过渡的时间延迟-ListColorSet列表颜色集-Queue排队1.时间颜色集在定时CPN模型令牌中有:(1)象征性的颜色(2)时间戳:时间戳是一个非负整数.句法:1`e@+表......
  • 【模版】线段树
    https://www.luogu.com.cn/problem/P3372#include<cstring>#include<iostream>#include<algorithm>usingnamespacestd;#defineN100005#defineLLlonglong#definelcu<<1#definercu<<1|1LLw[N];structTree{//线段树LL......
  • 机器学习项目--库存需求预测3--LSTM模型
    一、导入库和数据集代码环境:主要的包版本如下python==3.10scikit-learn==1.0.2tensorflow==2.15.0导入库importpandasaspdimportnumpyasnpfromkeras.modelsimportSequentialfromkeras.layersimportDense,LSTM,Dropoutfromkeras.regularizersimport......
  • 孩子上初中厌学怎么办?家长做好3件事,能让孩子爱上学习
    孩子上初中厌学www.zjia8.com会直接导致学习成绩下滑,甚至会染上很多不良习惯,成为危害社会的“不稳定因子”。而改变这种状况,不能只靠初中生个人,更多的要靠家长。如果家长能做好以下3件事,就有希望让孩子爱上学习。第一件事:找出原因,进行相应的调整初中是小学向高中......