这是即将推送到 OI-wiki 的,对于原 OI-wiki 珂朵莉树页面的重构。作者是我。感谢上一位维护这玩意的人。
简介
珂朵莉树(Chtholly Tree),又名老司机树 ODT(Old Driver Tree)。起源自 CF896C。
这个名称指代的是一种“使用平衡树(std::set
、std::map
等)或链表(std::list
、手写链表等)维护颜色段均摊”的技巧,而不是一种特定的数据结构。其核心思想是将值相同的一段区间合并成一个结点处理。相较于传统的线段树等数据结构,对于含有区间覆盖的操作的问题,珂朵莉树可以更加方便地维护每个被覆盖区间的值。
实现(std::set)
结点类型
struct Node_t {
int l, r;
mutable int v;
Node_t(const int &il, const int &ir, const int &iv) : l(il), r(ir), v(iv) {}
bool operator<(const Node_t &o) const { return l < o.l; }
};
其中,int v
是你自己指定的附加数据。
???+ note "mutable
关键字的含义是什么?"
mutable
的意思是「可变的」,让我们可以在后面的操作中修改 v
的值。在 C++ 中,mutable 是为了突破 const 的限制而设置的。被 mutable 修饰的变量(mutable 只能用于修饰类中的非静态数据成员),将永远处于可变的状态,即使在一个 const 函数中。
这意味着,我们可以直接修改已经插入 `set` 的元素的 `v` 值,而不用将该元素取出后重新加入 `set`。
结点存储
我们希望维护所有结点,使得这些结点所代表的区间左端点单调增加且两两不交,最好可以保证所有区间的并是一个极大的连续范围。此处以 std::set
为例,用一个 set<Node_t> odt;
维护所有结点。
初始化时。向珂朵莉树中插入一个极长区间(如题目要求维护位置 \(1\) 到 \(n\) 的信息,插入区间 \([1,n+1]\))。
split 操作
split
操作是珂朵莉树的核心。它接受一个位置 \(x\),将原本包含点 \(x\) 的区间(设为 \([l, r]\))分裂为两个区间 \([l, x)\) 和 \([x, r]\),并返回指向后者的迭代器。
参考代码如下:
auto split(int x) {
auto it = odt.lower_bound(Node_t(x, 0, 0));
if (it != odt.end() && it->l == x) return it;
--it;
int l = it->l, r = it->r, v = it->v;
odt.erase(it);
odt.insert(Node_t(l, x - 1, v));
return odt.insert(Node_t(x, r, v)).first;
}
assign 操作
另外一个重要的操作:assign
。用于对一段区间进行赋值。设将要对区间 \([l,r]\) 赋值为 \(v\)。
首先,将区间 \([l, r]\) 截取出来。依次调用 \(split(r+1), split(l)\),将此两者返回的迭代器记作 \(itr, itl\),那么 \([itl, itr)\) 这个迭代器范围就指向了珂朵莉树中 \([l,r]\) 包含的所有区间。
然后,将原有的信息删除。std::set
有成员方法 erase
,签名如同 iterator erase( const_iterator first, const_iterator last );
,可以移除范围 [first; last)
中的元素。于是我们调用 odt.erase(itl, itr);
以删除原有的信息。
最后,插入区间 \([l,r]\) 的新值。调用 odt.insert(Node_t(l, r, v))
即可。
参考代码如下:
void assign(int l, int r, int v) {
auto itr = split(r + 1), itl = split(l);
odt.erase(itl, itr);
odt.insert(Node_t(l, r, v));
}
??? 为什么需要先 split(r + 1)
再 split(l)
?
1. `std::set::erase` 方法将使指向被擦除元素的引用和迭代器失效。而其他引用和迭代器不受影响。
2. `std::set::insert` 方法不会使任何迭代器或引用失效。
3. `split` 操作会将区间拆开。调用 `split(r + 1)` 之后 $r + 1$ 会成为两个新区间中右边区间的左端点,此时 `split` 左区间,必然不会访问到 $r + 1$ 为左端点的那个区间,也就不会将其拆开,删去 $r + 1$ 为左端点的区间,使迭代器失效。反之,先 `split(l)`,再 `split(r + 1)`,可能会把 $l$ 为左端点的区间删去,使迭代器失效。
perform 操作
将珂朵莉树上的一段区间提取出来并进行操作。与 assign
操作类似,只不过是将删除区间改为遍历区间。
参考代码如下:
void perform(int l, int r) {
auto itr = split(r + 1), itl = split(l);
for (; itl != itr; ++itl) {
// Perform Operations here
}
}
注意不应该滥用这样的提取操作,可能使得时间复杂度错误。见下文“复杂度分析”一栏。
实现(std::map)
相较于 std::set
的实现,std::map
的实现的 split
操作写法更简单。除此之外,其余操作与 std::set
并无二异。
结点存储
由于珂朵莉树存储的区间是连续的,我们不一定要记下右端点是什么。不妨使用一个 map<int, int> mp;
存储所有区间,其键维护左端点,其值维护其对应的左端点到下一个左端点之前的值。
初始化时,如题目要求维护位置 \(1\) 到 \(n\) 的信息,则调用 mp[1] = -1, mp[n + 1] = -1
表示将 \([1,n+1)\) 即 \([1, n]\) 都设为特殊值 \(-1\),\([n+1, +\infty)\) 这个区间当作哨兵使用,也可以对它进行初始化。
split 操作
参考代码:(第一份)
void split(int x) {
auto it = prev(mp.upper_bound(x)); // 找到左端点小于等于 x 的区间。
mp[x] = it->second; // 设立新的区间,并将上一个区间储存的值复制给本区间。
}
参考代码:(第二份)
auto split(int pos) {
auto it = prev(mp.upper_bound(pos)); // 找到左端点小于等于 x 的区间。
return mp.insert(it, make_pair(pos, it->second)); // 设立新的区间,并将上一个区间储存的值复制给本区间。
}
这里使用了 std::map::insert
的重载 iterator insert( const_iterator pos, const value_type& value );
,其插入 value
到尽可能接近正好在 pos
之前的位置。如果插入恰好发生在正好在 pos
之前的位置,那么复杂度是均摊常数,否则复杂度与容器大小成对数。
其余操作与 std::set
并无二异。
实现(链表)
可参考 题解 CF896C 【Willem, Chtholly and Seniorious】 - 洛谷专栏 (luogu.com.cn)。
复杂度分析
perform 以后立即对同一区间调用 assign
此时观察发现,两次 split
操作至多增加两个区间;一次 assign
将删除范围内的所有区间并增加一个区间,同时遍历所删除的区间。所以,我们所遍历的区间与所删除的区间数量成线性,而每次操作都只会增加 \(O(1)\) 个区间,所以我们操作的区间数量关于操作次数(包括初始化)成线性,时间复杂度为均摊 \(O(m\log n)\),其中记 \(m\) 为操作次数,\(n\) 为珂朵莉树中最大区间个数(可以认为 \(n\leq m\))。
perform 以后不进行 assign
如果允许特殊构造数据,这样一定是能被卡掉的,只需要使珂朵莉树中有足够多的不同区间并反复遍历,就能使珂朵莉树的复杂度达到甚至高于平方级别。
如果要保证复杂度正确,必须保证数据随机。详见 Codeforces 上关于珂朵莉树的复杂度的证明。更详细的严格证明见 珂朵莉树的复杂度分析。证明的结论是:用 std::set
实现的珂朵莉树的复杂度为 \(O(n \log \log n)\),而用链表实现的复杂度为 \(O(n \log n)\)。
习题
「SCOI2010」序列操作(该题目来源已添加 Hack 数据)- 「SHOI2015」脑洞治疗仪
- 「Luogu 4979」矿洞:坍塌
- 「Luogu 8146」risrqnis
扩展阅读
ODT的映射思想的推广 - 洛谷专栏 (luogu.com.cn)
标签:std,set,int,朵莉树,split,区间,模板 From: https://www.cnblogs.com/caijianhong/p/18339590