1. 离线树状数组
介绍
有一类经典问题:给定一个序列,每次询问一个区间内的元素种类数。
这种题的做法有很多:莫队、分块、主席树……在不强制在线的情况下,他们的效率都较低,有一种效率高、空间小的离线做法:离线树状数组。
例题:
P1972 [SDOI2009] HH的项链
题目大意
给定一个长度为 \(n\) 的序列 \(a\),\(m\) 次询问,每次询问一个区间 \([l, r]\) 内的元素种类数。
数据范围:\(n, m\le 10^6\)。
思路
\(10 ^ 6\) 的数据范围直接劝退大多数根号数据结构,主席树还能跑,但效率也挺低的,而且空间占用极大,这里就可以用离线树状数组来做。
我们首先可以推出来一个结论:对于若干个右端点都为 \(r\) 的查询区间 \([l, r]\),那么对于多次出现的数我们只关心靠右的那个数,因为只用统计有几个数出现过,反正都被算过一次了,那么靠右位置的完全可以取代左边位置的。
我们先把所有操作离线下来,钦定一个扫描顺序。根据上面的结论,应该把所有操作按照右端点升序排列。
根据上述方式,维护一个数组 \(c\),当我们将 \(1\sim nowr\) 的数加入计算后,在每个数最后出现的位置打上一个 \(1\) 的标记,表示这个位置上出现了一个新的数。
那么对 \(c\) 求一遍前缀和得到 \(sum\),\(sum_i\) 就表示 \(1\sim i\) 中出现了多少个数,对于每个询问 \([l, r]\) 答案就是 \(sum_r - sum_{l - 1}\)。
树状数组刚好能支持单点修改,区间求和,所以直接用树状数组维护数组 \(c\) 即可。
时间复杂度 \(O(n\log n)\)(假定 \(n,m\) 同级)。
\(\texttt{Code:}\)
#include <iostream>
#include <algorithm>
#define lowbit(x) x & -x
using namespace std;
const int N = 1000010;
int n, m;
int a[N], pre[N]; //pre[i] 表示 i 上一次出现的位置
struct BIT{ //封装的树状数组
int c[N];
void add(int x, int y) {
for(; x < N; x += lowbit(x)) c[x] += y;
}
int ask(int x) {
int res = 0;
for(; x; x -= lowbit(x)) res += c[x];
return res;
}
}tr;
struct node{
int id, l, r;
bool operator< (const node &o) const {
return r < o.r;
}
}q[N];
int ans[N];
int main() {
scanf("%d", &n);
for(int i = 1; i <= n; i++) scanf("%d", &a[i]);
scanf("%d", &m);
int l, r;
for(int i = 1; i <= m; i++) {
scanf("%d%d", &l, &r);
q[i] = {i, l, r};
}
sort(q + 1, q + m + 1);
int nowr = 1;
for(int i = 1; i <= m; i++) {
while(nowr <= q[i].r) { //一直加数直到达到当前查询的右端点
if(pre[a[nowr]]) tr.add(pre[a[nowr]], -1);
tr.add(nowr, 1);
pre[a[nowr]] = nowr; //nowr 将要右移,当前应成为过去
nowr++;
}
ans[q[i].id] = tr.ask(q[i].r) - tr.ask(q[i].l - 1);
}
for(int i = 1; i <= m; i++)
printf("%d\n", ans[i]);
return 0;
}
P4113 [HEOI2012] 采花
题目大意:
给定一个长度为 \(n\) 的序列 \(a\),\(m\) 次询问,每次询问一个区间 \([l, r]\) 中出现次数 \(\ge 2\) 的数。
数据范围:\(n, m\le 2\times 10^6\)。
思路
从数据范围可看出本题及其毒瘤,貌似只有离线树状数组和离线权值线段树能过。
和上一道题的大体思路差不多,但由于这次要维护出现次数 \(\ge 2\) 的数,所以需要 \(pre1\) 和 \(pre2\) 两个数组分别储存 \(i\) 上一次出现的位置和上上次出现的位置。
和上一题不同的是,标记应该打在 \(pre1_{a_{nowr}}\) 上,而不是 \(nowr\) 上。因为当一个区间同时包含 \(pre1_{a_{nowr}}\) 和 \(nowr\) 时才能算数。
\(\texttt{Code:}\)
#include <vector>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 2000010;
int n, vmax, m;
int a[N];
int pre1[N], pre2[N];
struct BIT{
int c[N];
#define lowbit(x) x & -x
inline void add(int x, int y) {
for(; x <= n; x += lowbit(x)) c[x] += y;
}
inline int ask(int x) {
int res = 0;
for(; x; x -= lowbit(x)) res += c[x];
return res;
}
}tr;
struct node{
int id, l, r;
inline bool operator< (const node &o) const {
return r < o.r;
}
}q[N];
int ans[N];
int main() {
scanf("%d%d%d", &n, &vmax, &m);
for(int i = 1; i <= n; i++) scanf("%d", &a[i]);
int l, r;
for(int i = 1; i <= m; i++) {
scanf("%d%d", &l, &r);
q[i] = {i, l, r};
}
sort(q + 1, q + m + 1);
int nowr = 1;
for(int i = 1; i <= m; i++) {
while(nowr <= q[i].r) {
if(pre2[a[nowr]]) {
tr.add(pre2[a[nowr]], -1);
pre2[a[nowr]] = pre1[a[nowr]];
tr.add(pre1[a[nowr]], 1);
pre1[a[nowr]] = nowr;
}
else if(pre1[a[nowr]]) {
pre2[a[nowr]] = pre1[a[nowr]];
tr.add(pre1[a[nowr]], 1);
pre1[a[nowr]] = nowr;
}
else pre1[a[nowr]] = nowr;
nowr++;
}
ans[q[i].id] = tr.ask(q[i].r) - tr.ask(q[i].l - 1);
}
for(int i = 1; i <= m; i++)
printf("%d\n", ans[i]);
return 0;
}