「学习笔记」CDQ分治

技术分享 3年前 (2023-07-02) 0 999+

CDQ 分治的思想最早由 IOI2008 金牌得主陈丹琦在高中时整理并总结，目前这个思想的拓展十分广泛。

优点：可以将数据结构或者 DP 优化掉一维
缺点：这是离线算法。

引入

让我们来看一个问题

有 $ n $ 个元素，第 $ i $ 个元素有 $ a_i,b_i,c_i $ 三个属性，设 $ f(i) $ 表示满足 $ a_j leq a_i $ 且 $ b_j leq b_i $ 且 $ c_j leq c_i $ 且 $ j ne i $ 的 (j) 的数量。
对于 $ d in [0, n) $，求 $ f(i) = d $ 的数量。
$ 1 leq n leq 10^5$，$1 leq a_i, b_i, c_i le k leq 2 times 10^5 $。

这是一个三维偏序问题。

偏序问题：给定序列 (A)，其中有序对 ((A_i, A_j))，满足 (i < j) 且 (A_i < A_j) 这样的有序对我们称之为逆序对，信息学竞赛中的逆序对问题，一般是要我们计数给出序列的逆序对个数的总和。其实可以把它看成一个特殊的二维偏序问题，或者说是离散化 (x) 坐标的二维偏序问题。

而 CDQ 分治，可以来解决三维偏序问题。
上面的引入问题就是模板题 P3810 【模板】三维偏序（陌上花开）的题意。

P3810 【模板】三维偏序（陌上花开）

变量及其含义

struct node { 	int x, y, z, cnt, ans; } s1[N], s2[N];

x, y, z: 三个元素。
cnt：相同元素的个数。
ans：统计答案。

对于第一维 (a)，我们可以先从小到大 sort 一遍，(i) 号点前面的点的 (a) 都比 (a_i) 小，这样我们就减少了一维的处理，还剩下两维。

bool cmp1(node a, node b) { 	if (a.x == b.x) { 		if (a.y == b.y) { 			return a.z < b.z; 		} 		else return a.y < b.y; 	} 	return a.x < b.x; } // main() 函数里面 n = read<int>(), k = read<int>(); mx = k; for (int i = 1, x, y, z; i <= n; ++ i) { 	x = read<int>(), y = read<int>(), z = read<int>(); 	s1[i].x = x, s1[i].y = y, s1[i].z = z; } sort(s1 + 1, s1 + n + 1, cmp1);

排完序后，我们可以将相同的元素合并为一个元素，结构体里的 cnt 就派上用场了。

int top = 0; for (int i = 1; i <= n; ++ i) { 	++ top; 	if (s1[i].x != s1[i + 1].x || s1[i].y != s1[i + 1].y || s1[i].z != s1[i + 1].z) { 		s2[++ m].x = s1[i].x; 		s2[m].y = s1[i].y; 		s2[m].z = s1[i].z; 		s2[m].cnt = top; 		top = 0; 	} }

然后处理第二维，对于第二维，我们要求 (b_j leq b_i)，按照前面的思路，我们肯定也要想方设法给第二维排序。
我们可以用 归并排序 的思想，先分别给左半个区间和右半个区间按照第二维从小到大排序，然后依次处理，由于是在 (a) 排好序的基础上进行的在排序，且这两个的区间还没有合并，所以无论怎么打乱，都可以保证左半边元素的 (a) 小于等于右半边元素的 (a)。
对于第三维，相当于到了我们找逆序对的环节了，我们有归并排序和树状数组两种方法，但由于归并排序已经放到前面去处理第二维了，所以我们用树状数组来处理第三维，将节点依次插入树状数组，统计。

bool cmp2(node a, node b) { 	if (a.y == b.y) { 		return a.z < b.z; 	} 	return a.y < b.y; }  void add(int u, int w) { 	for (int i = u; i <= mx; i += lowbit(i)) { 		t[i] += w; 	} }  int ask(int u) { 	int sum = 0; 	for (int i = u; i; i -= lowbit(i)) { 		sum += t[i]; 	} 	return sum; }  void cdq(int l, int r) { 	if (l == r)	return ; 	int mid = (l + r) >> 1; 	cdq(l, mid); 	cdq(mid + 1, r); 	sort(s2 + l, s2 + mid + 1, cmp2); 	sort(s2 + mid + 1, s2 + r + 1, cmp2); 	int i, j = l; 	for (i = mid + 1; i <= r; ++ i) { 		while (s2[i].y >= s2[j].y && j <= mid) { // 一旦不符合，先统计，然后右指针右移一位。 			add(s2[j].z, s2[j].cnt); // 插入 			++ j; 		} 		s2[i].ans += ask(s2[i].z); 	} 	for (i = l; i < j; ++ i) { // 清空数组,memset 常数太大。 		add(s2[i].z, -s2[i].cnt); 	} }

最后就是处理答案了，完整代码：

/*   The code was written by yifan, and yifan is neutral!!!  */  #include <bits/stdc++.h> using namespace std; typedef long long ll; #define lowbit(i) (i & (-i))  template<typename T> inline T read() { 	T x = 0; 	bool fg = 0; 	char ch = getchar(); 	while (ch < '0' || ch > '9') { 		fg |= (ch == '-'); 		ch = getchar(); 	} 	while (ch >= '0' && ch <= '9') { 		x = (x << 3) + (x << 1) + (ch ^ 48); 		ch = getchar(); 	} 	return fg ? ~x + 1 : x; }  const int N = 1e5 + 5;  int n, k, mx, m; int t[N << 1], res[N];  struct node { 	int x, y, z, cnt, ans; } s1[N], s2[N];  bool cmp1(node a, node b) { 	if (a.x == b.x) { 		if (a.y == b.y) { 			return a.z < b.z; 		} 		else return a.y < b.y; 	} 	return a.x < b.x; }  bool cmp2(node a, node b) { 	if (a.y == b.y) { 		return a.z < b.z; 	} 	return a.y < b.y; }  void add(int u, int w) { 	for (int i = u; i <= mx; i += lowbit(i)) { 		t[i] += w; 	} }  int ask(int u) { 	int sum = 0; 	for (int i = u; i; i -= lowbit(i)) { 		sum += t[i]; 	} 	return sum; }  void cdq(int l, int r) { 	if (l == r)	return ; 	int mid = (l + r) >> 1; 	cdq(l, mid); 	cdq(mid + 1, r); 	sort(s2 + l, s2 + mid + 1, cmp2); 	sort(s2 + mid + 1, s2 + r + 1, cmp2); 	int i, j = l; 	for (i = mid + 1; i <= r; ++ i) { 		while (s2[i].y >= s2[j].y && j <= mid) { 			add(s2[j].z, s2[j].cnt); 			++ j; 		} 		s2[i].ans += ask(s2[i].z); 	} 	for (i = l; i < j; ++ i) { 		add(s2[i].z, -s2[i].cnt); 	} }  int main() { 	n = read<int>(), k = read<int>(); 	mx = k; 	for (int i = 1, x, y, z; i <= n; ++ i) { 		x = read<int>(), y = read<int>(), z = read<int>(); 		s1[i].x = x, s1[i].y = y, s1[i].z = z; 	} 	sort(s1 + 1, s1 + n + 1, cmp1); 	int top = 0; 	for (int i = 1; i <= n; ++ i) { 		++ top; 		if (s1[i].x != s1[i + 1].x || s1[i].y != s1[i + 1].y || s1[i].z != s1[i + 1].z) { 			s2[++ m].x = s1[i].x; 			s2[m].y = s1[i].y; 			s2[m].z = s1[i].z; 			s2[m].cnt = top; 			top = 0; 		} 	} 	cdq(1, m); 	for (int i = 1; i <= m; ++ i) { 		res[s2[i].ans + s2[i].cnt - 1] += s2[i].cnt; 	} 	for (int i = 0; i < n; ++ i) { 		printf("%dn", res[i]); 	} 	return 0; }

P5094 [USACO04OPEN] MooFest G 加强版

一道比较好的入门题。统计答案的时候稍微麻烦一些。

/*   The code was written by yifan, and yifan is neutral!!!  */  #include <bits/stdc++.h> using namespace std; typedef long long ll;  template<typename T> inline T read() { 	T x = 0; 	bool fg = 0; 	char ch = getchar(); 	while (ch < '0' || ch > '9') { 		fg |= (ch == '-'); 		ch = getchar(); 	} 	while (ch >= '0' && ch <= '9') { 		x = (x << 3) + (x << 1) + (ch ^ 48); 		ch = getchar(); 	} 	return fg ? ~x + 1 : x; }  const int N = 5e4 + 5;  int n; ll ans;  struct node { 	ll v, x; } g[N];  bool cmp1(node a, node b) { 	return a.v < b.v; }  bool cmp2(node a, node b) { 	return a.x < b.x; }  void cdq(int l, int r) { 	if (l == r)	return ; 	int mid = (l + r) >> 1; 	cdq(l, mid); 	cdq(mid + 1, r); 	sort(g + l, g + mid + 1, cmp2); 	sort(g + mid + 1, g + r + 1, cmp2); 	ll sum1 = 0, sum2 = 0; 	for (int i = l; i <= mid; ++ i) { 		sum2 += g[i].x; 	} 	for (int i = mid + 1, j = l; i <= r; ++ i) { 		while (j <= mid && g[j].x < g[i].x) { 			sum1 += g[j].x; 			sum2 -= g[j].x; 			++ j; 		} 		int cnt1 = j - l, cnt2 = mid - j + 1; 		ans = ans + (cnt1 * g[i].x - sum1 + sum2 - cnt2 * g[i].x) * g[i].v; 	} }  int main() { 	n = read<int>(); 	for (int i = 1; i <= n; ++ i) { 		ll v = read<ll>(), x = read<ll>(); 		g[i] = node{v, x}; 	} 	sort(g + 1, g + n + 1, cmp1); 	cdq(1, n); 	cout << ans << 'n'; 	return 0; }

发表评论