ZKW 非递归线段树详解

在算法竞赛和高性能计算场景中,线段树(Segment Tree) 是一个必修的数据结构。它可以在 $O(log n)$ 时间内高效地完成区间查询与修改,比如:区间求和/最大/最小值查询配合区间加法/乘法/赋值操作。

经典线段树都是递归实现,即“从顶到底地去访问”整棵树。这种方式功能强大、可拓展性高,不过代码量稍大,实现起来相对“啰嗦”。运行时的函数递归开销大,尤其在多次深度递归调用时。

那么,是否有一种实现方式,可以去掉递归、保留高性能、更紧凑简洁?这时候,我们要介绍主角——zkw线段树。

🧠 什么是 zkw 线段树?

zkw 线段树的名称来源于一位中国信息学竞赛(由他发明)。这是一个 非递归实现的线段树结构。它的设计核心是:通过自底向上的迭代方式完成查询和修改操作。

相比传统递归线段树,zkw 在以下几个方面有明显优势:

  • 完全去除递归,避免函数栈开销,这也使得常数极小,运行速度优于递归版约 10%~30%
  • 逻辑紧凑,代码量少,对手写友好,非常适合比赛中快速实现;

当然,它也并非万能,当你需要支持更复杂的操作如区间乘法、赋值、合并区间信息时,他的结构不易再支撑复杂操作,改用传统递归线段树反而更灵活、更强大。

📚 zkw 线段树的结构变化

zkw 线段树底层是如何组织数据的?其仍然用数组模拟一个二叉树。

zkw 线段树的核心思想仍是使用数组模拟一棵二叉树,将所有叶子节点排列在数组的下半部分,内节点放在上半部分,自底向上维护区间信息。按照提出者传下的惯例,通常将大小向上对齐到二的次幂((N) 是原数组大小,找一个大于等于 (N) 的最小的 $2^k$,记为 (base)(通常为(2^{lceil log_2 N rceil})),保证线段树是一个完美二叉树。

ZKW 非递归线段树详解

整个线段树数组大小为 (2 * base),惯例从 1 为根节点开始编号(有些实现从 0);

位置 编号范围 说明
根节点 1 整个区间 [0, N-1]
内部节点 ([1, base - 1]) 管理子区间信息
叶子节点 ([base, base + N - 1]) 原数组元素对应位置

自底向上维护区间信息

zkw 的精妙之处在于:所有查询与更新操作都从叶子节点开始,向上合并区间信息。传统线段树从根节点出发,将一个区间拆分为对数个区间;而我们从目标区间的两个端点处的叶节点出发,也可以找到要拆分的区间。

为了进行区间拆分,我们想象两个指针在两个叶节点端点处,每一轮,如果左端点是一个左儿子,那么上跳(因为其父节点仍在区间内);但如果左端点是一个右儿子,则其应该被单独拆分出来,讨论掉他后,左端点向右移(然后再上跳)。右端点同理。直到他们相遇,所有拆分的节点就是拆分出的子区间。

ZKW 非递归线段树详解

如图所示,假定要更新区间。访问 ([2, 10]) 将最终被拆分为 4 个区间(红色节点),黄色为在范围内但由懒标记保护不用更新的大规模下层节点(被红色完全覆盖),而绿色则为会被红色节点影响,需要被 pushUp 的上层节点(同时也是经典线段树中根节点访问 ([2, 10]) 的路径)。

🔄 zkw 线段树的实现

建树

计算出稍大于原数组的二次幂大小,构建二叉树。取原数组直接平移到叶节点处即可,然后生成非叶节点的和。

区间修改

对于拆分出的每个区间,都进行修改并更新懒标记(红点)。同时,绿点的总和值也会受到影响,所以他们需要被 pushUp(即两个叶节点到根节点路径上的所有点)

注意,pushUp 需要更新自身的值为子节点值之和+自身的懒标记。因为懒标记不总会被我们主动下推。

ZKW 非递归线段树详解

区间和

对于拆分出的每个区间,都直接统计其值(红点)。同时,绿点存在的懒标记也可能影响到总和,所以在正式求和之前,将他们全部下推到底(从两个叶节点到顶点路上的所有点,从上往下推下来)。

// 0-based 闭区间 class zkwSegmentTree {     int n;                      // 实际元素个数     int M;                      // 叶子起点(2 的幂)     vector<long long> sum;     vector<long long> lazy;     vector<int> len;            // 每个结点管辖区间长度(不必须,也可以计算)      inline void apply(int x, long long val) {         sum[x]  += val * len[x];         lazy[x] += val;     }      inline void pushUp(int x) {         sum[x] = sum[x << 1] + sum[x << 1 | 1] + lazy[x] * 1LL * len[x];     }      inline void pushDown(int x) {         if (lazy[x] == 0) return;         apply(x << 1,     lazy[x]);         apply(x << 1 | 1, lazy[x]);         lazy[x] = 0;     }      // 把从根到 x 的路径上所有懒标记一层层下推     inline void pushDownPath(int x) {         static int stk[25];      // log2(2e5) ≈ 18,足够         int top = 0;         for (x >>= 1; x; x >>= 1) stk[top++] = x;         while (top) pushDown(stk[--top]);     }  public:     explicit zkwSegmentTree(const vector<long long>& a) {         n = (int)a.size();         M = 1; while (M < n) M <<= 1;          // 2 的幂         sum.assign(M << 1, 0);         lazy.assign(M << 1, 0);         len .assign(M << 1, 0);          // 预计算区间长度         for (int i = M; i < (M << 1); ++i) len[i] = 1;         for (int i = M - 1; i; --i) len[i] = len[i << 1] + len[i << 1 | 1];          // 叶子赋初值         for (int i = 0; i < n; ++i) sum[M + i] = a[i];         // 自底向上求和         for (int i = M - 1; i; --i) sum[i] = sum[i << 1] + sum[i << 1 | 1];     }      void add(int l, int r, long long val) {          int L = l + M, R = r + M;          int l0 = L, r0 = R;            // 记录,待会儿 pushUp         while (L <= R) {             if (L & 1) apply(L++, val);    // 若 L 是右儿子,则整段属于答案             if (!(R & 1)) apply(R--, val); // 若 R 是左儿子             L >>= 1;  R >>= 1;         }         // 分别沿两条端点路径向上刷新,注意从最近祖先到根节点也需要更新         for (int i = l0 >> 1; i; i >>= 1) pushUp(i);         for (int i = r0 >> 1; i; i >>= 1) pushUp(i);     }      long long query(int l, int r) {         int L = l + M, R = r + M;         pushDownPath(L);         pushDownPath(R);          long long ans = 0;         while (L <= R) {             if (L & 1) ans += sum[L++];    // L 为右儿子,整段可取             if (!(R & 1)) ans += sum[R--]; // R 为左儿子             L >>= 1;  R >>= 1;         }         return ans;     } }; 

标记永久化方法

对于这道题来说(求和),除此在求和前下推所有需要的标记以外,还有一个思路:根本不下传标记,而是让标记永久停留在它被打下去的结点上,在真正需要它的那一刻——查询时——再即时计算它对答案的贡献。这个思路被称为标记永久化(Tag Persistence)

具体来说在查询时,我们不使用 pushDownPath,而是现场计算每个绿点的懒标记对答案的贡献并累加。懒标记绝不往下传递,也不更新子结点。

对于上面代码,我们可以选择这样的写法:维护两组指针,一组正常向上分解区间,另外一组总是从边缘叶节点往上跳(保证他们覆盖所有的绿色节点),每次计算时,计算绿色节点持有的懒标记带来的贡献(懒标记值乘以左侧(或右侧)已计算的数的个数)。

long long range_query(int l, int r) {     int L = l + M, R = r + M;     // pushDownPath(L);     // pushDownPath(R);     int tl = L, tr = R, lc = 0, rc = 0;      long long ans = 0;     while (L <= R) {         ans += lazy[tl] * lc + lazy[tr] * rc; // 计算本层的绿色节点懒标记         if (L & 1) ans += sum[L++], lc += len[L - 1];         if (!(R & 1)) ans += sum[R--], rc += len[R + 1];         L >>= 1;  R >>= 1; tl >>= 1; tr >>= 1;     }     while (tl) { // 懒标记计算还要持续到根节点         ans += lazy[tl] * lc + lazy[tr] * rc;         tl >>= 1; tr >>= 1;     }     return ans; } 

ZKW 非递归线段树详解

按照这个思路,经典线段树实际上也可以在某些情况不推标记,只是不能带来任何好处。

开区间拆分法

其实原作者提出的区间拆分并非如此,原作者提出的思路是,将目标区间 ([L,R]) 视作开区间 ((L-1,R+1)),并在外侧的两个点开始向上。每一轮,如果左端点是一个左儿子,其右儿子被单独拆分,讨论掉他后上跳。右端点同理。直到他们互为兄弟,此时结束上跳。最后处理他们和他们的父节点(以及从父节点开始连接到根节点的更新)。

这种方法也很直观,不过需要额外处理目标区间由 0 开头或者在最后结束的情况(添加哨兵)

ZKW 非递归线段树详解

这种写法的代码略。

⚖️ 优点和劣势

特性 zkw 线段树 经典线段树 树状数组 (Fenwick)
更新复杂度 O(log n) O(log n) (较大常数) O(log n)
查询复杂度 O(log n) O(log n) (较大常数) O(log n)
常数开销 低(无下推一般较优,也无递归调用) 较高(函数递归+下推) 极低(迭代加减)
代码简洁度 高(接口单一)
支持操作 区间加法、区间乘法等可叠加标记 任意可合并区间操作 仅点更新+前缀和查询
复杂懒标记维护 ★★☆☆☆ ★★★★☆
扩展性 较差(赋值、多种标记叠加难) 最强(各种懒标记、区间合并) 差(只能单一标记)

zkw 利用端点自底向上累加祖先的懒标记,去掉了所有下推逻辑和递归调用,因而常数极小、代码量少。但它只能高效支持「可叠加」的懒标记,遇到区间赋值、区间最小/最大查询等更复杂的懒标记场景时,维护逻辑很快就会变得繁琐且易错。
经典递归线段树 功能最全,支持任意组合的懒标记和区间合并,扩展性强;唯一代价是模板较长、运行时有函数调用和下推开销。
树状数组 则针对点更新+前缀/区间和查询做了极致优化,代码最简;但它天生不适合「赋值覆盖」「区间乘法」等复杂操作。

随着维护的问题越来越复杂,各类懒标记(赋值、乘法、异或、区间合并等)层出不穷,标记永久化方案的管理成本会迅速飙升,原本“少写几个函数”“去掉下推”的优势也将逐渐丧失。 所以其不能完全取代经典线段树。

发表评论

评论已关闭。

相关文章

当前内容话题