首页 > 其他分享 >深入理解经典红黑树 | 京东物流技术团队

深入理解经典红黑树 | 京东物流技术团队

时间:2024-01-05 15:55:51浏览次数:37  
标签:parentOf setColor sib 插入 红黑树 物流 京东 节点

本篇我们讲红黑树的经典实现,Java中对红黑树的实现便采用的是经典红黑树。前一篇文章我们介绍过左倾红黑树,它相对来说比较简单,需要大家看完上篇再来看这一篇,因为旋转等基础知识不会再本篇文章中赘述。本篇的大部分内容参考 《算法导论》和 Java 实现红黑树的源码,希望大家能够有耐心的看完。

在正文开始之前我们先看如下问题:

  • 为什么红黑树比AVL树要应用得更广泛呢?

关于红黑树和 AVL 树,大家可能看过“在最坏情况下,AVL 树和红黑树的查找次数都是对数级别的,虽然红黑树的系数更高一些,但是没有本质的区别,是可以容忍的。AVL 树最致命的地方在于删除节点时旋转次数是对数级别的,而红黑树最多只需要 3 次旋转,这导致了红黑树应用相比于 AVL 树要广泛得多”的观点,但实际上这并不是根本原因,根本原因是在以任意序列插入和删除操作混合进行的情况下,红黑树均摊时间复杂度保持在 O(1),而 AVL 树的均摊时间复杂度为 O(logn)

经典红黑树与2-3-4搜索树 同构,它相比于左倾红黑树(2-3树)的实现,在维持红黑树平衡性开销更小。下文中我们会将经典红黑树简称为红黑树,开始吧:

2-3-4 搜索树

2-3-4搜索树是在2-3搜索树中增加了4-节点,在前文中已经介绍过4-节点,我们先来看一下2-3-4搜索树的样子:

2-3-4树.jpg

新节点插入2-节点或3-节点的情况我们就不在这里赘述了,我们重点看一下新节点插入4-节点的情况。当有新节点插入的节点为4-节点时,需要先将4-节点转换成3个2-节点,再在其中的2-节点中执行插入操作,如下所示,其中黄色节点为新插入的节点,对应了插入4-节点中的四种情况:

2-3-4树2.jpg

我们再以情况(4)为例,在2-3-4搜索树中执行插入值为34的节点:

2-3-4树3.jpg

将4-节点转换成3个2-节点并完成插入新节点34后,需要将“根节点25”插入到父节点中,如上图所示。这和我们在前文中在2-3搜索树中讲到的基本类似,需要不断分解临时的5-节点,并将原来4-节点分解成3个2-节点的根节点插入到更高的父节点中,直到遇到2-节点或3-节点,将其转换成不需要继续分解的节点,如果最终插入到根节点后使其为5-节点,同样需要进行分解再插入的操作,完成后树高加一

2-3-4树的插入操作使树本身的改变也是局部的,除了相关的节点和引用之外,不必修改和检查树的其他部分,这些局部变换不会影响到树的全局有序性和平衡性,在插入的过程中,2-3-4树始终是完美平衡二叉树

经典红黑树

经典红黑树与2-3-4搜索树同构,如果我们把2-3-4搜索树样例转换成红黑树的话,会如下图所示(指向红色节点的链接我们同样也染成红色):

经典红黑树.jpg

它满足如下性质:

  • 节点颜色为红色或黑色

  • 根节点是黑色的

  • 叶子节点(null 节点)为黑色(null 节点在图中未画出来)

  • 红色节点的两个子节点为黑色(不能出现连续的红色节点)

  • 任意叶子节点到根节点路径上的黑色节点数量相同,即该树是黑色平衡的

黑色平衡这条性质我们在讲解左倾红黑树时已经讲过,在这里我们不厌其烦地再叙述一遍:2-3-4树始终能保持完美平衡,那么任意叶子节点到达根节点的距离是相等的,红黑树又是一颗2-3-4搜索树,其中的黑链接是2-3-4搜索树中的普通链接,那么红黑树中被黑色链接引用的黑色节点也必然是完美平衡的,所以任意叶子节点到根节点路径上的黑色节点数量必然相同。

下面我们结合图示和Java中 TreeMap 源码来讲解红黑树的插入和删除节点操作:

节点定义

    static final class Entry<K,V> implements Map.Entry<K,V> {
        K key;
        V value;
        Entry<K,V> left;
        Entry<K,V> right;
        Entry<K,V> parent;
        boolean color = BLACK;

        Entry(K key, V value, Entry<K,V> parent) {
            this.key = key;
            this.value = value;
            this.parent = parent;
        }
        // ...
    }

我们可以发现节点定义除了有表示颜色信息和左右子节点的引用外,还增加了 parent 针对父节点的引用。

插入节点

插入2-节点

直接将节点插入2-节点的情况非常简单,如下图所示的两种情况,2-节点转换成3-节点:

经典红黑树2.jpg

插入3-节点

插入3-节点我们需要分左斜3-节点和右斜3-节点两种情况讨论:

  1. 插入左斜的3-节点的左节点或右节点,需要将其转换成4-节点,如下图所示:

经典红黑树3.jpg

  1. 插入右斜的3-节点的左节点或右节点,需要将其转换成4-节点,如下图所示:

经典红黑树4.jpg

插入4-节点

以上两种情况都是不会发生“向上合并”,如果插入的4-节点,需要将其分解成3个2-节点,之后将2-节点的“根节点”合并到它的父节点中(如果有的话),我们同样需要分情况讨论:

  1. 插入4-节点的左侧红色节点:

经典红黑树5.jpg

  1. 插入4-节点的右侧红色节点:

经典红黑树6.jpg

目前插入新节点的所有情况已经讨论完了,下面我们看一下 TreeMap 中的源码,大家注意其中的注释即可:

    public V put(K key, V value) {
        Entry<K,V> t = root;
        // 插入第一个节点
        if (t == null) {
            compare(key, key);

            root >(key, value, null);
            size = 1;
            modCount++;
            return null;
        }
        int cmp;
        Entry<K,V> parent;
        // 根据比较器找到插入节点的位置
        Comparator<= comparator;
        if (cpr != null) {
            do {
                parent = t;
                cmp = cpr.compare(key, t.key);
                if (cmp 0)
                    t = t.left;
                else if (cmp 0)
                    t = t.right;
                else
                    return t.setValue(value);
            } while (t != null);
        }
        else {
            if (key == null)
                throw new NullPointerException();
            @SuppressWarnings("unchecked")
                Comparable<= (Comparable<) key;
            do {
                parent = t;
                cmp = k.compareTo(t.key);
                if (cmp 0)
                    t = t.left;
                else if (cmp 0)
                    t = t.right;
                else
                    return t.setValue(value);
            } while (t != null);
        }
        // 根据大小关系添加新的节点
        Entry<K,V> e >(key, value, parent);
        if (cmp 0)
            parent.left = e;
        else
            parent.right = e;
        // *插入之后修复平衡操作*
        fixAfterInsertion(e);
        size++;
        modCount++;
        return null;
    }

需要重点关注 fixAfterInsertion 方法:

    private void fixAfterInsertion(Entry<K,V> x) {
        // 新插入的节点指定为红色
        x.color = RED;

        // 如果非空非根节点且有连续的红色节点出现,需要不断地修复平衡
        while (x != root .parent.color K,V> y = rightOf(parentOf(parentOf(x)));
                if (colorOf(y) == RED) {
                    // 反色处理
                    setColor(parentOf(x), BLACK);
                    setColor(y, BLACK);
                    setColor(parentOf(parentOf(x)), RED);
                    // 处理父节点的父节点(因为该节点为红色,可能会发生向上合并的操作)
                    x = parentOf(parentOf(x));
                } else {
                    // 如下步骤对应插入3-节点的情况1
                    // 插入的是3-节点的右节点
                    if (x == rightOf(parentOf(x))) {
                        x = parentOf(x);
                        // 左旋父节点
                        rotateLeft(x);
                    }
                    // 现在转换成了插入位置为3-节点的左节点,父节点染成黑色
                    setColor(parentOf(x), BLACK);
                    // 父节点的父节点为红色
                    setColor(parentOf(parentOf(x)), RED);
                    // 右旋父节点的父节点,转换成4-节点
                    rotateRight(parentOf(parentOf(x)));
                }
            } else {
                // 插入节点后,出现连续红色的节点的位置在右侧
                Entry<K,V> y = leftOf(parentOf(parentOf(x)));
                // 插入的是4-节点,对应插入4-节点的情况2
                if (colorOf(y) == RED) {
                    // 反色处理
                    setColor(parentOf(x), BLACK);
                    setColor(y, BLACK);
                    setColor(parentOf(parentOf(x)), RED);
                    // 处理父节点的父节点(因为该节点为红色,可能会发生向上合并的操作)
                    x = parentOf(parentOf(x));
                } else {
                    // 如下步骤对应插入3-节点的情况2
                    // 插入的是3-节点的左节点
                    if (x == leftOf(parentOf(x))) {
                        x = parentOf(x);
                        // 右旋父节点
                        rotateRight(x);
                    }
                    // 转换成了插入位置为3-节点的右节点,父节点为黑色
                    setColor(parentOf(x), BLACK);
                    // 父节点的父节点为红色
                    setColor(parentOf(parentOf(x)), RED);
                    // 左旋父节点的父节点,转换成4-节点
                    rotateLeft(parentOf(parentOf(x)));
                }
            }
        }
        // 根节点始终为黑色
        root.color = BLACK;
    }

*删除节点

删除节点是红黑树中最复杂的实现,如果删除的是3-节点或4-节点(删除的是红色节点),那么移除该节点不会影响红黑树的平衡;如果删除的是2-节点,需要在删除节点后向上修复红黑树的平衡,这也是其中最复杂的部分,下面我们按照《算法导论》中讨论的情况来分析,理解删除过程一定要对红黑树的性质非常熟悉(尤其是性质5:红黑树始终都是黑色平衡的),书中将2-节点移除后分了四种情况来讨论,记红黑树再平衡开始的节点为 x (x 节点为某2-节点被移除后,拼接到该位置的节点),其兄弟节点为 w,如下:

情况1:x 的兄弟节点 w 是红色的

DELETE.jpg

上图所示的局部红黑树在节点被移除前是黑色平衡的,那么从根节点到 a 子树的黑色节点数量应为 3。当节点被移除后,根节点到 a 子树的黑色节点数量为 2(如图上所示);根节点到 c 子树路径上的黑色节点数量为 2。

经过反色和左旋处理后,原根节点被染红,现在从“新根节点”到 a 子树的黑色节点数量仍然为 2,没有新增到 3,所以还是黑色不平衡;到 c 子树路径上的黑色节点数量为 2,与操作前一致,没有影响到红黑树的性质。

情况1在反色和左旋后会变成情况2、情况3或情况4继续处理,这其实不难理解,结合红黑树的性质5,反色和左旋操作使根节点到某子树路径上的黑色节点数量并没有改变,而我们执行删除操作时已经将该路径上移除一个黑色节点了,所以“根节点”到某子树的路径上依然需要补充一个黑色节点才能满足黑色平衡,关键思想在于:从根节点到每棵子树路径上黑色节点的数量不能被改变,性质 5 在删除节点和变换前后都需要成立

情况2:x 的兄弟节点 w 是黑色的,而且 w 的两个子节点都是黑色的

DELETE2.jpg

注意图中的红黑渐变色表示该节点可能是黑色节点也可能是红色节点。在该情况下,兄弟节点的两个子节点都是黑色的,在某节点被删除前从根节点到 a 子树和 c 子树路径上的根节点数量都是 2(忽略不确定颜色的根节点)。删除节点后根节点到 a 子树路径上的黑色节点数量为 1,如果我们将 w 节点染红,那么根节点到 c 子树路径上的黑色节点数量减少为 1,那么从根节点到图示中所有子树路径上黑色节点数量都一致了,也就是说图示中的局部红黑树满足黑色平衡的条件了。此时需要将 x 指向它的父节点再重复(while)修复的过程。

情况3:x 的兄弟节点 w 是黑色的,w 的左节点是红色的,w 的右节点是黑色的

DELETE3.jpg

这种情况下,根节点到子树 e 路径上黑色节点数量为 2,经过交换 w 和 w.left 的颜色和右旋操作后并不影响红黑树的性质,这样就将情况3转换成了情况4。

情况4:x 的兄弟节点 w 是黑色的,且 w 的右节点是红色的

DELETE4.jpg

在情况4下,根节点到 a 子树路径上的黑色节点数量为 1,想达到黑色平衡需要增加到 2。通过交换 w 节点和 x.parent 节点的颜色,再将 w.right 节点染黑,之后对 x.parent 节点执行左旋操作后,使得根节点到到 a 子树路径上的黑色节点增加到了 2,并且到达其他 c, d, e, f 子树路径上的黑色节点数量不变,不破坏红黑树的性质,操作完毕后将 x 指向根节点,结束循环,因为此时红黑树满足所有性质。

现在我们已经分析完了删除2-节点后的四种不同情况,都需要通过染色和旋转操作让红黑树再次黑色平衡,下面我们看下 TreeMap 中 remove 方法的实现,需要关注其中的注释信息:

    /**
     * 删除节点
     */
    public V remove(Object key) {
        // 找到要删除的节点
        Entry<K,V> p = getEntry(key);
        if (p == null)
            return null;

        V oldValue = p.value;
        // 执行删除操作
        deleteEntry(p);
        return oldValue;
    }

接下来我们看一下删除操作的执行逻辑:

    private void deleteEntry(Entry<K,V> p) {
        modCount++;
        size--;

        // 如果该节点有左右子节点,则它是一个要被删除的内部节点
        // 那么需要找到该节点的“后继节点”,找到之后删除任务则变为了删除该后继节点
        if (p.left .right K,V> s = successor(p);
            p.key = s.key;
            p.value = s.value;
            p = s;
        }

        // 执行完上述代码块后,被删除节点要么为叶子节点,要么为只有左子树或右子树的节点
        Entry<K,V> replacement = (p.left != null ? p.left : p.right);

        // 被删除节点有左子树或右子树
        if (replacement != null) {
            // 修正节点的父节点引用关系
            replacement.parent = p.parent;
            // 被删除节点为根节点的关系
            if (p.parent == null)
                root = replacement;
            else if (p == p.parent.left)
                // 被删除的节点是左节点
                p.parent.left  = replacement;
            else
                // 被删除的节点是右节点
                p.parent.right = replacement;

            // 断开被删除节点的所有引用关系
            p.left = p.right = p.parent = null;

            // 如果被删除节点为2-节点,需要执行再平衡操作
            if (p.color == BLACK)
                fixAfterDeletion(replacement);
        } else if (p.parent == null) {
            // 红黑树只有一个节点的情况
            root = null;
        } else {
            // 删除叶子节点,如果该节点为2-节点那么需要再平衡修复
            if (p.color == BLACK)
                fixAfterDeletion(p);

            // 断开引用关系
            if (p.parent != null) {
                if (p == p.parent.left)
                    p.parent.left = null;
                else if (p == p.parent.right)
                    p.parent.right = null;
                p.parent = null;
            }
        }
    }

    // 获取 t 节点的后继节点
    static <K,V> TreeMap.Entry<K,V> successor(Entry<K,V> t) {
        if (t == null)
            return null;
        else if (t.right K,V> p = t.right;
            while (p.left != null)
                p = p.left;
            return p;
        } else {
            // ...
        }
    }

fixAfterDeletion 为删除后再平衡方法,需要大家关注其中的注释信息:

    private void fixAfterDeletion(Entry<K,V> x) {
        // 非根节点和当前节点是黑色的才需要修复平衡
        while (x colorOf(x) K,V> sib = rightOf(parentOf(x));

                // 情况 1
                if (colorOf(sib) == RED) {
                    // 反色处理:兄弟节点染黑,父节点染红
                    setColor(sib, BLACK);
                    setColor(parentOf(x), RED);
                    // 左旋父节点
                    rotateLeft(parentOf(x));
                    // 新的兄弟节点
                    sib = rightOf(parentOf(x));
                }

                // 情况 2
                if (colorOf(leftOf(sib))  == BLACK &&
                    colorOf(rightOf(sib)) == BLACK) {
                    // 将兄弟节点染红后,x指向父节点引用,继续修复平衡
                    setColor(sib, RED);
                    x = parentOf(x);
                } else {
                    // 情况 3
                    if (colorOf(rightOf(sib)) == BLACK) {
                        // 交换颜色:兄弟节点左节点染黑,兄弟节点染红
                        setColor(leftOf(sib), BLACK);
                        setColor(sib, RED);
                        // 右旋兄弟节点
                        rotateRight(sib);
                        // 新的兄弟节点
                        sib = rightOf(parentOf(x));
                    }
                    // 情况 4
                    // 交换兄弟节点和父节点的颜色
                    setColor(sib, colorOf(parentOf(x)));
                    setColor(parentOf(x), BLACK);
                    // 将兄弟节点的右节点由红染黑
                    setColor(rightOf(sib), BLACK);
                    // 左旋父节点
                    rotateLeft(parentOf(x));
                    // 满足红黑树的性质,指向根节点循环结束
                    x = root;
                }
            } else {
                // 以下是镜像操作
                Entry<K,V> sib = leftOf(parentOf(x));

                if (colorOf(sib) == RED) {
                    setColor(sib, BLACK);
                    setColor(parentOf(x), RED);
                    rotateRight(parentOf(x));
                    sib = leftOf(parentOf(x));
                }

                if (colorOf(rightOf(sib)) == BLACK &&
                    colorOf(leftOf(sib)) == BLACK) {
                    setColor(sib, RED);
                    x = parentOf(x);
                } else {
                    if (colorOf(leftOf(sib)) == BLACK) {
                        setColor(rightOf(sib), BLACK);
                        setColor(sib, RED);
                        rotateLeft(sib);
                        sib = leftOf(parentOf(x));
                    }
                    setColor(sib, colorOf(parentOf(x)));
                    setColor(parentOf(x), BLACK);
                    setColor(leftOf(sib), BLACK);
                    rotateRight(parentOf(x));
                    x = root;
                }
            }
        }

        // 情况 2,x 为红色节点时跳出循环,需要将 x 节点染黑
        // 因为红黑树中不存在连续的红色节点
        setColor(x, BLACK);
    }

红黑树执行删除方法的时间复杂度是多少呢?含有 n 个节点的红黑树的高度为 logn,不调用fixAfterDeletion 方法时,复杂度为 O(logn),在 fixAfterDeletion 中,情况 1, 3, 4 在各执行常数次的颜色改变和至多 3 次旋转后便终止,只有在情况 2 中才可能重复修复平衡,指针也至多上升 O(logn) 次,且没有任何旋转操作,所以 fixAfterDeletion 复杂度为 O(logn),最多旋转 3 次,因此红黑树删除方法的时间复杂度为 O(logn)。


巨人的肩膀

  • 《算法导论》:第 13 章 红黑树

  • 知乎 - 关于AVL树和红黑树的一点看法

  • LeetCode - 红黑树从入门到看开

  • 博客园 - 红黑树的删除

  • 作者:京东物流 王奕龙

    来源:京东云开发者社区 自猿其说 Tech 转载请注明来源

标签:parentOf,setColor,sib,插入,红黑树,物流,京东,节点
From: https://www.cnblogs.com/Jcloud/p/17947444

相关文章

  • Spring 应用合并之路(一):摸石头过河 | 京东云技术团队
    公司在推进降本增效,在尝试多种手段之后,发现应用太多,每个应用都做跨机房容灾部署,则最少需要4台机器(称为容器更合适)。那么,将相近应用做一个合并,减少维护项目,提高机器利用率就是一个可选方案。经过前后三次不同的折腾,最后探索出来一个可行方案。记录一下,分享出来,希望对有相关需求的......
  • 分布式日志追踪ID实战 | 京东物流技术团队
    本文通过介绍分布式应用下各个场景的全局日志ID透传思路,以及介绍分布式日志追踪ID简单实现原理和实战效果,从而达到通过提高日志查询排查问题的效率。背景开发排查系统问题用得最多的手段就是查看系统日志,相信不少人都值过班当过小秘吧:给下接口和出入参吧,麻烦看看日志里的有没有异常......
  • DDD落地实践-架构师眼中的餐厅 | 京东云技术团队
    本文以餐厅场景为叙事主线,以领域驱动为核心思想,结合架构设计与功能设计方法论。是从领域分析到落地的全过程案例,内容偏重于落地,因此不乏一些探讨,欢迎指正。文章较长、全程干货、耐心读完、必有收获。本文不针对餐厅的实现细节,重在探讨设计思想和方法。1、领域设计让我们抛开技术人......
  • 《中国人民银行业务领域数据安全管理办法》与个人信息保护关键技术研究 | 京东云技术
    在大数据环境下,通过个人用户网络活动产生的数据,可以清晰地分析出用户的年龄、职业、行为规律和兴趣爱好。特别是随着电子商务和移动网络的应用和普及,个人用户的地址、联系方式和银行账户信息也可以通过大数据挖掘或网络爬虫等手段获取。因此,个人信息安全管理压力增大,用户个人信息泄......
  • 实战案例!Python+SQL京东用户行为分析
    1、项目背景项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议。本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境。2、数据集介绍数据集共有五个文件,包含了'2018-02-01'至'2018-04-15'之间的用户数据,数据已进行了脱敏......
  • ZCube:在我的优惠券中的落地实践 | 京东云技术团队
    前言我的优惠券作为营销玩法的一种运营工具,在营销活跃场中起到很至关重要的作用。如何更加高效的赋能业务,助理业务发展,灵活扩展业务,是我们一直追求和思考的方向一、背景1.1现状营销中台作为券的“供应链端”,控制券的所有类型。我的优惠券作为工具,提供用户已有优惠券的展示列表,不......
  • 【稳定性】浅谈11.11大促之预案演练 | 京东物流技术团队
    一、预案演练预案演练主要解决的问题是:根据单个系统的应急预案,模拟应用系统的一种或多种故障场景,验证系统的可靠性。1.1、预案演练形式预案演练根据应急预案组织相关的应急组织机构和人员,针对事先假设的异常应急场景,通过模拟实际决策、指挥和技术操作,完成应急响应及处置的过程,从而......
  • 【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队
    一、前言性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能力底盘夯实和测试策......
  • 多家快递批量混合跟踪——跟踪物流必备神器
    先来跟大家说下我目前需要跟踪邮政、顺丰、德邦这三家快递,很朋友给建议是分开查询,一家一家到快递官网上查询,这是一种查询方法,这个虽然费时间,效率不高适合查询量少的情况,量多的情况下这样查起来太麻烦。先来给大家看下我的单号情况如下图需要的结果是:能够快速同时跟踪这三家快递单......
  • 【Python数据爬取课程设计】数据爬取—京东手机品牌信息数据爬取和数据分析与可视化
    一、选题的背景随着互联网的快速发展,大数据已经成为各行各业决策的重要依据。在电商领域,京东作为国内领先的电商平台,积累了大量的用户购买数据。这些数据中蕴含着丰富的品牌信息,对于手机品牌来说,分析这些数据可以帮助他们更好地了解市场趋势、消费者需求以及竞品情况。然而,目......