首页 > 编程语言 >数据结构与算法跳表之java实现

数据结构与算法跳表之java实现

时间:2023-04-23 10:39:03浏览次数:47  
标签:node java level int 跳表 key nexts 数据结构


跳表

一个有序链表的搜索、添加、删除的平均时间复杂度都为O(n),那么能否利用二分搜索优化有序链表,将搜索、添加、删除的平均时间复杂度降低至O(logn)呢?

链表没有像数组那样的高效随机访问(O(1)时间复杂度),所以不能像有序数组那样直接进行二分搜索优化。

那有没有其他办法让有序链表的搜索、添加、删除的平均时间复杂度降低至O(logn)?答案是使用跳表。

跳表的介绍

跳表(SkipList),又叫做跳跃表、跳跃列表,在有序链表的基础上增加了“跳跃”的功能,由William Pugh于1990年发布,设计的初衷是为了取代平衡树(比如红黑树)。

Redis中的SortedSet、LevelDB中的MemTable都用到了跳表。

与平衡二叉树的对比

  • 跳表的实现和维护会更加简单
  • 跳表的搜索、删除、添加的平均时间复杂度是O(logn)

数据结构与算法跳表之java实现_链表

跳表的数据结构

public class SkipList<K, V> {

    public static final int MAX_LEVEL = 32; // 跳表的最大层数

    public static final double P = 0.25;

    private Comparator<K> comparator;

    private int size; // 节点的个数

    private int level; // 跳表的层数

    private Node<K, V> first = new Node<>(null, null, MAX_LEVEL); // 头节点

    public SkipList() {
        this(null);
    }

    public SkipList(Comparator<K> comparator) {
        this.comparator = comparator;
    }

    public int size() {
        return size;
    }

    public boolean isEmpty() {
        return 0 == size;
    }
...
...
    private static class Node<K, V> {
        K key;
        V value;
        Node<K, V>[] nexts;
        private int level;

        public Node(K key, V value, int level) {
            this.key = key;
            this.value = value;
            this.level = level;
            this.nexts = new Node[level];
        }

        @Override
        public String toString() {
            return key + ":" + value + "_" + nexts.length;
        }
    }

}

跳表的搜索

  1. 从顶层链表的首元素开始,从左往右搜索,直至找到一个大于或等于目标的元素,或者到达当前层链表的尾部。
  2. 如果该元素等于目标元素,则表明该元素已被找到。
  3. 如果该元素大于目标元素或已到达链表的尾部,则退回到当前层的前一个元素,然后转入下一层进行搜索。

数据结构与算法跳表之java实现_跳表_02

代码实现如下:

public V get(K key) {

        keyCheck(key);

        Node<K, V> node = first;

        for (int i = level- 1; i >= 0; i--) {

            int cmp = -1;
            while (null != node.nexts[i] && (cmp = compare(node.nexts[i].key, key)) < 0) {
                node = node.nexts[i];
            }

            if(cmp == 0) {
                // key相等
                return node.nexts[i].value;
            }
        }
        return null;
    }

    private int compare(K k1, K k2) {
        if(null != comparator) {
            return comparator.compare(k1, k2);
        }
        return ((Comparable<K>) k1).compareTo(k2);
    }

    private void keyCheck(K key) {
        if (key == null) {
            throw new IllegalArgumentException("key must not be null.");
        }
    }

跳表的添加

  1. 创建一个新的节点,随机决定新添加节点的层数。
  2. 找到新节点的所有前驱节点。
  3. 将新节点插入到每一层的链表中。

数据结构与算法跳表之java实现_链表_03


代码实现如下:

/**
     * key不存在则添加节点,key存在则将value替换为新值,返回旧值
     * @param key
     * @param value
     * @return
     */
    public V put(K key, V value) {
        keyCheck(key);

        Node<K, V> node = first;

        Node<K, V>[] previousNodes = new Node[level]; // 前驱节点

        for (int i = level - 1; i >= 0; i--) {

            int cmp = -1;

            while (null != node.nexts[i] && (cmp = compare(node.nexts[i].key, key)) < 0) {
                node = node.nexts[i];
            }

            if(cmp == 0) {
                // key相等
                V oldValue = node.nexts[i].value;
                node.nexts[i].value = value;
                return oldValue;
            }

            previousNodes[i] = node;
        }

        int newLevel = randomLevel();

        Node<K, V> newNode = new Node<>(key, value, newLevel);

        // 维护前驱和后继
        for (int i = 0; i < newLevel; i++) {
            if(i < previousNodes.length) {
                newNode.nexts[i] = previousNodes[i].nexts[i];
                previousNodes[i].nexts[i] = newNode;
            } else {
                first.nexts[i] = newNode;
            }
        }
        size++;

        this.level = Integer.max(newLevel, this.level); // 更新最大层数
        return null;
    }

    /**
     * 随机返回层数
     * @return
     */
    private int randomLevel() {
        int level = 1;
        while (Math.random() < P && level < MAX_LEVEL) {
            level++;
        }
        return level;
    }

跳表的删除

  1. 找到要删除的节点和所有的前驱节点。
  2. 将要删除的节点从每一层的链表中删除。

数据结构与算法跳表之java实现_算法_04

public V remove(K key) {
        keyCheck(key);
        
        Node<K, V> node = first;

        Node<K, V>[] previousNodes = new Node[level]; // 前驱节点

        boolean isExist = false;

        for (int i = level - 1; i >= 0; i--) {

            int cmp = -1;
            while (null != node.nexts[i] && (cmp = compare(node.nexts[i].key, key)) < 0) {
                node = node.nexts[i];
            }

            if(cmp == 0) {
                isExist = true;
            }

            previousNodes[i] = node;
        }

        if(!isExist) {
            // key不存在返回null
            return null;
        }

        Node<K, V> removeNode = node.nexts[0];

        for (int i = 0; i < removeNode.level; i++) {
            previousNodes[i].nexts[i] = removeNode.nexts[i];
        }

        size--;

        // 更新跳表的层数
        int newLevel = level;
        while (--newLevel >= 0 && first.nexts[newLevel] == null) {
            level = newLevel;
        }
        return removeNode.value;
    }

跳表的层数

跳表是按层构造的,底层是一个普通的有序链表,高层相当于是低层的“快速通道”也可以称之为多层索引。

在第i层中的元素按某个固定的概率 p(通常为数据结构与算法跳表之java实现_java_05数据结构与算法跳表之java实现_跳表_06)出现在第i+1层中,产生越高的层数,概率越低

  • 元素层数恰好等于1的概率为 数据结构与算法跳表之java实现_跳表_07
  • 元素层数大于等于2的概率为 数据结构与算法跳表之java实现_java_08,而元素层数恰好等于2的概率为 数据结构与算法跳表之java实现_java_09
  • 元素层数大于等于3的概率为 数据结构与算法跳表之java实现_链表_10,而元素层数恰好等于3的概率为 数据结构与算法跳表之java实现_java_11
  • 元素层数大于等于4的概率为 数据结构与算法跳表之java实现_链表_12,而元素层数恰好等于4的概率为 数据结构与算法跳表之java实现_跳表_13
  • 一个元素的平均层数是数据结构与算法跳表之java实现_数据结构_14

数据结构与算法跳表之java实现_数据结构_15


当p=1/2时,每个元素所包含的平均指针数量是2。

当p=1/4时,每个元素所包含的平均指针数量是1.33(优于平衡二叉树的固定指针数量2)。

跳表的复杂度分析

每一层的元素数量,其中n为数据规模:

  • 第1层链表固定有数据结构与算法跳表之java实现_算法_16个元素
  • 第2层链表平均有数据结构与算法跳表之java实现_java_17个元素
  • 第3层链表平均有数据结构与算法跳表之java实现_java_18个元素
  • 第k层链表平均有数据结构与算法跳表之java实现_数据结构_19个元素

最高层的层数是数据结构与算法跳表之java实现_java_20 ,平均有个数据结构与算法跳表之java实现_跳表_21元素。

在搜索时,每一层链表的预期查找步数最多是数据结构与算法跳表之java实现_跳表_21,所以总的查找步数是数据结构与算法跳表之java实现_链表_23,时间复杂度是O(logn)。

更多精彩内容关注本人公众号:架构师升级之路

数据结构与算法跳表之java实现_链表_24


标签:node,java,level,int,跳表,key,nexts,数据结构
From: https://blog.51cto.com/u_6784072/6216449

相关文章

  • 十大排序算法快速排序之Java实现
    快速排序快速排序(QuickSort)是对冒泡排序的一种改进,采用的是分治策略(一般与递归结合使用),以减少排序过程中的比较次数。快速排序在1960年由查尔斯·安东尼·理查德·霍尔(CharlesAntonyRichardHoare,缩写为C.A.R.Hoare)提出,昵称为东尼·霍尔(TonyHoare)。算法步骤从数组中选择一个......
  • 数据结构之布隆过滤器
    布隆过滤器如果要经常判断某个元素是否存在,你会怎么做?很容易想到使用哈希表(HashSet、HashMap),将元素作为key去查找。时间复杂度为O(1),但是空间利用率不高,需要占用比较多的内存资源。如果需要编写一个网络爬虫去爬10亿个网站数据,为了避免爬到重复的网站,如何判断某个网站是否爬过?很显......
  • Java虚拟机之JVM工具监控调优
    我是攻城师(woshigcs)前几篇我们学习了,JVM里面的运行结构,GC算法,以及各种垃圾收集器的优劣点,那么本篇我们来看下如何使用一些虚拟机性能监控工具,来监控和快速处理故障,当JVM出现一些故障时,我们通常从如下的几个方面进行着手分析,包括运行日志,异常堆栈,GC日志,线程快照(threaddump/javacor......
  • Java_final 和 构造代码块
    书上的笔记转移:【REVIEW】:final除了不被重写、不被修改、不被继承、值不可变等等。。。还有以下几个特性: 1.如果成员变量的final修饰未进行赋值,那么是可以在构造方法和构造代码块进行赋值的,如果赋值成功,那么后面都不可能在进行赋值了。 ---2. 静态代码块我知道,就是只执......
  • Java泛型
    Java泛型概念Java泛型是一种在编译时进行类型检查和类型推断的机制,它可以让我们编写更加通用、可重用的代码,提高了代码的可读性和可维护性,同时保证了类型安全。Java泛型的核心思想是类型参数化,即在类、接口或方法的定义中使用类型参数来代替具体的类型,这些类型参数在实例化时被具体......
  • 数据结构中的集合
    原文点此跳转什么是集合?集合是一种无序且唯一的数据结构,其中的唯一是指集合中的元素。在ES6中新增了一种数据结构Set就是集合。实现功能new()实例化一个集合add()添加元素delete()删除元素has()判断是否存在元素size()获取集合大小应用场景去重判断某元素是否在集合中求两......
  • Java 编程问题:四、类型推断
    本章包括21个涉及JEP286或Java局部变量类型推断(LVTI)的问题,也称为var类型。这些问题经过精心设计,以揭示最佳实践和使用var时所涉及的常见错误。到本章结束时,您将了解到将var推向生产所需的所有知识。问题使用以下问题来测试您的类型推断编程能力。我强烈建议您在使用解决方案......
  • java 优雅的记录程序运行时长
    importcn.hutool.core.date.StopWatch;importcn.hutool.core.thread.ThreadUtil;StopWatchtest=newStopWatch("test");test.start("task1");ThreadUtil.sleep(1000);test.stop();test.start("task2");ThreadUtil.sleep(3000);......
  • Java 编程问题:一、字符串、数字和数学
    本章包括39个涉及字符串、数字和数学运算的问题。我们将从研究字符串的一系列经典问题开始,例如计算重复项、反转字符串和删除空格。然后,我们将研究专门用于数字和数学运算的问题,例如两个大数求和和和运算溢出,比较两个无符号数,以及计算除法和模的下限。每个问题都要经过几个解决方......
  • JavaTPoint 数据科学和人工智能中文教程【翻译完成】
    在线阅读在线阅读(Gitee)ApacheCN学习资源目录人工智能DIP教程SAS教程Tableau教程r教程TensorFlow教程NLP教程MATLAB教程强化学习教程Talend教程ANN教程数学计算机教程计算机图形学数据挖掘机器学习NumPy教程PyTorch教程PythonSciPy教程Pandas教程OpenCV教程Matplotlib......