首页 > 其他分享 >数据结构之Map与Set(上)

数据结构之Map与Set(上)

时间:2024-08-09 08:55:26浏览次数:15  
标签:Map Set cur 元素 哈希 数据结构 key null

找往期文章包括但不限于本期文章中不懂的知识点:

个人主页:我要学编程(ಥ_ಥ)-CSDN博客

所属专栏:数据结构(Java版) 

目录

二叉搜索树

Map和Set的介绍与使用 

Map的常用方法及其示例

Set的常用方法及其示例

哈希表 

冲突-概念

冲突-避免-哈希函数设计

冲突-避免-负载因子调节


在正式学习Map和Set之前,我们先来学习一下:二叉搜索树。

二叉搜索树

二叉搜索树又称为二叉排序树,它要么是一棵空树,要么是具有以下性质的二叉树:
若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
它的左右子树也分别为二叉搜索树,也有该性质。如下图所示:

下面我们就来模拟实现二叉搜索树。

准备:

    // 二叉搜索树的节点
    static class TreeNode {
        public int val;
        public TreeNode left;
        public TreeNode right;
        public TreeNode(int val) {
            this.val = val;
        }
    }
    // 根节点
    public TreeNode root;

插入元素:

思路:如果根节点为空,则插入的元素为根结点。如果根结点不为空,就要遍历二叉搜索树找到可以合适存放该元素的节点。在找的过程中,要注意:当前根结点的值小于要插入的元素,就遍历右子树继续找, 当前根结点的值大于要插入的元素,就遍历左子树继续找,直至根结点为空,开始插入操作。(二叉搜索树中没有相同的元素)

代码实现:

    // 插入(只有类似头插和尾插两种情况)
    public boolean insert(int key) {
        if (root == null) {
            root = new TreeNode(key);
            return true;
        }
        TreeNode prev = null; // 记录要插入的元素的根结点
        TreeNode cur = root;
        while (cur != null) {
            prev = cur;
            if (cur.val < key) {
                cur = cur.right;
            } else if (cur.val > key) {
                cur = cur.left;
            } else {
                // 不能插入相同的元素
                return false;
            }
        }
        if (prev.val > key) {
            prev.left = new TreeNode(key);
        } else {
            prev.right = new TreeNode(key);
        }
        return true;
    }

 查找元素:

思路:和插入的思路大体相同。

代码实现:

    // 查找
    public TreeNode search(int key) {
        if (root == null) {
            return null;
        }
        TreeNode cur = root;
        while (cur != null) {
            if (cur.val < key) {
                cur = cur.right;
            } else if (cur.val > key) {
                cur = cur.left;
            } else {
                return cur;
            }
        }
        return null;
    }

删除元素:

思路:要删除的元素有四种情况:

1、其左右子树都为空;

2、其左右子树都不为空;

3、其左子树为空,右子树不为空;

4、其左子树不为空,右子树为空。

我们只需要分类讨论进行删除操作即可。首先,还是得找到要删除的节点;其次就是开始分情况讨论处理要删除的节点:如果其左右子树都为空,那么就只需要其前一个节点指向它的指针置为null即可。如果其左右子树都不为空,那么就只能找到合适的节点来代替该节点,实现伪删除。这个合适的节点就是左子树最大值(左子树最右边的节点),以及右子树的最小值(右子树最左边的节点)任选其一即可。剩下的两种情况就只需要把要删除的节点的前一个节点的指向它的指针指向这个节点的下一个节点即可。

代码实现:

    // 删除
    public boolean remove(int key) {
        if (root == null) {
            // 抛异常
            throw new BinarySearchTreeIsEmptyException("搜索树为空异常");
        }
        // 开始寻找要删除的节点
        TreeNode cur = root;
        TreeNode prev = null;
        while (cur != null) {
            if (cur.val < key) {
                prev = cur;
                cur = cur.right;
            } else if (cur.val > key) {
                prev = cur;
                cur = cur.left;
            } else {
                // 找到了,开始删除
                removeOfKey(prev, cur);
                return true;
            }
        }
        // 走到这里就说明没有找到要删除的节点
        return false;
    }

    private void removeOfKey(TreeNode prev, TreeNode cur) {
        // 删除的节点有四种情况

        // 1、要删除的节点左右子树都为空
        if (cur.left == null && cur.right == null) {
            // 还得判断这个节点是在树的哪边
            if (cur == root) {
                root = null;
                return;
            } else if (prev.left == cur){
                prev.left = null;
                return;
            } else {
                prev.right = null;
                return;
            }
        }
        // 2、要删除的节点左右子树都不为空
        // 根结点和普通的节点都是一个情况,因此不用分类讨论
        if (cur.left != null && cur.right != null) {
            // 1、要么从左子树中找到最大值(左子树中最右边)代替根节点
            // 2、要么从右子树中找到最小值(右子树中最左边)代替根节点
            TreeNode tmp = root.left;
            while (tmp.right != null) {
                prev = tmp;
                tmp = tmp.right;
            }
            // 下面就是一个伪删除
            cur.val = tmp.val;
            prev.right = null;
            return;
            /*// 或者下面这种方式
            TreeNode tmp = root.right;
            while (tmp.left != null) {
                prev = tmp;
                tmp = tmp.left;
            }
            // 下面就是一个伪删除
            root.val = tmp.val;
            prev.left = null;
            return;*/
        }
        // 3、要删除的节点左子树为空,右子树不为空
        if (cur.left == null && cur.right != null) {
            if (cur == root) {
                root = root.right;
            } else if (prev.left == cur){
                prev.left = cur.right;
            } else {
                prev.right = cur.right;
            }
        }
        // 4、要删除的节点左子树不为空,右子树为空
        if (cur.left != null && cur.right == null) {
            if (cur == root) {
                root = root.left;
            } else if (prev.left == cur){
                prev.left = cur.left;
            } else {
                prev.right = cur.left;
            }
        }
    }

异常部分的代码:

public class BinarySearchTreeIsEmptyException extends RuntimeException {
    public BinarySearchTreeIsEmptyException(String msg) {
        super(msg);
    }

    public BinarySearchTreeIsEmptyException() {
        super();
    }
}

注意:插入和删除操作都必须先查找,查找效率代表了二叉搜索树中各个操作的性能。

对有n个结点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是结点在二叉搜索树的深度的函数,即结点越深,则比较次数越多。

但对于同一个关键码集合,如果各关键码插入的次序不同,可能得到不同结构的二叉搜索树:可能是一棵完全二叉树,也有可能是一棵单分支的树。 如下图所示:

而二叉搜索树就是Map和Set的不同子类的底层实现方式。

Map和Set的介绍与使用 

我们在学习数据结构之前的搜索大概就是这两种:

1、直接搜索:遍历这组数据看看有没有我们需要的数据;

2、二分查找:每次对半查找,虽然效率高,但是数据必须是有序的情况才可以。

难道除了上面两种查找,就没有其它的方法了吗?我们今天学习的Map和Set就是一种全新的搜索方法。

一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:

1、纯key 模型,比如:
有一个英文词典,快速查找一个单词是否在词典中;
快速查找某个名字在不在通讯录中;
2、Key-Value 模型,比如:
统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>;
梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号;
而Map中存储的就是key-value的键值对,Set中只存储了Key。

通过上图可知:Map是一个单独的接口,而Set是继承了Collection的接口,那么Set也就有了一些add、remove、contains这种Collection之中的方法了。 

Map的常用方法及其示例

常用方法的介绍
方法解释
V get(Object key)返回 key 对应的 value 值
V getOrDefault(Object key, V defaultValue)返回 key 对应的 value,key 不存在,返回默认值
V put(K key, V value)设置 key 对应的 value
V remove(Object key)删除 key 对应的映射关系(key 和 value 都被删除了)
Set<K> keySet()返回所有 key 的不重复集合(也就是说这个集合中不存在重复的元素)
Collection<V> values()返回所有 value 的可重复集合
 Set<Map.Entry<K, V>> entrySet()返回所有的 key-value 映射关系
boolean containsKey(Object key)判断是否包含 key
boolean containsValue(Object value)判断是否包含value

注意:

1、Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap;
2、Map中存放键值对的Key是唯一的,value是可以重复的;
3、在TreeMap中插入键值对时,key不能为空,否则就会抛NulliPointerException异常,value可以为空。但是HashMap的key和value都可以为空。因为 TreeMap底层就是一棵二叉搜索树(也叫作红黑树),既然是一棵二叉搜索树,那么存放的元素肯定是要可以比较的(自定义类要么实现比较器,要么继承Comparable接口实现compareTo方法)
4、Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。
5、Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。
6、Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入(这其实不能叫做修改了)。

TreeMap的使用

public class Test {
    public static void main(String[] args) {
        Map<String, Integer> map = new TreeMap<>();

        map.put("a", 1);
        map.put("b", 2);
        map.put("c", 3);
        map.put("d", 4);
        map.put("f", 5);

        // 注意:如果没找到对应的key就会返回null
        System.out.println(map.get("a")); // 输出1
        System.out.println(map.get("e")); // 输出null

        System.out.println(map.getOrDefault("a", 100)); // 输出1
        System.out.println(map.getOrDefault("e", 100)); // 输出100

        // 返回key对应的Set集合(key-String)
        Set<String> set = map.keySet();

        // 返回value对应的Collection集合(value-Integer)
        Collection<Integer> collection = map.values();

        // 把Map中的元素全部存放到Set中
        Set<Map.Entry<String, Integer>> mapSet = map.entrySet();

        // 判断Map中是否有对应的key
        System.out.println(map.containsKey("a")); // 输出true
        System.out.println(map.containsKey("e")); // 输出false

        // 判断Map中是否有对应的value
        System.out.println(map.containsValue(1)); // 输出true
        System.out.println(map.containsValue(6)); // 输出false
    }
}

注意:如果Map中已经存在了key,再去put的话,就只会更改其value值。 

HashMap的使用与TreeMap的使用是类似的。

有以下几点要注意:

1、HashMap在存放元素时,不需要这个元素是否可以比较。因为HashMap的底层不是一个二叉搜索树。

Set的常用方法及其示例

常用方法的介绍
方法解释
boolean add(E e)添加元素,但重复元素不会被添加成功(天然的去重功能)
void clear()清空集合
boolean contains(Object o)判断 o 是否在集合中
Iterator<E> iterator返回迭代器(继承了 Iterator 接口)
boolean remove(Object o)删除集合中的 o
int size()返回set中元素的个数
boolean isEmpty()检测set是否为空,空返回true,否则返回false
Object[] toArray()将set中的元素转换为数组返回
boolean containsAll(Collection<?> c)集合c中的元素是否在set中全部存在,是返回true,否则返回false
boolean addAll(Collection<? extends E> c)将集合c中的元素添加到set中,可以达到去重的效果

 注意:
1、Set中只存储了key,并且要求key一定要唯一;
2、TreeSet的底层是使用Map来实现的,其使用key与Object作为一个默认对象作为键值对插入到Map中的;

3、Set最大的功能就是对集合中的元素进行去重;
4、实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录元素的插入次序;
5、Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入;
7. TreeSet中不能插入 null 的key(一定要是可比较的对象),HashSet可以。

TreeSet的使用

public class Test {
    public static void main(String[] args) {
        Set<String> set =new TreeSet<>();

        set.add("abc");
        set.add("def");
        set.add("ghi");

        System.out.println(set.contains("abc")); // 输出true
        System.out.println(set.contains("iii")); // 输出false

        // 获取迭代器
        Iterator<String> stringIterator = set.iterator();
        // 利用迭代器来遍历Set
        while (stringIterator.hasNext()) {
            System.out.print(stringIterator.next()+" ");
        }
        System.out.println();

        // 向下转型会有风险,而且也不一定会强转成功(这里就会失败)
        //String[] strs = (String[]) set.toArray();
        Object[] str =  set.toArray();

        for (int i = 0; i < set.size(); i++) {
            System.out.print(str[i]+" ");
        }
    }
}

哈希表 

顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。

顺序查找时间复杂度为O(N),平衡树中为树的高度,即O(log2 N),搜索的效率取决于搜索过程中
元素的比较次数。
理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。如果构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素(就和我们在数组中查找元素一样,利用下标O(1)查找)。

当向该结构中: 

插入元素:
根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放。
搜索元素:
对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功。
该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(HashTable)(或者称散列表)
例如:数据集合{1,7,6,4,5,9};
哈希函数设置为:hash(key)= key % capacity;capacity为存储元素底层空间总的大小。

用该方法进行搜索不必进行多次关键码的比较,因此搜索的速度比较快。

但是又会出现另外一个问题:如果往集合中插入44,那么就会出现冲突的现象。

冲突-概念

对于两个数据元素的关键字 i 和 j (i != j),有 i != j ,但有:Hash(i) == Hash(j),即:不同关键字通过相同的哈希函数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞。 把具有不同关键码而具有相同哈希地址的数据元素称为“同义词” 。

首先,我们需要明确一点,由于我们哈希表底层数组的容量往往是小于实际要存储的关键字的数量的,这就导致一个问题,冲突的发生是必然的,但我们能做的应该是尽量的降低冲突率。

冲突-避免-哈希函数设计

引起哈希冲突的一个原因可能是:哈希函数设计不够合理。哈希函数设计原则:
1、哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0到m-1之间;
2、哈希函数计算出来的地址能均匀分布在整个空间中;
3、哈希函数应该比较简单。
常见哈希函数
1. 直接定制法
取关键字的某个线性函数为散列地址:Hash(Key)=A*Key+B。

优点:简单、均匀;缺点:需要事先知道关键字的分布情况

使用场景:适合查找比较小且连续的情况。
2.除留余数法
设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数p作为除数,按照哈希函数:Hash(key)= key% p(p<=m),将关键码转换成哈希地址。

冲突-避免-负载因子调节

由上面两张图片可知:

1、负载因子随着插入的元素越来越多,其值也是越来越大,并且冲突率也是越来越高;

2、降低负载因子,就可以有效的降低冲突率,而在插入元素个数不变的情况下,只能增大散列表的长度,也就是扩容。

总结:哈希表是一种查找元素非常高的数据结构,但是也有缺点,会产生哈希冲突,虽然可以通过设计哈希函数和调节负载因子来避免发生冲突,但是还是不可避免的,因此当冲突发生时,我们就要想着来解决了,下一篇博客,我们再来一起学习吧!

好啦!本期 数据结构之Map与Set(上)的学习之旅就到此结束啦!我们下一期再一起学习吧!

标签:Map,Set,cur,元素,哈希,数据结构,key,null
From: https://blog.csdn.net/2301_80854132/article/details/140932739

相关文章

  • 哪种编程语言更适合学习数据结构和算法:C++、Java 还是 Python?
    作为一名工程专业的学生,​​我正在尝试决定使用哪种编程语言来学习数据结构和算法(DSA)。我正在考虑C++,它提供高性能和强大的标准模板库,但对于初学者来说可能很复杂。Java具有强大的语法和内置集合,使DSA概念更容易掌握,尽管我不确定它与C++相比的性能。Python以其简单性和......
  • 【数据结构】一篇文章带你深入了解树
    大家好,今天我们学习数据结构中的树,基本会讲完树的主要内容,主要内容包括树的基本概念,一些表示方法,重点学习二叉树,然后会一步一步自己模拟实现树,希望大家多多支持。一,树的基本概念1.1概念树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做......
  • c# svg转Bitmap Bitmap转ImageSource
    需要安装nuget包【svg】publicclassSVGHelper{publicstaticImageSourceConvertSvgToDrawingImage(stringpath){varsvgContent=File.ReadAllText(path);//使用SvgDocument解析SVG内容SvgDocumentsvgDoc......
  • 数据结构-树与二叉树
    王道章节内容知识框架考纲内容引入因为要用到查找的部分知识,故简要引入。要从数据中找到一个值,有静态查找(未发生插入和删除)和动态查找(发生插入和删除)两种方式。而静态查找有两种方法,一种是逐个按顺序查找,一种是高中就有介绍的二分查找。自然而然,我们可以类似地有这......
  • bitset 学习笔记
    bitset有点厉害,必须要学了。介绍bitset可以看成是一个每个位置都是\(0\)或\(1\)的bool数组。与bool数组相比,它的空间复杂度是其\(\frac{1}{32}\),时间复杂度也是\(\frac{1}{32}\),还支持位运算,所以不论是用处还是效率基本薄纱了bool数组。可以作为卡常、压位操作、......
  • 【探索数据结构与算法】——深入了解双向链表(图文详解)
    目录一、双向链表的基本概念 ​​​二、双向链表的结构三、双向链表的基本操作实现方法 1.双向链表的初始化2.双向链表的头插3.双向链表的尾插6.查找节点7.在指定位置之前插入节点8.删除指定位置节点9.打印链表数据  10.双向链表销毁四、完整代码实现 LIst.h......
  • 在K8S中,DaemonSet类型的资源特性有哪些?
    在Kubernetes(K8S)中,DaemonSet是一种控制器资源对象,它具有一系列独特的资源特性,这些特性使得DaemonSet特别适用于在集群的每个节点上运行守护进程或服务。以下是DaemonSet类型资源特性的详细阐述:1.确保每个节点上运行Pod副本节点级部署:DaemonSet确保集群中的每个节点(或满足特定......
  • 【数据结构】汇总五、树
    一、树Tree【注意】本章是树的知识点汇总,全文6万多字,含有大量代码和图片,建议点赞收藏(doge.png)!!文章目录一、树Tree1.逻辑结构1.1定义1.2术语1.2.1结点之间的关系描述1)亲戚描述2)路径和路径长度1.2.2结点&树的属性描述1)层次2)高度3)==度==1.2.3有序树&无序树1.2.4森林1.......
  • 数据结构 分块 & 莫队
    分块一种优化暴力的思想。通常是将原数据划分成适当块(一般为\(\sqrt{n}\)),对每块数据进行预处理,进而达到比暴力更优的时间复杂度。划分确定块长后,一般需要开两个数组存储每一块的右边界与原数据所属块序号,更加方便后续操作。intsq=sqrt(n);for(inti=1;i<=sq;i++)ed[i]=n/......
  • Open3d Create_from_cloud_alpha_shape 错误:无效的 unordered_map
    我在open3d中的create_from_point_cloud_alpha_shape方面遇到问题。这是我的代码。importopen3daso3dimportnumpyasnpmesh=o3d.io.read_triangle_mesh('Bunny.stl')print(mesh)pcd=mesh.sample_points_poisson_disk(750)alpha=0.3mesh=o3d.geome......