首页 > 其他分享 >集合

集合

时间:2022-09-26 11:25:41浏览次数:38  
标签:数组 链表 线程 HashTable 哈希 集合 HashMap

1. 常见数据结构

  • 数组

最常见的数据结构,长度固定,无法扩容,只能存储一种类型数据,新增、删除慢,因为要移动其他数据。

先进后出的数据结构,只能在一端操作的特殊线性表,先入栈的数据后执行,后入栈的数据先执行。

  • 队列

先进先出的数据结构,只能在一端进行插入,另一端进行删除的特殊线性表,先进入的数据会被先读取。

  • 链表

链表是一种物理存储单元上非连续、非顺序的存储结构,其物理结构不能只表示数据元素的逻辑顺序,是由链表中的指针链接次序来实现的;链表是由一系列结点组成,结点可以在运行时动态生成,根据指针的指向,链表能生成不同的结构,如单链表、双向链表、循环列表等。

是计算机中非常重要的一种数据结构,能描述家谱、单位组织架构等等;有二叉树、平衡树、红黑树、B 树、B+ 树。

  • 散列

也称哈希,根据键和值直接访问的数据结构。

通常可以被看作是一棵完全二叉树的数组对象。

由一顶点和一组能将两个顶点相连的边组成。

2. 集合和数组的区别

  • 数组长度固定;集合长度可变。
  • 数组只能存储一种类型数据;集合能存储对象。

3. List、Map、Set区别

List 和 Set 是存储单列数据集合;Map 是存储键值这样双列数据集合。

  • List 有序,值可重复
  • Map 无序,键不允许重复,值可以重复
  • Set 无序,不可重复,元素位置由元素的 hashcode 决定

4. 集合实现类

Collection 接口

  • List
    • ArrayList
    • 底层结构是数组,查询块,增删慢,线程不安全,效率高。 
    • Vector(已舍弃)
    • 底层结构是数组,查询快,增删慢,线程安全,效率低。 
    • LinkedList
    •  底层结构是链表,查询慢,增删块,线程不安全,效率高。
  • Set
    • HashSet
    • 底层数据结构是哈希表,无序,不可重复,通过 hashCode() 和 equals() 保证元素唯一 。
    • LinkedHashSet
    • 底层数据结构是链表和哈希表,有序,不可重复,通过链表实现有序,哈希表实现唯一。 
    • TreeSet
    • 底层数据结构是红黑树,有序,不可重复,通过自然排序、比较器排序,再根据比较返回值是否为 0 来实现唯一。 
  • Map
    • HashMap
    • 基于 hash 表的 Map 接口实现,键和值允许为 null ,线程不安全,效率高。 
    • HashTable
    • 键和值不允许为  null, 线程安全,效率低。
    • LinkedHashMap
    • 是 HashMap 一个子类,有序,线程安全,效率低。 
    • TreeMap
    •  默认按键值升序排序,线程不安全,效率高。

5. HashMap 底层原理

JDK 1.8 之前由数组 + 链表组成,之后由数组 + 链表 + 红黑树组成,提高了查询效率,当链表长度超过 8 自动转为红黑树,小于 6 自动转为链表。

当 new HashMap() 底层没有创建数组,首次调用 put() 方法时,底层会创建长度为 16 的数组,JDK 8 底层数组是 Node[] 而非 Entry[],用数组容量大小乘以加载因子得到一个值,一旦数组元素个数超过该值就会调用 rehash() 将数组容量扩大 2 倍,称为扩容;扩容时会生成一个新数组,需要将原来数组元素重新计算 hash 值放入新数组中,非常消耗性能。

HashMap 默认长度为 16,加载因子默认 0.75,当长度超过 12 自动扩容。

Java 中任何对象都有哈希值,哈希算法就是通过哈希值与自己行向右位移 16 的异或运算,是为了计算出来的值足够随机,足够分散,产生的数组下标足够随机。

put 原理

首先将键和值封装到 Node 对象中,调用键的 hashCode() 方法获取哈希值,并通过哈希算法转化成数组下标,下标位置如果没有元素,就把 Node 对象添加到这个位置,如果存在元素,就用键与节点上键进行 equals(),如果返回 false 就将 Node 对象添加到链表末尾,如果返回  ture 就将此节点值覆盖。

get 原理

首先调用键的 hashCode() 方法获取哈希值,通过哈希算法转换成数组下标,下标位置如果没有元素直接返回 null,如果存在元素,就用键与节点上的键进行 equals(),如果返回 false 直接返回 null,如果返回 true 就将此节点值取出返回。

6. HashMap 与 HashTable 区别

  • HashMap 线程不安全;HashTable 线程安全。
  • HashMap 允许键值为 null;HashTable 不允许。
  • HashMap 效率比 HashTable 高。
  • HashTable 是同步的。

HashTable 是遗留类,内部实现很多没优化和冗余,即使在多线程环境下,有同步的 ConcurrentHashMap 替代。

7. HashTable 与 ConcurrentHashMap 区别

HashTable 使用 Synchronized 关键字修饰;ConcurrentHashMap 在 JDK 1.7 使用分段锁保证线程安全,JDK 1.8 取消了 Segment 分段锁,使用 CAS 和 Synchronized 保证并发线程安全,数据结构为数组 + 链表 + 红黑树。

Synchronized 只锁定当前链表或红黑树首节点,只要不 hash 冲突,就不会产生并发,效率提升 N 倍。

标签:数组,链表,线程,HashTable,哈希,集合,HashMap
From: https://www.cnblogs.com/apachewang/p/16730201.html

相关文章

  • 使用Stream流的方式.遍历集合.对集合中的数据进行过滤
    Stream的更优写法/***使用Stream流的方式,遍历集合,对集合中的数据进行过滤*Stream流是JDK1.8之后出现的*关注的是做什么,而不是怎么做*/publiccl......
  • 使用传统的方式,遍历集合,对集合中的数据进行过滤
    Java8的Lambda让我们可以更加专注于做什么(What),而不是怎么做(How),这点此前已经结合内部类进行了对比说明。现在,我们仔细体会一下上例代码,可以发现:=for循环的语法就是“怎么......
  • Python列表、元组、字典、集合区别
    一、列表 1.任意对象的有序集合 列表是一组任意类型的值,按照一定顺序组合而成的  2.通过偏移读取 组成列表的值叫做元素(Elements)。每一个元素被标识一个......
  • 练习-集合元素处理传统方式和Stream方式
    练习-集合元素处理(传统方式)练习:集合元素处理(传统方式)现在有两个ArrayList集合存储队伍当中的多个成员姓名,要求使用传统的for循环(或增强for循环)依次进行以下......
  • 集合ArrayList类
    什么是集合集合是长度可变的容器集合与数组的对比集合长度可变,自动伸缩,可长可短集合只能存引用数据类型,非要存基本数据类型,就要将其变成包装类ArrayListArrayList......
  • 集合.Set子接口
    Set子接口特点:无序、无下标、元素不可重复方法:全部继承自Collection中的方法Set实现类HashSet【重点】:基于HashCode实现元素不重复当存入元素的哈希码相同时,会调......
  • NLP-报错集合
    中文语料库预处理时: 官网地址:https://radimrehurek.com/gensim/models/word2vec.html#gensim.models.word2vec.Text8Corpus 报错:AttributeError:Theindex2wordatt......
  • 编程规约-集合处理
    编程规约-集合处理泛型集合泛型定义集合泛型定义时,在JDK7及以上,使用diamond语法或全省略。说明:菱形泛型,即diamond,直接使用<>来指代前边已经指定的类型。正例://......
  • JavaScript HTML DOM 集合(Collection)
    Collection对象:getElementsByTagName()方法返回htmlCollection对象。此对象包含html元素的一个数组 length属性:元素的数量。此属性常用于遍历集合中的元素使用......
  • 使用传统的方式,遍历集合,对集合中的数据进行过滤和使用Stream流的方式,遍历集合,对集合中
    使用传统的方式,遍历集合,对集合中的数据进行过滤使用Stream流的方式,遍历集合,对集合中的数据进行过滤使用Stream流的方式,遍历集合,对集合中的数据进行过滤Stream流是JDK1.8......