首页 > 编程语言 >Java SE 宋红康 days04-高级篇-Java集合

Java SE 宋红康 days04-高级篇-Java集合

时间:2022-10-02 15:24:25浏览次数:54  
标签:Java 元素 List equals days04 数组 集合 添加 宋红康

1. Java集合可以分为两个体系

  Collection:单列数据,定义了存取一组对象的方法的集合;

    List:元素有序,可重复的集合;(ArrayList、LinkedList、Vector)

    Set:元素无序,不可重复的集合;(HashSet、LinkedHashSet、TreeSet)

  Map:双列数据,保存具有映射关系“键值对”的集合;(HashMap、LinkedHashMap、TreeMap、Hashtable、Properties)

   

2. Collection 接口中的 API

  contains:在调用时,会判断调用obj对象所在类的 equals 方法;

  向 Collection 接口的实现类的对象中添加数据 obj,要求 obj 所在类要重写 equals();

  常用方法:

    retain(Collection coll):交集,获取当前集合和coll集合的交集,并返回给当前集合;

    equals(Object obj):要想返回true,需要当前集合和形参集合的元素顺序都相同;

    toArray():集合 ---> 数组

    拓展:Array.asList(new String[] { ... }) 数组 ----> 集合,调用 Arrays 类的静态方法 asList();

     注:使用的时候,int类型要注意 Arrays.asList(new int[ ]{123, 456}) 把里面认为是一个整体,只有一个元素

                    Arrays.asList(new Integer[ ]{123, 456}) 

3. Iterator():返回 Iterator接口的实例,用于遍历集合元素,放在 IteratorTest.java中测试。(本身只是一个迭代器,不是容器)

  在调用it.next()方法之前必须要调用it.hasNext()进行检测。

  若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常。

  

  易错点一:造成报错,且指向的数据超出范围;

    

  易错点二:集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。

    造成死循环;

 

 

4. Iterator.remove():如果还未调用next()或在上一次调用 next 方法之后已经调用了 remove 方法,再调用remove都会报IllegalStateException。

5. List 接口

  5.1 ArrayList、LinkedList、Vector三者异同

    ArrayList:List接口的主要实现类(线程不安全,效率高),底层使用 object[ ] elementData 存储;

    LinkedList:对于频繁插入、删除操作,效率比ArrayList高;底层使用双向链表存储;

    Vector:List接口的古老实现类(线程安全,效率低);

    同:三个类都是实现了 List 接口,都是存储有序、可重复的数据;

  5.2 ArrayList 源码分析

    5.2.1 jdk7下(类似单例饿汉式)

      a. ArrayList list = new ArrayList();//底层创建了长度是10的 Object[ ]数组elementData;

      b. list.add(123);//elementData[0] = new Integer(123);

      ...

      c. list.add(11);//如果此次添加导致底层 elementData数组容量不够,则扩容

      默认情况下,扩容为原来容量的 1.5 倍,同时需要把原有数组中的数据复制到新的数组中;

      结论:建议使用有参构造器:ArrayList list = new ArrayList(int capacity);

    5.2.2 jdk8下(类似单例懒汉式,延迟数组创建,节省内存)

      a. ArrayList list = new ArrayList();//底层 Object[ ] elementData 初始化为 { },并没有创建数组长度;

      b. list.add(123);//第一次调用add时,底层才创建了长度为10的数组,并把123添加到elementData ;

      ...

      后序的添加和扩容操作与jdk7无异

    5.2.3 面试点

      list.remove()删的是索引,还是对象?

      remove 首先会自动对数据装箱,如果是值,则不装箱,此时是按 索引 删;如果是 Obj 对象,则删的是数据;

  5.3 LinkedList 源码分析

    a. LinkedList list = new LinkedList ();//内部声明了Node类型的first和last属性,默认值为null

    b. list.add(123);//将123封装到node中,创建了Node对象

  5.4. Vector 源码分析

    jdk7和jdk8通过 Vector() 构造器创建对象时,底层创建了长度是10的 Object[ ]数组elementData;

    默认情况下,扩容为原来容量的 2 倍;

6. Set 接口

  6.1 HashSet、LinkedHashSet、TreeSet 异同

    HashSet:作为 Set 接口的主要实现类,线程不安全,可以存储null;

    LinkedHashSet:作为 HashSet 的子类,遍历内部数据时,可以按照添加顺序遍历;对于频繁遍历操作,其效率高于HashSet;

    TreeSet:可以按照添加对象的指定属性,进行排序;

  6.2 存储无序的,不可重复的数据(以 HashSet 说明)

    无序性:不等于随机性,意思是存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的;

    不可重复性:保证添加的元素按照 equals() 判断时,不能返回 true;即相同的元素只能添加一个;

  6.3 添加元素的过程(以 HashSet 说明)

    a. 首先调用元素 a 所在类的 hashCode() 方法,计算元素 a 的哈希值;

    b. 哈希值通过某种算法计算出在 HashSet 底层数组中存放位置(索引位置),判断该位置是否有元素

    c. 如果没有元素,则元素a添加成功(情况1

     如果有其他元素b(或以链表方式存在多个元素),则比较元素a和元素b的hash值:

       如果hash值不同,元素a添加成功(情况2

       如果hash值相同,需调用元素a所在类的equals()方法:

         equals 返回 true,添加失败,否则成功(情况3

    对于添加成功的情况2和3:元素a与已存在指定索引位置上数据以链表方式存储;

    jdk7中,元素a放在数组中指向原来元素;jdk8中,原来的元素放在数组中指向元素a;

  6.4 为什么工具自动重写的 equals 和 hashCode 方法包含31这个数字?

    a. 选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会提高。(减少冲突)

    b. 31只占用5bits,相乘造成数据溢出的概率较小。

    c. 31可以 由i*31== (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。(提高算法效率)

    d. 31是一个素数,如果我用一个数字来乘以这个素数,那么最终出来的结果只能被素数本身和被乘数还有1来整除!(减少冲突)

  注:向 Set 中添加数据,其所在的类一定要重写 hashCode 和 equals 方法;

    对应的类一定要重写equals() 和hashCode(Objectobj) 方法,以实现对象相等规则 。即: “相等的对象必须具有相等的散列码

  6.5 TreeSet

    1. 向 TreeSet 中添加的数组,要求是相同类的对象;

    2. 两种排序方式:自然排序(实现 Comparable 接口)和 定制排序;

    3. 自然排序中,比较两个对象是否相同的标准为:compareTo() 返回 0,不再是 equals();

    4. 定制排序中,比较两个对象是否相同的标准为:compare() 返回 0,不再是 equals();

7. Map 接口(双列数据,保存具有映射关系“键值对”的集合)

  7.1 HashMap、LinkedHashMap、TreeMap、Hashtable、Properties

    HashMap:作为 Map 的主要实现类,线程不安全,效率高,存储null的key和value;

    LinkedHashMap:保证在遍历Map元素时,可以按照添加的顺序实现遍历;(存在前后指针,频繁遍历效率高于HashMap)

    TreeMap:保证按照添加的键值对顺序进行排序,实现排序遍历;此时考虑自然排序和定制排序

    Hashtable:古老的实现类,线程安全,效率低,不能存储null的key-value

    Properties:常用来处理配置文件;

  7.2 Map结构的理解

    a. Map 中的 key:无序的,不可重复的,使用 Set 存储所有的 key --> key所在类药重写 equals 和 hashCode;

    b. Map 中的 value:无序的,可重复的,使用 Collection 存储所有的 value--> value所在类药重写 equals;

    c. 一个键值对组成一个 Entry 对象,Map 中的 Entry 是无序的,不可重复的,使用 Set 存储所有的 entry;

  7.3 HashMap 的底层实现原理(实现过程同6.3

    

    a. 涉及到扩容过程,默认扩容方式:扩容为原来容量的2倍,并把原有数据复制过来;

    b. jdk8 相比 jdk7 底层中的不同

      ① new HashMap() 时,底层没有创建一个长度为 16 的数组;

      ② jdk8 底层的数组是 Node[ ],而并非 Entry[ ];

      ③ 首次调用 put() 方法时,底层创建长度为 16 的数组;

      ④ jdk7底层结构为数组 + 链表,jdk8底层结构为:数组+链表+红黑树

        当数组的某个索引位置上的元素以链表形式存在的数据个数 > 8 且 当前数组的长度 > 64

        此时索引位置上的所有数据改为使用红黑树存储;

  7.4 常用方法

    Set keySet():返回所有 key 构成的 Set 集合;

    Collection values():返回所有 value 构成的 Collection 集合;

    Set entrySet():返回所有 键值对 构成的 Set 集合;

8. Collections 工具类

  排序操作(均为static 方法):

    reverse(List):反转 List 中元素的顺序

    shuffle(List):对 List 集合元素进行随机排序

    sort(List):根据元素的自然顺序对指定 List 集合元素按升序排序

    sort(List,Comparator):根据指定的 Comparator 产生的顺序对 List 集合元素进行排序

    swap(List,int, int):将指定 list 集合中的 i 处元素和 j 处元素进行交换

  查找、替换

    Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素

    Object max(Collection,Comparator):根据 Comparator 指定的顺序,返回给定集合中的最大元素

    Object min(Collection)、Object min(Collection,Comparator)

    int frequency(Collection,Object):返回指定集合中指定元素的出现次数

    void copy(List dest,List src):将src中的内容复制到dest中

    boolean replaceAll(List list,Object oldVal,Object newVal):使用新值替换List 对象的所有旧值

标签:Java,元素,List,equals,days04,数组,集合,添加,宋红康
From: https://www.cnblogs.com/LinxhzZ/p/16747907.html

相关文章