1. 手写ArrayList
1.1. ArrayList底层原理细节
- 底层结构是一个长度可以动态增长的数组(顺序表)
transient Object[] elementData;
- 特点:在内存中分配连续的空间,只存储数据,不存储地址信息。位置就隐含着地址。
- 优点
- 节省存储空间,因为分配给数据的存储单元全用于存放节点的数据(不考虑c/c++中数组需指定大小的情况),节点之间的逻辑关系没有占有额外的存储空间
- 索引查找效率高,即每一个节点对应一个序号,由该序号可以直接计算出来节点的存储地址。
- 缺点
- 插入和删除操作需要移动元素,效率较低
- 必须提前分配固定数量的空间,如果存储元素少,可能导致空闲浪费
- 按照内容查询效率低,因为需要逐个比较判断
- 通过无参构造方法创建对象时,JDK1.7初始长度时10;JDK1.8初始长度是0,在第一次添加元素时就进行扩容
- 容量不足时,每次扩容增加50%,
int newCapacity = oldCapacity + (oldCapacity >> 1);
- 提供一个内部类ltr,实现了Iterator接口。用来对ArrayList进行遍历
public Iterator<E> iterator() {
return new itr();
}
private class itr implements Iterator<E> {
}
1.2. 定义List接口和Iterator接口
public interface Iterator<T> {
boolean hasNext();
T next();
}
public interface List {
// 返回线性表的大小,即数据元素的个数
public int size();
// 返回线性表中序号为i的数据元素
public Object get(int i);
// 如果线性表为空返回true,否则返回false
public boolean isEmpty();
// 判断线性表是否包含数据元素e
public boolean contains(Object e);
// 返回数据元素e在线性表中的序号
public int indexOf(Object e);
// 将数据元素e插入到线性表中i号位置
public void add(int i, Object e);
// 将数据元素e插入到线性表末尾
public void add(Object e);
// 将数据元素e插入到元素obj之前
public boolean addBefore(Object obj, Object e);
// 将数据元素e插入到元素obj之后
public boolean addAfter(Object obj, Object e);
// 删除线性表中序号为i的元素并返回
public Object remove(int i);
// 删除线性表中第一个与e相同的元素
public boolean remove(Object e);
// 替换线性表中序号为i的数据元素为e,返回原数据元素
public Object replace(int i, Object e);
// 迭代List
public Iterator iterator();
}
1.3. 手写ArrayList
/*
* 自定义数组越界异常
* */
public class IndexOutOfBoundsException extends RuntimeException {
public IndexOutOfBoundsException() {}
public IndexOutOfBoundsException(String message) {
super(message);
}
}
public class ArrayList implements List {
// 底层数组来存储多个元素
private Object[] elementData;
// 存储元素的个数,线性表的长度,不是数组长度
private int size;
public ArrayList() {
// 查看真实的ArrayList无参数构造方法是怎么实现的
this(10);
// this.elementData = new Object[]();
// this.elementData = new Object[0];
}
public ArrayList(int initialCapacity) {
// 如果initialCapacity<0,抛出异常
if(initialCapacity < 0) {
throw new IndexOutOfBoundsException("初始长度要大于0: " + initialCapacity);
}
// 按照初始长度给数组分配空间
elementData = new Object[initialCapacity];
// 指定线性表初始元素个数,可以省略,int成员变量默认值0
// this.size = 0;
}
@Override
public int size() {
return size;
}
@Override
public Object get(int i) {
// 对i值进行判断
if(i >= size) {
throw new IndexOutOfBoundsException("数组指针越界异常:" + i);
}
return elementData[i];
}
@Override
public boolean isEmpty() {
return size == 0;
}
@Override
public boolean contains(Object e) {
// 逐个判断各元素是否与要查询元素内容相同,效率低下
// 注意不是elementData.length,而是size
/*for (int i = 0; i < size; i++) {
if(e.equals(elementData[i])) return true;
}
return false;*/
return this.indexOf(e) >= 0;
}
@Override
public int indexOf(Object e) {
// 逐个判断各个元素是否与要查询元素内容相同,效率低下
// 有漏洞,如果e为null,使用if分别处理
for (int i = 0; i < size; i++) {
if(e.equals(elementData[i])) {
return i;
}
}
return -1;
}
@Override
public void add(int i, Object e) {
// 如果i超过了size,抛出异常
if(i > size || i < 0) {
throw new IndexOutOfBoundsException("数组指针越界异常:" + i);
}
// 需要先判断length是否足够,如果已经满了,需要扩容
if(size == this.elementData.length) {
grow();
}
// 添加元素
// 从后向前移后面元素一个位置
for (int j = size; j > i; j--) {
this.elementData[i] = this.elementData[j-1];
}
// 添加元素到指定位置
this.elementData[i] = e;
// 元素个数+1
this.size++;
}
@Override
public void add(Object e) {
// 需要先判断length是否足够,如果已经满了,需要扩容
if(size == this.elementData.length) {
grow();
}
// 增加元素
this.elementData[size] = e;
// 元素长度+1
size++;
// 可以合并成一条语句
// this.elementData[size++] = e;
}
private void grow() {
// 创建一个新的更长数组
/*Object[] newArr = new Object[this.elementData.length * 2];
// 将旧数组数据放入到新数组
for (int i = 0; i < this.elementData.length; i++) {
newArr[i] = this.elementData[i];
}
// 旧数组引用指向新数组
this.elementData = newArr;*/
elementData = Arrays.copyOf(elementData, this.elementData.length * 2);
}
@Override
public String toString() {
if(this.size == 0) return "[]";
StringBuilder builder = new StringBuilder();
builder.append("[");
for (int i = 0; i < size; i++) {
if(i != size - 1) {
builder.append(this.get(i) + ",");
}else {
builder.append(this.get(i));
}
}
builder.append("]");
return builder.toString();
}
public Iterator iterator() {
return new Itr();
}
private class Itr<T> implements Iterator<T> {
// 指向当前元素,默认第一个(索引是0)
int cursor = 0;
// 指定当前元素的前一个元素用途在于remove使用
int lastRet = -1;
@Override
public boolean hasNext() {
return cursor != size;
}
@Override
public T next() {
int i = cursor;
cursor++;
// 如果不进行hasNext()判断,就可能越界
if(i > size) {
throw new RuntimeException("没有这个元素了");
}
return (T)elementData[i];
}
}
}
1.4. 测试ArrayList
public class TestArrayList {
public static void main(String[] args) {
// 创建线性顺序表
List list = new ArrayList();
// 向末尾添加元素
list.add("111");
list.add("222");
list.add(2, "AAAA");
// 进行各种操作验证添加
System.out.println(list.size()); // 3
System.out.println(list.isEmpty()); // false
System.out.println(list.get(2)); // AAAA
System.out.println(list.contains("2")); // false
System.out.println(list.indexOf("222")); // 1
System.out.println(list.toString()); // [111,222,AAAA]
Iterator<String> it = list.iterator();
while (it.hasNext()) {
String elem = it.next();
System.out.println(elem);
}
}
}
2. 手写单链表和LinkedList
2.1. 单链表技能点
- 认识单链表
* 特点- 数据元素的存储对应的是不连续的存储空间,每个存储节点对应一个需要存储的数据元素
- 每个节点是由数据域和指针域组成。元素之间的逻辑关系通过存储节点之间的链接关系反映出来。逻辑上相邻的节点物理上不必相邻。
- 缺点
- 比顺序存储结构的存储密度小(每个节点都由数据域和指针域组成,所以相同空间内假设全存满,顺序比链式存储的更多)
- 按照索引查找节点时,链式存储比顺序存储满(每个节点地址不连续、无规律,导致按照索引查询效率低下)
- 优点
- 插入、删除灵活(不必移动节点,只要改变节点中的指针,但是需要先定位到元素上)
- 有元素才会分配节点空间,不会有闲置的节点
- 添加节点
- 删除节点
- 带头节点的单链表
在使用单链表实现线性表时,为了使程序更加简洁,通常在单链表最前面添加一个哑元节点,也称头节点。
在头节点中不存储任何实质的数据对象,其next域指向线性表中0号元素所在的节点
可以对空表、非空表的情况以及对首元节点进行统一管理,编程更方便,常用头节点。
一个不带头节点和带头节点的单链表实现线性表的结构如图所示
2.2. 手写单链表
- 定义单链表节点
public class Node {
// 存储数据
Object data;
// 指向下一个节点的指针
Node next;
public Node() {
super();
}
public Node(Object data) {
super();
this.data = data;
}
public Node(Object data, Node next) {
super();
this.data = data;
this.next = next;
}
public Object getData() {
return data;
}
public void setData(Object data) {
this.data = data;
}
public Node getNext() {
return next;
}
public void setNext(Node next) {
this.next = next;
}
@Override
public String toString() {
return "Node{" +
"data=" + data +
", next=" + next +
'}';
}
}
- 手写单链表
public class SingleLinkedList implements List{
// 头节点,哑巴节点,不存储数据,为了方便编程
private Node head = new Node();
// 节点的个数
private int size = 0;
@Override
public int size() {
return size;
}
@Override
public Object get(int i) {
// i从0开始
// 判断i值是否合理
if(i < 0 || i >= size) {
throw new IndexOutOfBoundsException("索引越界:" + i);
}
// 从第一个节点开始查找
Node p = head.next; // p初始指向第一个节点(不是头节点)
for (int j = 0; j < i; j++) {
// p指向下个节点
p = p.next;
}
// 返回第i个节点,而不是第i个节点的data
return p;
}
@Override
public void add(int i, Object e) {
// i值合理性判断
if(i < 0 || i > size) {
throw new IndexOutOfBoundsException("索引越界:" + i);
}
// 先找到前一个(如果当前索引是0,前一个就是head)
Node p = head;
if(i != 0) {
p = (Node)this.get(i - 1);
}
// 创建一个新节点,给data复制
Node newNode = new Node(e);
// 指定新节点的下一个节点
newNode.next = p.next;
// 指定前一个节点的下一个节点是当前新节点
p.next = newNode;
// 数量+1
size++;
}
@Override
public Object remove(int i) {
if(i < 0 || i>= size) {
throw new IndexOutOfBoundsException("索引越界:" + i);
}
// 先找到前一个(如果当前索引是0,前一个就是head)
Node p = head;
if(i != 0) {
p = (Node)this.get(i - 1);
}
// 指向要删除的节点
Node currentNode = p.next;
// 完成删除操作
p.next = currentNode.next;
currentNode.next = null;
// 提示将要删除的节点变成垃圾
currentNode = null;
// 数量-1
size--;
return null;
}
@Override
public String toString() {
StringBuilder builder = new StringBuilder("[");
// p初始指向第一个节点(不是头节点)
Node p = head.next;
for (int j = 0; j < size; j++) {
builder.append(p.data + " ");
// p指向下一个节点
p = p.next;
}
builder.append("]");
return builder.toString();
}
@Override
public boolean isEmpty() {
return size == 0;
}
}
-
单链表添加、删除、查询原理
-
测试单链表
public class TestList {
public static void main(String[] args) {
java.util.ArrayList list2;
// 创建线性顺序表
List list = new SingleLinkedList();
// 向末尾添加元素
list.add("1");
list.add("2");
list.add("3");
list.add(3, "4");
list.remove(2);
// 进行各种操作验证添加
System.out.println(list.size()); // 3
System.out.println(list.isEmpty()); // false
System.out.println(list.contains("4")); // true
System.out.println(list.indexOf("2")); // 1
System.out.println(list.toString()); // [1 2 4]
}
}
2.3. 手写LinkedList
- LinkedList底层原理
- LinkedList底层是一个双向链表;添加、删除元素效率高;按照索引查找效率低。可以两个方向查询
- 每个节点都包含了对前一个和后一个元素的引用
- LinkedList同时实现了List、Deque、Queue接口,所以可以当作线性表、队列、双端队列、栈使用
- LinkedList是非同步的(线程不安全)
- 不存在LinkedList容量不足的问题
- LinkedList底层是一个双向链表;添加、删除元素效率高;按照索引查找效率低。可以两个方向查询
- 定义LinkedList节点
public class LinkedList implements List{
/*
* 静态内部类,代表LinkedList的每个节点
* */
public static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
@Override
public String toString() {
return "Node{" +
"item=" + item +
", next=" + next +
", prev=" + prev +
'}';
}
}
}
public class LinkedList implements List{
transient int size = 0;
transient Node first;
transient Node last;
@Override
public int size() {
return size;
}
@Override
public Object get(int i) {
return node(i).item;
}
@Override
public boolean isEmpty() {
return size == 0;
}
@Override
public boolean contains(Object e) {
return false;
}
@Override
public int indexOf(Object e) {
return 0;
}
@Override
public void add(int index, Object element) {
if(index == size) {
linkLast(element);
}else {
linkBefore(element, node(index));
}
}
Node node(int index) {
if(index < (size >> 1)) {
Node x = first;
for (int i = 0; i < index; i++) {
x = x.next;
}
return x;
}else {
Node x = last;
for (int i = size - 1; i > index; i--) {
x = x.prev;
}
return x;
}
}
void linkBefore(Object e, Node succ) {
final Node pred = succ.prev;
final Node newNode = new Node<>(pred, e, succ);
succ.prev = newNode;
if(pred == null) {
first = newNode;
}else {
pred.next = newNode;
}
size++;
}
@Override
public void add(Object e) {
linkLast(e);
}
public void linkLast(Object e) {
final Node l = last;
final Node newNode = new Node<>(l, e, null);
last = newNode;
if(l == null) {
first = newNode;
}else {
l.next = newNode;
}
size++;
}
public String toString() {
return first.toString();
}
}
- LinkedList的add(Object)方法的实现过程
- 测试LinkedList
public class TestList1 {
public static void main(String[] args) {
// 创建线性顺序表
List list = new LinkedList();
// 向末尾添加元素
list.add(1);
list.add(2);
list.add(3);
list.add(3, 4);
// 进行各种操作验证添加
System.out.println(list.size()); // 4
System.out.println(list.isEmpty()); // false
System.out.println(list.get(0)); // 1
}
}
3. 手写HashMap
3.1. HashMap的原理
- 底层结构是哈希表,采用了顺序表+链表结合的结构;同一个链表上所有元素的存储地址都是相同的,是发生冲突的元素
- 链表上每个节点的就是一个Entry,字段包括四部分
同一个链表上节点的哈希码可能不相同,存储的地址是相同的 - 哈希表的优点
- 添加块、查询块(通过计算得到存储位置,不是通过比较)
- 无序
- key唯一
- 关键参数
- 默认主数组长度16
- 默认装填因子0.75
- 每次主数组扩容为原来的2倍
- JDK8中,当链表长度大于8时,链表变为红黑树
- 第一步计算哈希码,不仅调用了hashCode(),又进行了多次散列。目的在于key不同,哈希码尽量不同,减少冲突
final int hash(Object k) {
int h = 0;
h ^= k.hashCode();
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
- 细节:发生冲突,经过比较不存在相同key的元素,要添加一个新的节点。不是加到链表最后,而是添加到链表最前。
3.2. 定义Map接口
public interface Map {
// 定义方法
public void put(Object key, Object value);
public Object get(Object key);
public int size();
public boolean isEmpty();
// 定义内部接口
interface Entry {
public Object getKey();
public Object getValue();
}
}
3.3. 手写HashMap
public class HashMap implements Map{
// 指向哈希表的数组引用
public Entry[] table;
// 键值对数量
int size;
public HashMap() {
// 哈希表主数组默认长度16
table = new Entry[11];
}
@Override
public void put(Object key, Object value) {
// 计算哈希码
int hash = key.hashCode();
// 根据哈希码计算存储位置
int index = hash % table.length;
// 存入指定位置
// 如果该位置没有元素,增加一个节点
if(table[index] == null) {
table[index] = new Entry(hash, key, value);
size++;
}else {
// 如果有元素,进行逐个比较
Entry entry = table[size];
while (entry != null) {
// 如果找到了相同的key
if(entry.getKey().equals(key)) {
// 新的value替代旧的value
entry.value = value;
return;
}
entry = entry.next;
}
// 循环结束,表明也没有相同的key,在链表最前添加一个节点
Entry firstEntry = table[index];
table[index] = new Entry(hash, key, value, firstEntry);
size++;
}
}
@Override
public Object get(Object key) {
// 计算哈希码
int hash = key.hashCode();
// 根据哈希码计算存储位置
int index = hash % table.length;
// 查找对应的Entry
Entry entry = null;
if(table[index] != null) {
Entry currentEntry = table[index];
while (currentEntry != null) {
if(currentEntry.getKey().equals(key)) {
entry = currentEntry;
break;
}
currentEntry = currentEntry.next;
}
}
return entry == null ? null : entry.getValue();
}
@Override
public String toString() {
StringBuilder builder = new StringBuilder("{");
for (int i = 0; i < table.length; i++) {
if(table[i] != null) {
Entry entry = table[i];
while (entry != null) {
builder.append(entry.getKey() + "=" + entry.getValue() + "," + entry = entry.next);
}
}
}
if(builder.length() != 1) {
builder.deleteCharAt(builder.length() - 1);
}
builder.append("}");
return builder.toString();
}
@Override
public int size() {
return size;
}
@Override
public boolean isEmpty() {
return size == 0;
}
}
public class Entry implements Map.Entry{
private int hash;
private Object key;
private Object value;
// 指向下一个节点的指针
private Entry next;
public Entry() {}
public Entry(int hash, Object key, Object value) {
this.hash = hash;
this.key = key;
this.value = value;
}
public Entry(int hash, Object key, Object value, Entry next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
@Override
public Object getKey() {
return key;
}
@Override
public Object getValue() {
return value;
}
@Override
public String toString() {
return "Entry{" +
"hash=" + hash +
", key=" + key +
", value=" + value +
", next=" + next +
'}';
}
}
3.4 测试HashMap
public class TestHashMap {
public static void main(String[] args) {
java.util.HashMap map1;
HashMap map = new HashMap();
map.put(23, "china");
map.put(36, "Japan");
System.out.println(map.size());
System.out.println(Arrays.toString(map.table));
System.out.println(map);
}
}
4. 新一代并发集合类
4.1. 手写HashSet
- HashSet底层就是HashMap,哈希表的每个Entry的key是每个元素,value统一都是new Object()
public interface Set {
public int size();
public void add(Object obj);
public boolean isEmpty();
public boolean contains(Object obj);
}
public class HashSet implements Set {
private transient HashMap map;
private static final Object PRESENT = new Object();
public HashSet() {
this.map = new HashMap();
}
@Override
public int size() {
return map.size();
}
@Override
public void add(Object key) {
map.put(key, PRESENT);
}
@Override
public boolean isEmpty() {
return map.isEmpty();
}
@Override
public boolean contains(Object obj) {
return map.get(obj) != null;
}
}
4.2. 三代集合类发展过程
- 第一代线程安全集合类
- Vector、Hashtable:使用synchronized修饰方法来保证线程安全
- 缺点:效率低下
- 第二代线程非安全集合类(主流)
- ArrayList、HashMap:线程不安全,但性能好,用来替代Vector、Hashtable
- 线程安全的:使用Collections.synchronizedList(list)和Collections.synchronizedMap(m),底层使用synchronized代码块锁,虽然也是锁住了所有的代码,但是所在方法里面,比所在方法外性能稍有提高,毕竟进方法本身是要分配资源的
- 第三代线程安全集合类(波浪式前进,螺旋式上升)
- 在有大量并发下,使用java.util.concurrent.*中的ConcurrentHashMap、CopyOnWriteArrayList、CopyOnWriteArraySet来提高集合的效率和安全,底层大都采用Lock锁(1.8的ConcurrentHashMap不使用Lock锁),保证安全的同时,性能也很高
4.3. 新一代并发集合类
- ConcurrentHashMap:分段(segment)锁定+Lock锁
- JDK1.7中
- 比HashMap的线程安全,并且性能比Hashtable好,Collections.synchronizedMap(m)都有提高
- 使用的不是synchronized代码块锁或方法锁,使用了锁分离技术,用多个锁来控制对hash表的不同部分(段segment)进行的修改,采用ReentrantLock锁来实现
- 如果多个修改操作发生在不同的段上,就可以并发执行,从而提高效率
- JDK1.8中
- 摒弃了segment锁段的概念,而是采用了volatile+CAS实现无锁化操作。**底层由数组+链表+红黑树的方式(JDK1.8中HashMap的实现)。**为了做到并发,又增加了很多辅助的类,如TreeBin,Traverser等对象内部类
- JDK1.7中
- CopyOnWriteArrayList:CopyOnWrite+Lock锁
- 对于set()、add()、remove()等方法使用ReentrantLock的Lock和unlock来加锁和解锁,读操作不需要加锁(之前集合安全类,即使读操作也要加锁,保证数据的实时一致)
- CopyOnWrite原理:写时复制
- 当往一个容器中添加元素时,不直接添加,而是先将容器进行copy,然后往新容器中添加元素
- 添加完元素之后,再将原容器的引用指向新容器。这样做的好处是可以对CopyOnWrite容器进行并发读,而不需要加锁,因为当前容器不会添加任何元素,所以CopyOnWrite容器也是一种读写分离的思想,读和写使用不同的容器。
- 适合对于读操作远多于写操作的应用,特别在并发的情况下,可以提高性能的并发读取
- CopyOnWrite容器只能保证数据的最终一致性,不能保证数据实时一致性。因此,如果希望写入数据马上能读到,就不要使用CopyOnWrite容器
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
// 复制出新数组
Object[] newElements = Arrays.copyOf(elements, len + 1);
// 把新元素添加到新数组中
newElements[len] = e;
// 把原数组引用指向新数组
setArray(newElements);
return true;
}finally {
lock.unlock();
}
}
final void setArray(Object[] a) {
array = a;
}
public E get(int index) {
return get(getArray(), index);
}
注意:读时不需要加锁,如果读时有多个线程正在向ArrayList添加数据,读还是会读到旧数据,因为写时不会锁住旧的ArrayList
- CopyOnWriteArraySet:CopyOnWrite+Lock锁
- 线程安全的无序集合,CopyOnWriteArraySet和HashSet都继承于共同的父类AbstractSet;但是HashSet是通过散列表HashMap实现的,而CopyOnWriteArraySet是通过动态数组CopyOnWriteArrayList实现的
- CopyOnWriteArraySet在CopyOnWriteArrayList基础上使用了Java的装饰模式,所以底层是相同的。 而CopyOnWriteArrayList本质是动态数组队列,所以CopyOnWriteArraySet相当于通过动态数组实现的集合
- CopyOnWriteArrayList中允许有重复的元素;但CopyOnWriteArraySet不能有重复的元素。因此,CopyOnWriteArrayList额外提供了addIfAbsent()和addAllAbsent()这两个添加元素的API,通过API来添加元素,只有当元素不存在时才执行添加操作。