一、定义
HashSet的底层是通过HashMap实现的,所以要通过HashMap去寻求答案
二、源码分析
其实关于这个问题的答案关键源码需在putVal方法中寻找,我用的版本是JDK8
//源码
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true); // 1
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0) // 2
n = (tab = resize()).length; // 3
if ((p = tab[i = (n - 1) & hash]) == null) // 4
tab[i] = newNode(hash, key, value, null); // 5
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //6
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) // 7
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount; //8
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
public class test {
public static void main(String[] args) {
Set<String> obj = new HashSet<> ();
obj.add(new String("java"));
obj.add(new String("java"));
for (String s :obj) {
System.out.println(s); //只输出java
}
}
}
解析:
-
从上面代码可以分析,当new两个相同的String类时候,由于HashMap的底层是数组+链表+红黑树的形式,第一个new("java")在进入putVal方法时,先在标记为2的位置进行判断集合是否为空,如果为空或者集合的个数为0,则进入标记为3的那一行进入resize方法中赋一个长度为16的数组,然后在标记为4的代码行对标记1的代码行的hash方法求得的hash值与15进行按位与运算,求得索引值为多少。判断该索引是否有值,因为第一次添加,所以第一个new("java")添加成功,然后跳到标记为8的代码行运算,再判断是否需要扩容,退出循环。
-
当第二个new("java")进入其中的时候,由于值相同,则hash值相同,当进入标记2的代码行时由于数组不为空且不为null,所以不会进入;当到标记为4的代码行时,由于hash值相同,所以索引相同,由于第一个new已经加到数组内了,所以跳到标记为6的代码行,该判断条件首先会判断hash值是否相同,hash值相同的条件下会判断两个条件的短路或运算,两个条件分别判断地址是否相同,以及equals方法下值是否相同,由于String类重写了equals方法,所以第二个java加入不进去,跳到标记为8的代码块,退出方法。