Java源码分析系列笔记-16.JDK1.8的ConcurrentHashMap

1. 是什么

线程安全的HashMap,底层使用sychronized+CAS+HashMap的结构(数组+链表+红黑树)实现

2. 如何使用

public class ConcurrentHashMapTest {     public static void main(String[] args) throws InterruptedException     {         ConcurrentHashMap<Integer, Integer> map = new ConcurrentHashMap<>();         Thread thread1 = new Thread(()->{             for (int i = 0; i < 100000; i++)             {                 map.put(i, i);             }         });          Thread thread2 = new Thread(()->{             for (int i = 100000; i < 200000; i++)             {                 map.put(i, i);             }         });          thread1.start();         thread2.start();         thread1.join();         thread2.join();         System.out.println(map);         System.out.println(map.size());         for (int i = 0; i < 200000; i++)         {             if (!map.contains(i))             {                 throw new RuntimeException("并发put有问题");//不会抛出异常说明并发put没问题             }             System.out.println(map.remove(i));         }     } } 

3. 原理分析

3.1. 构造方法

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>     implements ConcurrentMap<K,V>, Serializable {     private static final long serialVersionUID = 7249069246763182397L;      //最大的数组长度。必须是2的次幂     private static final int MAXIMUM_CAPACITY = 1 << 30;      //默认的数组长度。必须是2的次幂     private static final int DEFAULT_CAPACITY = 16;        //默认的加载因子。     //当数组中有元素的entry的数量>=数组长度*LOAD_FACTOR时会进行扩容     private static final float LOAD_FACTOR = 0.75f;       //当链表(不包括头节点)中元素的数目为8的时候需要转成红黑树     static final int TREEIFY_THRESHOLD = 8;      //当红黑树(不包括头节点)中元素的数目为6的时候需要转成链表     static final int UNTREEIFY_THRESHOLD = 6;      //数组中entry的数目为64的才转换成红黑树     static final int MIN_TREEIFY_CAPACITY = 64;               //-1表示正在初始化,或者是(-1+正在扩容的线程数)     //0或正数则代表hash表还未被初始化     private transient volatile int sizeCtl;      //使用volatile修饰Node数组,如果这个数组引用(不是内容)改变     //那么其他线程能立马感知(volatile的可见性)     //这个应该是扩容的时候修改Node数组会用到     transient volatile Node<K,V>[] table;      public ConcurrentHashMap() {     } } 

3.1.1. Node

static class Node<K,V> implements Map.Entry<K,V> {     //final修饰key和hash表明这些是常量     //常量是线程安全的     final int hash;     final K key;     //val和next都用volatile修饰(可见性+有序性)     //配合CAS操作(原子性)就可以保证线程安全     //这也是get方法不用加锁的原因     volatile V val;     volatile Node<K,V> next;      Node(int hash, K key, V val, Node<K,V> next) {         this.hash = hash;         this.key = key;         this.val = val;         this.next = next;     } } 

3.2. put方法【有加锁】

public V put(K key, V value) {     //把key和value传入putVal方法     return putVal(key, value, false); } 
  • putVal
final V putVal(K key, V value, boolean onlyIfAbsent) {     if (key == null || value == null) throw new NullPointerException();//不允许插入null的key或者value     // (h ^ (h >>> 16)) & HASH_BITS(0x7fffffff)     int hash = spread(key.hashCode());     int binCount = 0;     //死循环配合cas     for (Node<K,V>[] tab = table;;) {         Node<K,V> f; int n, i, fh;         //如果table为空,第一次初始化table         if (tab == null || (n = tab.length) == 0)             tab = initTable();         //链表头节点为空,那么尝试cas设置头节点         else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {             if (casTabAt(tab, i, null,                          new Node<K,V>(hash, key, value, null)))                 break;                   // cas设置头节点成功直接break         }         //有其他线程正在移动元素         else if ((fh = f.hash) == MOVED)             //协助其他线程扩容             tab = helpTransfer(tab, f);         //链表头节点不为空,走到这里发生了hash碰撞         else {             V oldVal = null;             //可能竞争很大,所以用synchronized加锁而不是cas             //相比于JDK7的这里锁的粒度更加小了,锁的粒度缩小为数组中每个链表的头节点             synchronized (f) {                 if (tabAt(tab, i) == f) {                     if (fh >= 0) {//头节点的hash>=0说明是个链表                         binCount = 1;                         //遍历链表,并且用bitCount计数链表中节点个数                         for (Node<K,V> e = f;; ++binCount) {                             K ek;                             //找到了相等的节点,那么保存旧val,并更新val,退出循环                             if (e.hash == hash &&                                 ((ek = e.key) == key ||                                  (ek != null && key.equals(ek)))) {                                 oldVal = e.val;                                 if (!onlyIfAbsent)                                     e.val = value;                                 break;                             }                             Node<K,V> pred = e;                             //到了尾节点,直接插入到末尾                             if ((e = e.next) == null) {                                 pred.next = new Node<K,V>(hash, key,                                                           value, null);                                 break;                             }                         }                     }                     //如果是树的节点,那么转调树                     else if (f instanceof TreeBin) {                         Node<K,V> p;                         binCount = 2;                         if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,                                                        value)) != null) {                             oldVal = p.val;                             if (!onlyIfAbsent)                                 p.val = value;                         }                     }                 }             }             //判断是否需要树化             if (binCount != 0) {                 if (binCount >= TREEIFY_THRESHOLD)                     treeifyBin(tab, i);                 if (oldVal != null)                     return oldVal;                 break;             }         }     }     //更新数量     addCount(1L, binCount);     return null; } 
  • 4行:计算key的hash,这里不是简单得使用key.hashCode方法
  • 7行:死循环直到成功
  • 10-11行:第一次进来table为空,所以需要初始化table
  • 13-17行:第二次进来table不为空,链表肯定为空【头节点为空】,那么设置CAS头节点
  • 22-72行:第三次进来若链表不为空【头节点不为空】,那么对头节点加锁,使用链表的操作或树的操作插入
  • 75行:数量+1并且判断是否需要扩容

3.2.1. 计算key的hash

  • spread
static final int spread(int h) {     //通过把hashCode的高16位和低16位异或从而让每一位都参与运算减低hash碰撞的概率     //与HASH_BITS(0x7fffffff)相与保证不会出现负数?     return (h ^ (h >>> 16)) & HASH_BITS; } 

3.2.2. 死循环

for (Node<K,V>[] tab = table;;) { //.... } 

3.2.3. 第一次进来table为空,所以需要初始化table

//如果table为空,第一次初始化table if (tab == null || (n = tab.length) == 0)     tab = initTable(); 
  • initTable
private final Node<K,V>[] initTable() {     Node<K,V>[] tab; int sc;     //这个也是个死循环     while ((tab = table) == null || tab.length == 0) {     	//sizeCtl<0表示有其他线程正在初始化或者扩容         if ((sc = sizeCtl) < 0)         	//让出cpu,让扩容或者初始化的线程执行             Thread.yield(); // lost initialization race; just spin         //当前线程尝试修改sizeCtl为-1(表示正在初始化数组),成功后进入扩容逻辑         else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {             try {             	//第一次初始化                 if ((tab = table) == null || tab.length == 0) {                     //容量为16                     int n = (sc > 0) ? sc : DEFAULT_CAPACITY;                     @SuppressWarnings("unchecked")                     //创建长度为n的Node数组                     Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];                     table = tab = nt;                     //sizeCtl为8                     sc = n - (n >>> 2);                 }             } finally {                 sizeCtl = sc;             }             break;         }     }     return tab; } 
3.2.3.1. 使用CAS加锁防止多线程同时初始化table
 //当前线程正在尝试修改sizeCtl,成功后进入扩容逻辑 else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {     try {     	//第一次初始化         if ((tab = table) == null || tab.length == 0) {             //容量为16             int n = (sc > 0) ? sc : DEFAULT_CAPACITY;             @SuppressWarnings("unchecked")             //创建长度为n的Node数组             Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];             table = tab = nt;             //sizeCtl为8             sc = n - (n >>> 2);         }     } finally {         sizeCtl = sc;     }     break; } 
3.2.3.2. 其他线程让出CPU直到扩容完毕
while ((tab = table) == null || tab.length == 0) { //sizeCtl<0表示正在初始化或者扩容 if ((sc = sizeCtl) < 0) 	//让出cpu,让扩容或者初始化的线程执行     Thread.yield(); // lost initialization race; just spin } 

3.2.4. 第二次进来table不为空,链表肯定为空【头节点为空】,那么CAS设置头节点

//链表头节点为空, else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {     //那么尝试cas设置头节点     if (casTabAt(tab, i, null,                  new Node<K,V>(hash, key, value, null)))         break;                   // no lock when adding to empty bin } 
3.2.4.1. 获取第一个元素

首先通过(n - 1) & hash计算元素位置。n是2的次幂,n-1的话相当于最高位是0其余位都是1,hash与整个数相与结果跟对数组长度取模一样,只不过效率更高。
然后通过UNSAFE类的CAS操作拿到该位置的元素【每个元素都是一个链表的头节点或者红黑树的根节点】

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {     //通过Unsafe类取的     return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE); } 
3.2.4.2. CAS设置头节点
  • casTabAt
static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,                                     Node<K,V> c, Node<K,V> v) {     //也是通过Unsafe设置的     return U.compareAndSwapObject(tab, ((long)i << ASHIFT) + ABASE, c, v); } 

3.2.5. 第三次进来若链表不为空【头节点不为空】,那么对头节点加锁,使用链表的操作或树的操作插入

 //链表头节点不为空 else {     V oldVal = null;     //可能竞争很大,所以用synchronized加锁而不是cas     //相比于JDK7的这里锁的粒度更加小了,锁的粒度缩小为数组中每个链表的头节点     //JDK7的是对segment(类似于多个链表头节点)加锁     synchronized (f) {         //头节点确实没有变化--啥时候会变化?         if (tabAt(tab, i) == f) {             if (fh >= 0) {                 binCount = 1;                 //遍历链表,并且用bitCount计数链表中节点个数                 for (Node<K,V> e = f;; ++binCount) {                     K ek;                     //找到了相等的节点,那么保存旧val,并更新val,退出循环                     if (e.hash == hash &&                         ((ek = e.key) == key ||                          (ek != null && key.equals(ek)))) {                         oldVal = e.val;                         if (!onlyIfAbsent)                             e.val = value;                         break;                     }                     Node<K,V> pred = e;                     //到了尾节点,直接插入到末尾,退出循环                     if ((e = e.next) == null) {                         pred.next = new Node<K,V>(hash, key,                                                   value, null);                         break;                     }                 }             }             //如果是树的节点,那么转调树             else if (f instanceof TreeBin) {                 Node<K,V> p;                 binCount = 2;                 if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,                                                value)) != null) {                     oldVal = p.val;                     if (!onlyIfAbsent)                         p.val = value;                 }             }         }     }     //判断是否需要树化     if (binCount != 0) {         if (binCount >= TREEIFY_THRESHOLD)             treeifyBin(tab, i);         if (oldVal != null)             return oldVal;         break;     } } 
3.2.5.1. 具体的插入操作
  • 7行:首先对头节点加锁
  • 13-32行:如果是链表的节点,调用链表的方法插入节点
    • 13行:遍历链表
    • 16-22行:找到了相等的节点,那么替换value
    • 26-29行:没有找到相等的节点,插入到链表末尾
  • 34-43行:如果是树的节点,调用树的方法插入节点

3.2.6. 扩容的操作

看不太懂,先放着

private final void addCount(long x, int check) {     CounterCell[] as; long b, s;     if ((as = counterCells) != null ||         !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {         CounterCell a; long v; int m;         boolean uncontended = true;         if (as == null || (m = as.length - 1) < 0 ||             (a = as[ThreadLocalRandom.getProbe() & m]) == null ||             !(uncontended =               U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {             fullAddCount(x, uncontended);             return;         }         if (check <= 1)             return;         s = sumCount();     }     if (check >= 0) {         Node<K,V>[] tab, nt; int n, sc;         while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&                (n = tab.length) < MAXIMUM_CAPACITY) {             int rs = resizeStamp(n);             if (sc < 0) {                 if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||                     sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||                     transferIndex <= 0)                     break;                 if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))                     transfer(tab, nt);             }             else if (U.compareAndSwapInt(this, SIZECTL, sc,                                          (rs << RESIZE_STAMP_SHIFT) + 2))                 transfer(tab, null);             s = sumCount();         }     } } 

3.3. get方法【没有加锁】

public V get(Object key) {     Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;     //计算key的hash值     int h = spread(key.hashCode());     if ((tab = table) != null && (n = tab.length) > 0 &&         //找到第一个元素         (e = tabAt(tab, (n - 1) & h)) != null) {         //链表第一个节点就相等         if ((eh = e.hash) == h) {             if ((ek = e.key) == key || (ek != null && key.equals(ek)))                 return e.val;         }         //eh是第一个元素的hash值         //hash<0指得是什么情况?表示有其他线程正在扩容                  else if (eh < 0)     		//find 啥用处??             return (p = e.find(h, key)) != null ? p.val : null;         //eh>=0说明是一个链表,直接遍历该链表找到相等的节点         while ((e = e.next) != null) {             if (e.hash == h &&                 ((ek = e.key) == key || (ek != null && key.equals(ek))))                 return e.val;         }     }     //没有找到返回null     return null; } 

3.3.1. 计算key的hash值

  • spread
static final int spread(int h) {     //通过把hashCode的高16位和低16位异或从而让每一位都参与运算减低hash碰撞的概率     //与HASH_BITS(0x7fffffff)相与保证不会出现负数?     return (h ^ (h >>> 16)) & HASH_BITS; } 

3.3.2. 获取第一个元素

首先通过(n - 1) & hash计算元素位置。n是2的次幂,n-1的话相当于最高位是0其余位都是1,hash与整个数相与结果跟对数组长度取模一样,只不过效率更高。
然后通过UNSAFE类的CAS操作拿到该位置的元素【每个元素都是一个链表的头节点或者红黑树的根节点】

static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {     //通过Unsafe类取的     return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE); } 

3.3.3. 第一个元素就是要找的节点

if ((eh = e.hash) == h) {//hash相等     //key引用相等或者key内容相等     if ((ek = e.key) == key || (ek != null && key.equals(ek)))         return e.val; } 

3.3.4. 第一个元素不是要找的节点且hash<=0

3.3.5. 第一个元素不是要找的节点且hash>=0说明是个链表那么遍历链表找到相等的节点

//遍历链表找到相等的节点 while ((e = e.next) != null) {     if (e.hash == h &&         ((ek = e.key) == key || (ek != null && key.equals(ek))))         return e.val; } 

3.4. remove方法【有加锁】

public V remove(Object key) {     return replaceNode(key, null, null); }  
  • replaceNode
final V replaceNode(Object key, V value, Object cv) {     int hash = spread(key.hashCode());     //死循环     for (Node<K,V>[] tab = table;;) {         Node<K,V> f; int n, i, fh;         //table为空         if (tab == null || (n = tab.length) == 0 ||             (f = tabAt(tab, i = (n - 1) & hash)) == null)             break;         //扩容         else if ((fh = f.hash) == MOVED)             tab = helpTransfer(tab, f);         else {             V oldVal = null;             boolean validated = false;             //使用synchronized加锁             synchronized (f) {                 if (tabAt(tab, i) == f) {                     if (fh >= 0) {                         validated = true;                         //遍历链表中的每一个节点                         for (Node<K,V> e = f, pred = null;;) {                             K ek;                             //找到了相等的节点                             if (e.hash == hash &&                                 ((ek = e.key) == key ||                                  (ek != null && key.equals(ek)))) {                                 V ev = e.val;                                 if (cv == null || cv == ev ||                                     (ev != null && cv.equals(ev))) {                                     oldVal = ev;                                     if (value != null)                                         e.val = value;                                     //e不是头节点,那么直接更新链表指针                                     else if (pred != null)                                         pred.next = e.next;                                     //e是头节点                                     else                                         setTabAt(tab, i, e.next);                                 }                                 break;                             }                             pred = e;                             if ((e = e.next) == null)                                 break;                         }                     }                     else if (f instanceof TreeBin) {                         validated = true;                         TreeBin<K,V> t = (TreeBin<K,V>)f;                         TreeNode<K,V> r, p;                         if ((r = t.root) != null &&                             (p = r.findTreeNode(hash, key, null)) != null) {                             V pv = p.val;                             if (cv == null || cv == pv ||                                 (pv != null && cv.equals(pv))) {                                 oldVal = pv;                                 if (value != null)                                     p.val = value;                                 else if (t.removeTreeNode(p))                                     setTabAt(tab, i, untreeify(t.first));                             }                         }                     }                 }             }             if (validated) {                 if (oldVal != null) {                     if (value == null)                         addCount(-1L, -1);                     return oldVal;                 }                 break;             }         }     }     return null; } 

3.4.1. 死循环

for (Node<K,V>[] tab = table;;) { } 

3.4.2. table为空或者链表头节点为空,说明不存在那么返回空

//table为空 if (tab == null || (n = tab.length) == 0 ||     (f = tabAt(tab, i = (n - 1) & hash)) == null)     break;//break循环,最后返回null 

3.4.3. 头节点不为空先加锁,然后使用树或者链表的操作删除节点

else {     V oldVal = null;     boolean validated = false;     //使用synchronized加锁     synchronized (f) {         if (tabAt(tab, i) == f) {             if (fh >= 0) {                 validated = true;                 //遍历链表中的每一个节点                 for (Node<K,V> e = f, pred = null;;) {                     K ek;                     //找到了相等的节点                     if (e.hash == hash &&                         ((ek = e.key) == key ||                          (ek != null && key.equals(ek)))) {                         V ev = e.val;                         if (cv == null || cv == ev ||                             (ev != null && cv.equals(ev))) {                             oldVal = ev;                             if (value != null)                                 e.val = value;                             //e不是头节点,那么直接更新链表指针                             else if (pred != null)                                 pred.next = e.next;                             //e是头节点                             else                                 setTabAt(tab, i, e.next);                         }                         break;                     }                     pred = e;                     if ((e = e.next) == null)                         break;                 }             }             else if (f instanceof TreeBin) {                 validated = true;                 TreeBin<K,V> t = (TreeBin<K,V>)f;                 TreeNode<K,V> r, p;                 if ((r = t.root) != null &&                     (p = r.findTreeNode(hash, key, null)) != null) {                     V pv = p.val;                     if (cv == null || cv == pv ||                         (pv != null && cv.equals(pv))) {                         oldVal = pv;                         if (value != null)                             p.val = value;                         else if (t.removeTreeNode(p))                             setTabAt(tab, i, untreeify(t.first));                     }                 }             }         } } 
3.4.3.1. 链表的删除节点操作--更新指针
//遍历链表中的每一个节点 for (Node<K,V> e = f, pred = null;;) {     K ek;     //找到了相等的节点     if (e.hash == hash &&         ((ek = e.key) == key ||          (ek != null && key.equals(ek)))) {         V ev = e.val;         if (cv == null || cv == ev ||             (ev != null && cv.equals(ev))) {             oldVal = ev;             if (value != null)                 e.val = value;             //这个节点e不是头节点,那么直接更新前一个节点的next指针             else if (pred != null)                 pred.next = e.next;             //这个节点e是头节点,那么CAS设置e.next为头节点             else                 setTabAt(tab, i, e.next);         }         break;     }     pred = e;     if ((e = e.next) == null)         break; } 
  • setTabAt
static final <K,V> void setTabAt(Node<K,V>[] tab, int i, Node<K,V> v) {     U.putObjectVolatile(tab, ((long)i << ASHIFT) + ABASE, v); } 

3.5. containsKey方法【没有加锁】

public boolean containsKey(Object key) {     //调用get方法,也是不加锁     return get(key) != null; } 

4. 参考链接

发表评论

评论已关闭。

相关文章