- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Java8原子弹类之LongAdder源码分析

JavaEdge 发表于 2022/01/24 23:50:35 2022/01/24

【摘要】 Java8原子弹类之LongAdder源码分析JDK 8开始，针对Long型的原子操作, Java又提供了LongAdder. LongAccumulator; 针对Double类型，Java提供了DoubleAdder、DoubleAccumulator。 Striped64 UMLAtomicLong内部是一个volatile long型变量，由多个线程对这个变量进行CAS操作。多个线...

Java8原子弹类之LongAdder源码分析

JDK 8开始，针对Long型的原子操作, Java又提供了LongAdder. LongAccumulator; 针对Double类型，Java提供了DoubleAdder、DoubleAccumulator。

Striped64 UML

AtomicLong内部是一个volatile long型变量，由多个线程对这个变量进行CAS操作。多个线程同时对一个变量进行CAS操作，在高并发场景下仍不够快，若再提高性能，咋办?
把一个变量拆成多份，变为多个变量，类似ConcurrentHashMap分段锁。如下图，把一个Long型拆成一个base变量外加多个Cell，每个Cell包装一个Long型变量。当多个线程并发累加的时：

如果并发度低，就直接加到base变量上
并发度高，冲突大，平摊到这些Cell上

最后取值时，再把base和这些Cell求sum运算。

核心 API

add

public void add(long x) {
    Cell[] as; long b, v; int m; Cell a;
    // 判断cells是否还没被初始化，并且尝试对value值进行cas操作
    if ((as = cells) != null || !casBase(b = base, b + x)) {
        // 如果cells已经初始化 或 cas操作失败，则运行if内部语句
        boolean uncontended = true;
        // cell[]数组是否初始化
        // cell[]数组虽然初始化了但是数组长度是否为0
      	// 该线程所对应cell是否为null
      	// 尝试对该线程对应的cell单元进行cas更新是否失败，如果这些条件有一条为true，则运行最为核心的方法longAccumulate
        if (as == null || (m = as.length - 1) < 0 ||
            (a = as[getProbe() & m]) == null ||
            !(uncontended = a.cas(v = a.value, v + x)))
            longAccumulate(x, null, uncontended);
    }
}

包含一个Cell数组，Striped64的一个内部类。即AtomicLong的填充变体且只支持原始访问和CAS，有一个value变量，并且提供cas方法更新value值。

/**
  * 处理涉及初始化，调整大小，创建新Cell，和/或争用的更新案例
  *
  * @param x 值
  * @param fn 更新方法
  * @param wasUncontended 调用
  */
 final void longAccumulate(long x, LongBinaryOperator fn, boolean wasUncontended) {
     int h;
     // 获取线程probe的值
     if ((h = getProbe()) == 0) {
         // 值为0，则强制初始化
         ThreadLocalRandom.current();
         h = getProbe();
         wasUncontended = true;
     }
     boolean collide = false; // True if last slot nonempt
     for (;;) {
         Cell[] as; Cell a; int n; long v;
         // 这个if分支处理上述四个条件中的前两个
       	 // 此时cells数组已初始化 && 长度大于0
         if ((as = cells) != null && (n = as.length) > 0) {
             // 线程对应cell为null
             if ((a = as[(n - 1) & h]) == null) {
                 // 若busy锁未被占有
                 if (cellsBusy == 0) {       // Try to attach new Cell
                     // 新建一个cell
                     Cell r = new Cell(x);   // Optimistically create
                     // 检测busy是否为0,并且尝试锁busy
                     if (cellsBusy == 0 && casCellsBusy()) {
                         boolean created = false;
                         try { // Recheck under lock
                             Cell[] rs; int m, j;
                             // 再次确认线程probe所对应的cell为null，将新建的cell赋值
                             if ((rs = cells) != null &&
                                 (m = rs.length) > 0 &&
                                 rs[j = (m - 1) & h] == null) {
                                 rs[j] = r;
                                 created = true;
                             }
                         } finally {
                             // 解锁
                             cellsBusy = 0;
                         }
                         if (created)
                             break;
                         //如果失败，再次尝试
                         continue;           // Slot is now non-empty
                     }
                 }
                 collide = false;
             }
             //置为true后交给循环重试
             else if (!wasUncontended)       // CAS already known to fail
                 wasUncontended = true;      // Continue after rehash
             //尝试给线程对应的cell update
             else if (a.cas(v = a.value, ((fn == null) ? v + x :
                                          fn.applyAsLong(v, x))))
                 break;
             else if (n >= NCPU || cells != as)
                 collide = false;            // At max size or stale
             else if (!collide)
                 collide = true;
             //在以上条件都无法解决的情况下尝试扩展cell
             else if (cellsBusy == 0 && casCellsBusy()) {
                 try {
                     if (cells == as) {      // Expand table unless stale
                         Cell[] rs = new Cell[n << 1];
                         for (int i = 0; i < n; ++i)
                             rs[i] = as[i];
                         cells = rs;
                     }
                 } finally {
                     cellsBusy = 0;
                 }
                 collide = false;
                 continue;                   // Retry with expanded table
             }
             h = advanceProbe(h);
         }
         //此时cells还未进行第一次初始化，进行初始化
         else if (cellsBusy == 0 && cells == as && casCellsBusy()) {
             boolean init = false;
             try {                           // Initialize table
                 if (cells == as) {
                     Cell[] rs = new Cell[2];
                     rs[h & 1] = new Cell(x);
                     cells = rs;
                     init = true;
                 }
             } finally {
                 cellsBusy = 0;
             }
             if (init)
                 break;
         }
         //busy锁不成功或者忙，则再重试一次casBase对value直接累加
         else if (casBase(v = base, ((fn == null) ? v + x :
                                     fn.applyAsLong(v, x))))
             break;                          // Fall back on using base
     }
 }
  /**
   * Spinlock (locked via CAS) used when resizing and/or creating Cells.
   * 通过cas实现的自旋锁，用于扩大或者初始化cells
   */
  transient volatile int cellsBusy;

从以上分析来看，longAccumulate就是为了尽量减少多个线程更新同一个value，实在不行则扩大cell

SUM(最终一致性问题)

并没有对 cells 数组加锁，所以是最终一致性，而非强一致性。类似 concurrenthashmap#clear（一边执行清空操作，一边还有线程放入数据，clear调用完完毕后再读取）。因此，适合高并发的统计场景，而不适合要对某个Long型变量进行严格同步的场景。

/**
 * Returns the current sum.  返回值不是个原子快照;无并发修改的调用可以返回精确值，但当计算sum时有并发修改，就可能无法正常协作了。
 */
public long sum() {
    Cell[] as = cells; Cell a;
    long sum = base;
    if (as != null) {
        for (int i = 0; i < as.length; ++i) {
            if ((a = as[i]) != null)
                sum += a.value;
        }
    }
    return sum;
}

LongAdder减少冲突的方法以及在求和场景下比AtomicLong更高效。
因为LongAdder在更新数值时并非对一个数进行更新，而是分散到多个cell，这样在多线程的情况下可以有效的嫌少冲突和压力，使得更加高效。

由于无论是long or double，都是64位。但因没有double型的CAS操作，所以是通过把double型转化
成long型来实现。所以，上面的base和Cell[]变量，位于基类Striped64。英文Striped意为“条带”，即分片。

使用场景

适用于统计求和计数的场景，因为它提供add、sum方法。

LongAdder是否能够替换AtomicLong

不行，因为AtomicLong提供了很多cas方法，例如getAndIncrement、getAndDecrement等，使用起来非常灵活，而LongAdder只有add和sum，使用较受限。

优点:由于 JVM 会将 64位的double,long 型变量的读操作分为两次32位的读操作,所以低并发保持了 AtomicLong性能,高并发下热点数据被 hash 到多个 Cell,有限分离,通过分散提升了并行度
但统计时有数据更新,也可能会出现数据误差,但高并发场景有限使用此类,低时还是可以继续 AtomicLong

伪共享与缓存行填充

Cell类定义用了注解 Contended，JDK 8新增，涉及伪共享与缓存行填充。

每个CPU都有自己的缓存。缓存与主内存进行数据交换的基本单位叫Cache Line (缓存行)。在64位x86架
构中，缓存行是64字节，也就是8个Long型的大小。这也意味着当缓存失效，要刷新到主内存的时候，最少要刷新64字节。

如下，主内存中有变量X、Y、 Z (假设每个变量都是一个Long型) ，被CPU1和CPU2分别读入自己的缓
存，放在了同一行Cache Line里面。当CPU1修改了X变量，它要失效整行Cache Line，即往总线上发消息，通知CPU2对应Cache Line也失效。由于Cache Line是数据交换的基本单位，无法只失效X，要失效就会失效整行的Cache Line,这会导致Y、Z变量的缓存也失效。

使用Contended注解，即可实现缓存行填充。不让Cell数组中相邻的元素落到同一个缓存行。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Java8原子弹类之LongAdder源码分析

Java8原子弹类之LongAdder源码分析

Striped64 UML

核心 API

add

SUM(最终一致性问题)

使用场景

LongAdder是否能够替换AtomicLong

伪共享与缓存行填充

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Java8原子弹类之LongAdder源码分析

Java8原子弹类之LongAdder源码分析

Striped64 UML

核心 API

add

SUM(最终一致性问题)

使用场景

LongAdder是否能够替换AtomicLong

伪共享与缓存行填充

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品