Java 批量更新太慢?多线程 + List 分段完美解决!

举报
民工哥 发表于 2022/07/03 00:03:47 2022/07/03
【摘要】 点击下方“Java编程鸭”关注并标星 更多精彩 第一时间直达 写在前面 相信不少开发者在遇到项目对数据进行批量操作的时候,都会有不少的烦恼,尤其是针对数据量极大的情况下,效率问题就直接提上了菜板。 因此,开多线程来执行批量任务是十分重要的一种批量操作思路,其实这种思路实现起来也十分简单,就拿批量更新的操作举例: 整体流程...

点击下方“Java编程鸭”关注并标星

更多精彩 第一时间直达

写在前面

相信不少开发者在遇到项目对数据进行批量操作的时候,都会有不少的烦恼,尤其是针对数据量极大的情况下,效率问题就直接提上了菜板。

因此,开多线程来执行批量任务是十分重要的一种批量操作思路,其实这种思路实现起来也十分简单,就拿批量更新的操作举例:

整体流程图

c1a19816aad981a5bd02d488ec84587b.png

步骤

  • 获取需要进行批量更新的大集合A,对大集合进行拆分操作,分成N个小集合A-1 ~ A-N

  • 开启线程池,针对集合的大小进行调参,对小集合进行批量更新操作。

  • 对流程进行控制,控制线程执行顺序。

按照指定大小拆分集合的工具类


   
  1. import com.google.common.collect.Lists;
  2. import org.apache.commons.collections.CollectionUtils;
  3. import java.util.List;
  4. /**
  5.  * 拆分结合工具类
  6.  *
  7.  * @author shiwen
  8.  */
  9. public class SplitListUtils {
  10.     /**
  11.      * 拆分集合
  12.      *
  13.      * @param <T> 泛型对象
  14.      * @param resList 需要拆分的集合
  15.      * @param subListLength 每个子集合的元素个数
  16.      * @return 返回拆分后的各个集合组成的列表
  17.      * 代码里面用到了guava和common的结合工具类
  18.      **/
  19.     public static <T> List<List<T>> split(List<T> resList, int subListLength) {
  20.         if (CollectionUtils.isEmpty(resList) || subListLength <= 0) {
  21.             return Lists.newArrayList();
  22.         }
  23.         List<List<T>> ret = Lists.newArrayList();
  24.         int size = resList.size();
  25.         if (size <= subListLength) {
  26.             // 数据量不足 subListLength 指定的大小
  27.             ret.add(resList);
  28.         } else {
  29.             int pre = size / subListLength;
  30.             int last = size % subListLength;
  31.             // 前面pre个集合,每个大小都是 subListLength 个元素
  32.             for (int i = 0; i < pre; i++) {
  33.                 List<T> itemList = Lists.newArrayList();
  34.                 for (int j = 0; j < subListLength; j++) {
  35.                     itemList.add(resList.get(i * subListLength + j));
  36.                 }
  37.                 ret.add(itemList);
  38.             }
  39.             // last的进行处理
  40.             if (last > 0) {
  41.                 List<T> itemList = Lists.newArrayList();
  42.                 for (int i = 0; i < last; i++) {
  43.                     itemList.add(resList.get(pre * subListLength + i));
  44.                 }
  45.                 ret.add(itemList);
  46.             }
  47.         }
  48.         return ret;
  49.     }
  50.     // 运行代码
  51.     public static void main(String[] args) {
  52.         List<String> list = Lists.newArrayList();
  53.         int size = 1099;
  54.         for (int i = 0; i < size; i++) {
  55.             list.add("hello-" + i);
  56.         }
  57.         // 大集合里面包含多个小集合
  58.         List<List<String>> temps = split(list, 100);
  59.         int j = 0;
  60.         // 对大集合里面的每一个小集合进行操作
  61.         for (List<String> obj : temps) {
  62.             System.out.println(String.format("row:%s -> size:%s,data:%s", ++j, obj.size(), obj));
  63.         }
  64.     }
  65. }

开启异步执行任务的线程池


   
  1. public void threadMethod() {
  2.     List<T> updateList = new ArrayList();
  3.     // 初始化线程池, 参数一定要一定要一定要调好!!!!
  4.     ThreadPoolExecutor threadPool = new ThreadPoolExecutor(2050,
  5.             4, TimeUnit.SECONDS, new ArrayBlockingQueue(10), new ThreadPoolExecutor.AbortPolicy());
  6.     // 大集合拆分成N个小集合, 这里集合的size可以稍微小一些(这里我用100刚刚好), 以保证多线程异步执行, 过大容易回到单线程
  7.     List<T> splitNList = SplitListUtils.split(totalList, 100);
  8.     // 记录单个任务的执行次数
  9.     CountDownLatch countDownLatch = new CountDownLatch(splitNList.size());
  10.     // 对拆分的集合进行批量处理, 先拆分的集合, 再多线程执行
  11.     for (List<T> singleList : splitNList) {
  12.         // 线程池执行
  13.         threadPool.execute(new Thread(new Runnable(){
  14.             @Override
  15.             public void run() {
  16.                 for (Entity yangshiwen : singleList) {
  17.                     // 将每一个对象进行数据封装, 并添加到一个用于存储更新数据的list
  18.                     // ......
  19.                     
  20.                 }
  21.             }
  22.         }));
  23.         // 任务个数 - 1, 直至为0时唤醒await()
  24.         countDownLatch.countDown();
  25.     }
  26.     try {
  27.         // 让当前线程处于阻塞状态,直到锁存器计数为零
  28.         countDownLatch.await();
  29.     } catch (InterruptedException e) {
  30.         throw new BusinessLogException(ResponseEnum.FAIL);
  31.     }
  32.     // 通过mybatis的批量插入的方式来进行数据的插入, 这一步还是要做判空
  33.     if (GeneralUtil.listNotNull(updateList)) {
  34.         batchUpdateEntity(updateList);
  35.         LogUtil.info("xxxxxxxxxxxxxxx");
  36.     }
  37. }

写在最后

多线程是Java的一个难点,但是它也很有趣,听说玩得溜得起飞的人,人生都开启多线程模式了…

来源:blog.csdn.net/qq_43097201/article/

details/112452391

END


   
  1. 看完本文有收获?请转发分享给更多人
  2. 关注「Java编程鸭」,提升Java技能
  3. 关注Java编程鸭微信公众号,后台回复:码农大礼包 可以获取最新整理的技术资料一份。涵盖Java 框架学习、架构师学习等!
  4. 文章有帮助的话,在看,转发吧。
  5. 谢谢支持哟 (*^__^*)

文章来源: mingongge.blog.csdn.net,作者:民工哥,版权归原作者所有,如需转载,请联系作者。

原文链接:mingongge.blog.csdn.net/article/details/125567798

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。