Springboot 多线程分批切割处理 大数据量List集合 ,实用示例

news/2025/1/13 3:02:50/

 
前言

哲学提问镇贴:


不了解异步怎么使用的看官, 可阅:

SpringBoot 最简单的使用异步线程案例 @Async_小目标青年的博客-CSDN博客

Springboot Async异步扩展使用 结合 CompletableFuture_小目标青年的博客-CSDN博客

想了解更多关于批量list处理操作的看官,可阅:
 

Java List数据量大, 需要分片批次操作_小目标青年的博客-CSDN博客

Mybatis 批量插入 采用分批处理一次500条_小目标青年的博客-CSDN博客

Springboot 手动分页查询,分批批量插入数据_小目标青年的博客-CSDN博客

正文

话不多说,本篇核心介绍的是日常毕竟常遇到的一些处理点。


首先list数据量大,需要切割操作 :

        

        //模拟拿到的数据量大的listList<Product> products = getBatchListTest();//直接用Lists.partition 按照100条一次切割List<List<Product>> allList = Lists.partition(products, 100);//循环分批处理切割的listfor (List<Product> batchProducts :allList){productService.batchDealList(batchProducts);}


        
但是往往有时候 数据量是真大,切割完循环处理 还嫌慢

是的,因为循环处理是串行的, 也就是,比如500条数据的list,切割成5个 batchList。

如果每次处理一个barchList要1秒钟,那么循环串行处理5次,就是 1X5=5 秒。

所以我们分批切割这样串行处理完,觉得慢, 如果业务场景合适,我们可以试着改 并行 处理。

开袋及食:
 

① 配置一个线程池,交给spring管理的 线程池,用起来才放心、安心:

 ThreadConfig.java 

import java.util.concurrent.Executor;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.scheduling.annotation.EnableAsync;
import org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor;@Configuration
@EnableAsync
public class ThreadConfig  {/*** 执行需要依赖线程池,这里就来配置一个线程池* @return*/// 当池子大小小于corePoolSize,就新建线程,并处理请求// 当池子大小等于corePoolSize,把请求放入workQueue(QueueCapacity)中,池子里的空闲线程就去workQueue中取任务并处理// 当workQueue放不下任务时,就新建线程入池,并处理请求,如果池子大小撑到了maximumPoolSize,就用RejectedExecutionHandler来做拒绝处理// 当池子的线程数大于corePoolSize时,多余的线程会等待keepAliveTime长时间,如果无请求可处理就自行销毁@Bean("MyExecutor")public Executor getExecutor() {ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();//设置核心线程数executor.setCorePoolSize(10);//设置最大线程数executor.setMaxPoolSize(100);//线程池所使用的缓冲队列executor.setQueueCapacity(250);//设置线程名executor.setThreadNamePrefix("JcTest-Async");//设置多余线程等待的时间,单位:秒//executor.setKeepAliveSeconds();// 初始化线程executor.initialize();return executor;}
}

 看看我们并行的写法:

 

    @AutowiredThreadConfig threadConfig;@PostMapping("doBatchParallelTes")public void doBatchParallelTes() {List<Product> products = getBatchListTest();List<List<Product>> allList = Lists.partition(products, 100);int batchNum = allList.size();StopWatch stopWatch = new StopWatch();stopWatch.start();Executor threadConfigExecutor = threadConfig.getExecutor();List<CompletableFuture> results = new ArrayList<>();for (List<Product> batchProducts :allList){CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {productService.batchDealList(batchProducts);return "";}, threadConfigExecutor);results.add(future);}CompletableFuture.allOf(results.toArray(results.toArray(new CompletableFuture[batchNum]))).join();stopWatch.stop();System.out.println("总用时"+stopWatch.getTotalTimeMillis()+"毫秒");}

代码简析:

并行图解:

 看看执行效果:

 
那么看到这里,大家一定注意到了那个 ‘合流’ , 是不是每个业务都需要这样所谓的‘合流’?

当然不是,如果说这批list处理完完事了,不需要考虑回到主线程去做其余操作,那么我们就不需要‘合流’操作。

不需要合流,主线程走主线程逻辑,子线程自己玩自己的:

    @PostMapping("doBatchTestNew2")public void doBatchTestNew2() {List<Product> products = getBatchListTest();List<List<Product>> allList = Lists.partition(products, 100);StopWatch stopWatch = new StopWatch();stopWatch.start();Executor threadConfigExecutor = threadConfig.getExecutor();for (List<Product> batchProducts :allList){CompletableFuture.runAsync(() -> {productService.batchDealList(batchProducts);}, threadConfigExecutor);}stopWatch.stop();System.out.println("总用时"+stopWatch.getTotalTimeMillis()+"毫秒");}

效果,其实就是异步执行: 

那如果说是基于@Async 的方式去实现呢,当然也是可以的,示例:

 基于@Async 就不多说了,这个在文章开头有介绍相关文章,之前写的,介绍过玩法,就是这两篇:

SpringBoot 最简单的使用异步线程案例 @Async_小目标青年的博客-CSDN博客

Springboot Async异步扩展使用 结合 CompletableFuture_小目标青年的博客-CSDN博客

好了,该篇就到这。


http://www.ppmy.cn/news/37014.html

相关文章

对象的封装

示例如下&#xff1a; package com.hy; /* 面向对象的特征一&#xff1a;封装与隐藏 一&#xff1a;问题的引入&#xff1a; 当我们创建一个类的对象以后&#xff0c;我们可以通过“对象.属性”的方式&#xff0c;对对象的属性进行赋值&#xff0c; 这里&#xff0c;赋值操作要…

Vue|计算属性

1. 计算属性1.1 差值语法1.2 methods1.3 计算属性1. 计算属性 1.1 差值语法 开始前分别在项目目录创建文件夹及页面如下 需求1&#xff1a;在两个文本框中分别输入姓和名的同时需要在下方将数据进行拼接组装&#xff0c;效果如下图 如果用传统的方式来实现的话&#xff0c;需要…

【Dockerfile学习笔记】常用命令及参数意义

什么是 Dockerfile&#xff1f; Dockerfile 是一个用来构建镜像的文本文件&#xff0c;文本内容包含了一条条构建镜像所需的指令和说明。 下面罗列一下常用的与镜像有关的命令&#xff1a; 列举本地的镜像&#xff1a;docker images 拉取镜像&#xff1a;docker pull tomcat …

线程池(2022-09-29)

文章目录前言一、线程池的常用构建方式1.构造方法实现(推荐)2.通过 Executor 框架的工具类 Executors 来实现(不推荐)3.Spring框架提供4.Guava&#xff0c;hutool的ThreadFactoryBuilder5.线程池的异常处理二、线程池核心 阻塞队列 BlockingQueue1.二级标题三、线程池异常1.try…

【理论推导】变分自动编码器 Variational AutoEncoder(VAE)

变分推断 (Variational Inference) 变分推断属于对隐变量模型 (Latent Variable Model) 处理的一种技巧&#xff0c;其概率图如下所示 我们将 X{x1,...xN}X\{ x_1,...x_N \}X{x1​,...xN​} 看作是每个样本可观测的一组数据&#xff0c;而将对应的 Z{z1,...,zN}Z\{z_1,...,z_N…

优漫动游影视后期学什么?

影视后期就是对前期拍摄的视频进行剪辑&#xff0c;对文字、调色、特效等后期处理&#xff0c;最终形成我们所看到的成片。   影视后期从应用划分&#xff0c;核心包括两个大的应用领域&#xff0c;影视剧方向和广告与包装方向&#xff0c;影视剧方向比如电视剧&#xff0c…

微服务架构(一)

系统架构 随着互联网的发展&#xff0c;网站应用的规模也在不断的扩大&#xff0c;进而导致系统架构也在不断的进行变化。 从互联网早起到现在&#xff0c;系统架构大体经历了下面几个过程: 单体应用架构--->集群应用架构--->垂直应用架构--->SOA 架构--->微服务架…

类ChatGPT平台推荐【国内访问ChatGPT4】

类ChatGPT平台推荐【国内访问ChatGPT】 1 ChatGPT介绍 ChatGPT是OpenAI开发出的一个人工智能模型。但是国内大部分人因为网络限制无法访问和使用。今天推荐国内访问途经。 ChatGPT作用&#xff1a; 回答问题信息搜索语言翻译文本生成文案编写代码编程助手创意写作 … 注意&am…