【Java异步编程】基于任务类型创建不同的线程池

news/2025/2/3 7:30:11/

文章目录

    • 一. 按照任务类型对线程池进行分类
      • 1. IO密集型任务的线程数
      • 2. CPU密集型任务的线程数
      • 3. 混合型任务的线程数
    • 二. 线程数越多越好吗
    • 三. Redis 单线程的高效性

使用线程池的好处主要有以下三点:

  1. 降低资源消耗:线程是稀缺资源,如果无限制地创建,不仅会消耗系统资源,还会降低系统的稳定性,通过重复利用已创建的线程可以降低线程创建和销毁造成的消耗。
  2. 提高响应速度:当任务到达时,可以不需要等待线程创建就能立即执行。
  3. 提高线程的可管理性:线程池提供了一种限制、管理资源的策略,维护一些基本的线程统计信息,如已完成任务的数量等。通过线程池可以对线程资源进行统一的分配、监控和调优。

虽然使用线程池的好处很多,但是如果其线程数配置得不合理,不仅可能达不到预期效果,反而可能降低应用的性能。接下来按照不同的任务类型来配置线程池。

 

一. 按照任务类型对线程池进行分类

使用标准构造器ThreadPoolExecutor创建线程池时,会涉及线程数的配置,而线程数的配置与异步任务类型是分不开的。这里将线程池的异步任务大致分为以下三类:

  1. IO密集型任务此类任务主要是执行IO操作。由于执行IO操作的时间较长,导致CPU的利用率不高,这类任务CPU常处于空闲状态。Netty的IO读写操作为此类任务的典型例子。
  2. CPU密集型任务此类任务主要是执行计算任务。由于响应时间很快,CPU一直在运行,这种任务CPU的利用率很高。
  3. 混合型任务此类任务既要执行逻辑计算,又要进行IO操作(如RPC调用、数据库访问)​。

相对来说,由于执行IO操作的耗时较长(一次网络往返往往在数百毫秒级别)​,这类任务的CPU利用率也不是太高。Web服务器的HTTP请求处理操作为此类任务的典型例子。一般情况下,针对以上不同类型的异步任务需要创建不同类型的线程池,并进行针对性的参数配置。

 

1. IO密集型任务的线程数

由于IO密集型任务的CPU使用率较低,导致线程空余时间很多,因此通常需要开CPU核心数两倍的线程。当IO线程空闲时,可以启用其他线程继续使用CPU,以提高CPU的使用率。

java">@Slf4j  
//懒汉式单例创建线程池:用于IO密集型任务  
public class IoIntenseTargetThreadPoolLazyHolder {  /**  * IO线程池最大线程数  */  public static final int IO_MAX = Math.max(2, CPU_COUNT * 2);  /**  * 空闲保活时限,单位秒  */  public static final int KEEP_ALIVE_SECONDS = 30;  /**  * 有界队列size  */    public static final int QUEUE_SIZE = 10000;  //线程池: 用于IO密集型任务  public static final ThreadPoolExecutor EXECUTOR = new ThreadPoolExecutor(  IO_MAX,  IO_MAX,  KEEP_ALIVE_SECONDS,  TimeUnit.SECONDS,  new LinkedBlockingQueue(QUEUE_SIZE),  new ThreadUtil.CustomThreadFactory("io"));  public static ThreadPoolExecutor getInnerExecutor() {  return EXECUTOR;  }  static {  log.info("线程池已经初始化");  EXECUTOR.allowCoreThreadTimeOut(true);  //JVM关闭时的钩子函数  Runtime.getRuntime().addShutdownHook(  new ShutdownHookThread("IO密集型任务线程池", new Callable<Void>() {  @Override  public Void call() throws Exception {  //优雅关闭线程池  shutdownThreadPoolGracefully(EXECUTOR);  return null;  }  }));  }  
}

 

有以下几点需要注意

  1. 调用allowCoreThreadTimeOut,传入了参数true,应用于核心线程,当池中的线程长时间空闲时,可以自行销毁。
  2. 使用有界队列缓冲任务而不是无界队列,如果128太小,可以根据具体需要进行增大,但是不能使用无界队列。
  3. corePoolSize和maximumPoolSize保持一致,使得在接收到新任务时,如果没有空闲工作线程,就优先创建新的线程去执行新任务,而不是优先加入阻塞队列,等待现有工作线程空闲后再执行。
  4. 使用JVM关闭时的钩子函数优雅地自动关闭线程池。

 

2. CPU密集型任务的线程数

CPU密集型任务也叫计算密集型任务,其特点是要进行大量计算而需要消耗CPU资源,比如计算圆周率、对视频进行高清解码等。

CPU密集型任务虽然也可以并行完成,但是并行的任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以要最高效地利用CPU,CPU密集型任务并行执行的数量应当等于CPU的核心数。

java">/**  * CPU核数  **/  
public static final int CPU_COUNT = Runtime.getRuntime().availableProcessors();  public static final int MAXIMUM_POOL_SIZE = CPU_COUNT;  //线程池: 用于CPU密集型任务  
private static final ThreadPoolExecutor EXECUTOR = new ThreadPoolExecutor(  MAXIMUM_POOL_SIZE,  MAXIMUM_POOL_SIZE,  KEEP_ALIVE_SECONDS,  TimeUnit.SECONDS,  new LinkedBlockingQueue(QUEUE_SIZE),  new CustomThreadFactory("cpu"));  public static ThreadPoolExecutor getInnerExecutor() {  return EXECUTOR;  
}  static {  log.info("线程池已经初始化");  EXECUTOR.allowCoreThreadTimeOut(true);  //JVM关闭时的钩子函数  Runtime.getRuntime().addShutdownHook(  new ShutdownHookThread("CPU密集型任务线程池", new Callable<Void>() {  @Override  public Void call() throws Exception {  //优雅关闭线程池  shutdownThreadPoolGracefully(EXECUTOR);  return null;  }  }));  
}

 

3. 混合型任务的线程数

混合型任务既要执行逻辑计算,又要进行大量非CPU耗时操作(如RPC调用、数据库访问、网络通信等)​,所以混合型任务CPU的利用率不是太高,非CPU耗时往往是CPU耗时的数倍

比如在Web应用中处理HTTP请求时,一次请求处理会包括DB操作、RPC操作、缓存操作等多种耗时操作。一般来说,一次Web请求的CPU计算耗时往往较少,大致在100~500毫秒,而其他耗时操作会占用500~1000毫秒,甚至更多的时间。

在为混合型任务创建线程池时,如何确定线程数呢?业界有一个比较成熟的估算公式,具体如下:

java">
最佳线程数 = ((线程等待时间+线程CPU时间) / 线程CPU时间) * CPU核数

通过公式可以看出:等待时间所占的比例越高,需要的线程就越多;CPU耗时所占的比例越高,需要的线程就越少

 

下面举一个例子:

比如在Web服务器处理HTTP请求时,假设平均线程CPU运行时间为100毫秒,而线程等待时间(比如包括DB操作、RPC操作、缓存操作等)为900毫秒,如果CPU核数为8,那么根据上面这个公式,估算如下:

java">(900毫秒 + 100毫秒) / 100毫秒 * 8 = 10 * 8 = 80

 

二. 线程数越多越好吗

很多小伙伴认为,线程数越高越好。那么,使用很多线程是否就一定比单线程高效呢?答案是否定的。

虽然多线程在一些并发场景下能带来性能提升,但过多的线程并不意味着性能必定提升。线程数过高可能导致一些问题:

  • 上下文切换(Context Switching): 每个线程的执行都由操作系统调度,线程切换会带来额外的开销。当线程数过多时,操作系统频繁地在不同线程间切换,导致 上下文切换 成本增加,这样反而可能降低系统的整体效率。

  • 资源争用: 多线程同时访问共享资源时,可能会遇到 资源竞争锁竞争,特别是在 CPU 绑定的任务中。线程之间的协作和同步会称为性能瓶颈。

  • 内存开销: 每个线程需要占用一定的内存,维护线程栈、调度信息等,过多的线程会消耗大量的内存和系统资源,这可能会导致系统性能下降,甚至造成内存溢出

 

三. Redis 单线程的高效性

Redis 是一个 单线程 的高性能数据库,许多人可能会觉得它的设计不合常理,为什么不使用多线程来提升性能呢?然而,Redis 使用单线程反而能够达到极高的吞吐量,这是因为:

特点核心内容
1. 避免多线程上下文切换单线程模型避免了线程切换的开销,任务按顺序处理,简化了并发控制,避免了锁竞争和死锁问题。
2. 非阻塞设计采用事件驱动和 I/O 多路复用技术,非阻塞处理请求。如果一个请求需要等待外部资源(如网络 I/O),Redis 会把控制权交给其他请求,而不是阻塞线程。这种方式避免了多线程中因为等待 I/O 资源导致的线程空闲,充分利用了 CPU 的时间片。
3. CPU vs I/O 密集型Redis 的大多数操作(如 GET/SET)是 I/O 密集型 的,单线程在 I/O 密集型应用中有优势。
4. 数据访问模式Redis 操作主要是内存访问,内存操作速度快,单线程执行时没有同步问题,数据结构(如哈希表、跳表等)高效。

http://www.ppmy.cn/news/1568899.html

相关文章

flutter-android混合编译,原生接入

关于作者&#xff1a; CSDN内容合伙人、技术专家&#xff0c; 从零开始做日活千万级APP&#xff0c;带领团队单日营收超千万。 专注于分享各领域原创系列文章 &#xff0c;擅长java后端、移动开发、商业化变现、人工智能等&#xff0c;希望大家多多支持。 目录 一、导读二、概览…

JVM的GC详解

获取GC日志方式大抵有两种 第一种就是设定JVM参数在程序启动时查看&#xff0c;具体的命令参数为: -XX:PrintGCDetails # 打印GC日志 -XX:PrintGCTimeStamps # 打印每一次触发GC时发生的时间第二种则是在服务器上监控:使用jstat查看,如下所示&#xff0c;命令格式为jstat -gc…

【deepseek实战】绿色好用,不断网

前言 最佳deepseek火热网络&#xff0c;我也开发一款windows的电脑端&#xff0c;接入了deepseek&#xff0c;基本是复刻了网页端&#xff0c;还加入一些特色功能。 助力国内AI&#xff0c;发出自己的热量 说一下开发过程和内容的使用吧。 目录 一、介绍 二、具体工作 1.1、引…

流浪 Linux: 外置 USB SSD 安装 ArchLinux

注: ArchLinux 系统为滚动更新, 变化很快, 所以本文中的安装方法可能很快就过时了, 仅供参考. 实际安装时建议去阅读官方文档. 最近, 突然 (也没有那么突然) 有了一大堆 PC: 4 个笔记本, 2 个台式主机 (M-ATX 主板), 1 个小主机 (迷你主机). 嗯, 多到用不过来. 但是, 窝又不能…

K8s之Service详解(Detailed Explanation of K8s Service)

K8s之Service详解 1 Service相关概念 1.1 什么是Service&#xff1f; 在 Kubernetes 中&#xff0c;Service 是一种抽象的资源&#xff0c;它提供了稳定的访问接口&#xff0c;将外部或集群内部的流量路由到对应的 Pod 上。Pod 是 Kubernetes 中的基本调度单元&#xff0c;…

C#@符号在string.Format方法中作用

本文详解@符号在string.Format方法中作用。

解决运行npm时报错

在运行一个Vue项目时报错&#xff0c;产生下面问题 D:\node\npm.cmd run dev npm WARN logfile could not be created: Error: EPERM: operation not permitted, open D:\node\node_cache\_logs\2025-01-31T01_01_58_076Z-debug-0.log npm WARN logfile could not be created:…

ELECTRA:作为判别器而非生成器的预训练文本编码器

摘要 诸如BERT之类的掩码语言建模&#xff08;MLM&#xff09;预训练方法通过将某些标记替换为[MASK]来破坏输入&#xff0c;然后训练模型以重建原始标记。尽管这些方法在下游自然语言处理&#xff08;NLP&#xff09;任务中表现良好&#xff0c;但它们通常需要大量的计算资源…