什么是线程池?它的工作原理?

简介: 我是小假 期待与你的下一次相遇 ~


一、什么是线程池?

核心思想: 线程池是一种基于“池化”思想来管理线程的工具。它预先创建好一定数量的线程,放入一个“池子”中,当有任务需要执行时,就从池子中取出一个空闲线程来执行任务,任务执行完毕后,线程并不被销毁,而是返回池中等待执行下一个任务。

为什么需要线程池?

在深入原理之前,我们先想想如果不使用线程池,我们如何处理多任务:

// 原始方式:为每个任务创建一个新线程
for (int i = 0; i < 100; i++) {
    new Thread(() -> {
        // 执行任务
        System.out.println("执行任务:" + Thread.currentThread().getName());
    }).start();
}

image.gif

这种方式存在几个严重问题:

  1. 资源消耗大:创建和销毁线程是非常消耗CPU和内存的。当任务数量非常多时,频繁地创建和销毁线程会严重影响性能。
  2. 管理困难:无法控制线程的数量,如果并发任务过多,会创建大量线程,导致系统负载过高,甚至崩溃。
  3. 稳定性差:缺乏统一的管理,线程之间的竞争和不可预知的行为会增加系统的不稳定性。

线程池的优势:

  • 降低资源消耗:通过复用已创建的线程,避免了频繁创建和销毁线程的开销。
  • 提高响应速度:当任务到达时,无需等待线程创建就能立即执行。
  • 提高线程的可管理性:线程是稀缺资源,线程池可以统一进行分配、调优和监控。可以控制最大并发数,防止无限制创建线程。
  • 提供更强大的功能:线程池提供了定时执行、定期执行、单线程、并发数控制等功能。

二、线程池的核心工作原理

要理解线程池的工作原理,我们需要深入到它的内部组件和执行流程。其核心模型可以用下图清晰地展示:

image.gif

下面我们来详细拆解图中的每一步。

核心组件

  1. 核心线程池 (corePoolSize):线程池中常驻的“核心部队”。即使它们处于空闲状态,也不会被销毁(除非设置了allowCoreThreadTimeOut为true)。
  2. 任务队列 (workQueue):一个阻塞队列,用于存放待执行的任务。当核心线程都在忙时,新来的任务会被放在这个队列里排队等候。
  3. 最大线程池 (maximumPoolSize):线程池允许创建的最大线程数量。这是线程池的“扩编上限”。
  4. 非核心线程:当任务队列满了,并且当前线程数小于最大线程数时,线程池会创建新的线程来处理任务。这些线程是“临时工”,空闲一段时间后(由keepAliveTime决定)会被销毁。
  5. 拒绝策略 (RejectedExecutionHandler):当任务队列已满,并且线程数已达到最大值时,线程池会采取一种策略来处理新提交的任务。

工作流程详解(结合上图)

  1. 提交任务
    当一个新任务被提交到线程池时,线程池的处理决策流程开始。
  2. 判断核心线程
  • 如果当前运行的线程数 小于 corePoolSize(核心线程数),那么无论是否有空闲线程,线程池都会立即创建一个新的核心线程来执行这个任务。
  • 如果核心线程数已满,则进入下一步。
  1. 尝试入队
  • 线程池会尝试将任务放入任务队列 (workQueue) 进行排队。
  • 如果任务队列未满,任务成功入队,等待核心线程空闲下来后从队列中取出执行。
  • 如果任务队列已满,则进入下一步。
  1. 判断最大线程
  • 如果任务队列已满,但当前运行的线程数 小于 maximumPoolSize(最大线程数),线程池会创建一个新的非核心线程来立即执行这个任务(注意,它执行的是刚提交的这个新任务,而不是队列里的旧任务)。
  • 如果当前线程数已经达到 maximumPoolSize,则进入下一步。
  1. 执行拒绝策略
  • 当线程池和队列都已经“满负荷”工作时,新提交的任务将被拒绝,线程池会调用RejectedExecutionHandler来处理这个任务。

补充:线程回收

当线程池中的线程数量超过了corePoolSize,并且这些“多余”的非核心线程空闲时间超过了keepAliveTime,它们就会被终止,直到线程数量恢复到corePoolSize的大小。

三、Java中的线程池实现 (ThreadPoolExecutor)

在Java中,线程池的核心类是 java.util.concurrent.ThreadPoolExecutor。我们通常通过Executors工厂类来创建配置好的线程池,但更推荐直接使用ThreadPoolExecutor的构造函数来精细控制参数。

核心构造函数

public ThreadPoolExecutor(
    int corePoolSize,         // 核心线程数
    int maximumPoolSize,      // 最大线程数
    long keepAliveTime,       // 非核心线程空闲存活时间
    TimeUnit unit,            // 存活时间单位
    BlockingQueue<Runnable> workQueue, // 任务队列
    ThreadFactory threadFactory,       // 线程工厂(用于创建线程)
    RejectedExecutionHandler handler   // 拒绝策略
)

image.gif

常见的任务队列 (workQueue)

  • SynchronousQueue:一个不存储元素的队列。每个插入操作必须等待另一个线程的移除操作。这样,提交的任务不会被排队,而是直接创建新线程或执行拒绝策略。Executors.newCachedThreadPool()使用它。
  • LinkedBlockingQueue:一个基于链表的无界队列(除非构造时指定容量)。如果使用无界队列,那么maximumPoolSize参数就失效了,因为队列永远不会满,所以只会创建corePoolSize个线程。
  • ArrayBlockingQueue:一个基于数组的有界队列。可以有效地防止资源耗尽。

内置的拒绝策略

  • ThreadPoolExecutor.AbortPolicy默认):直接抛出RejectedExecutionException异常。
  • ThreadPoolExecutor.CallerRunsPolicy:由调用者所在线程(比如主线程)来执行该任务。这提供了一种简单的反馈控制机制,可以降低新任务的提交速度。
  • ThreadPoolExecutor.DiscardPolicy:默默丢弃无法处理的任务,不抛异常。
  • ThreadPoolExecutor.DiscardOldestPolicy:丢弃队列中最旧的一个任务,然后尝试重新提交当前任务。

四、通过 Executors 工具类创建的常见线程池

  1. newFixedThreadPool (固定大小线程池)
  • corePoolSize = maximumPoolSize = n
  • workQueue = LinkedBlockingQueue(无界队列)
  • 特点:线程数量固定。适用于为了满足资源管理的需求,需要限制当前线程数量的场景。注意:使用无界队列,如果任务过多,可能导致内存溢出(OOM)。
  1. newCachedThreadPool (可缓存线程池)
  • corePoolSize = 0
  • maximumPoolSize = Integer.MAX_VALUE(几乎是无限的)
  • keepAliveTime = 60秒
  • workQueue = SynchronousQueue
  • 特点:线程数量几乎无限制,空闲线程会被回收。适用于执行很多短期异步任务的小程序,或负载较轻的服务器。注意:最大线程数非常大,可能创建大量线程,导致CPU和内存耗尽。
  1. newSingleThreadExecutor (单线程线程池)
  • corePoolSize = maximumPoolSize = 1
  • workQueue = LinkedBlockingQueue(无界队列)
  • 特点:只有一个线程工作。适用于需要保证任务顺序执行,并且在任意时间点不会有多个线程活动的场景。
  1. newScheduledThreadPool (定时任务线程池)
  • 用于在给定的延迟后运行任务,或者定期执行任务。

五、最佳实践与总结

  • 理解参数:根据任务的特性(CPU密集型、IO密集型)合理设置corePoolSizemaximumPoolSizeworkQueue
  • CPU密集型:线程数 ≈ CPU核数 + 1
  • IO密集型:线程数可以设置得多一些,如 2 * CPU核数
  • 推荐手动创建:避免使用Executors的便捷方法,而是直接使用ThreadPoolExecutor构造函数,这样可以更明确线程池的运行规则,规避资源耗尽的风险。
  • 给线程池命名:通过自定义ThreadFactory,为线程设置有意义的名字,便于出错时回溯。
  • 合理选择拒绝策略:根据业务重要性选择合适的拒绝策略。

总结一下:线程池是一个“生产者-消费者”模型的优雅实现。生产者提交任务(Runnable对象),消费者(池中的线程)从任务队列中获取并执行任务。通过预先创建和复用线程,以及对线程数量的管理,它极大地提升了多线程程序的性能、稳定性和可管理性。理解其核心工作原理是编写高效、健壮并发程序的关键。



如果小假的内容对你有帮助,请点赞评论收藏。创作不易,大家的支持就是我坚持下去的动力!

image.gif

相关文章
|
3月前
|
数据采集 消息中间件 并行计算
Python多线程与多进程性能对比:从原理到实战的深度解析
在Python编程中,多线程与多进程是提升并发性能的关键手段。本文通过实验数据、代码示例和通俗比喻,深入解析两者在不同任务类型下的性能表现,帮助开发者科学选择并发策略,优化程序效率。
200 1
|
5月前
|
数据采集 网络协议 前端开发
Python多线程爬虫模板:从原理到实战的完整指南
多线程爬虫通过并发请求大幅提升数据采集效率,适用于大规模网页抓取。本文详解其原理与实现,涵盖任务队列、线程池、会话保持、异常处理、反爬对抗等核心技术,并提供可扩展的Python模板代码,助力高效稳定的数据采集实践。
229 0
|
安全 Java 数据库
一天十道Java面试题----第四天(线程池复用的原理------>spring事务的实现方式原理以及隔离级别)
这篇文章是关于Java面试题的笔记,涵盖了线程池复用原理、Spring框架基础、AOP和IOC概念、Bean生命周期和作用域、单例Bean的线程安全性、Spring中使用的设计模式、以及Spring事务的实现方式和隔离级别等知识点。
|
编解码 网络协议 API
Netty运行原理问题之Netty的主次Reactor多线程模型工作的问题如何解决
Netty运行原理问题之Netty的主次Reactor多线程模型工作的问题如何解决
126 1
|
9月前
|
安全 Java 开发者
【JAVA】封装多线程原理
Java 中的多线程封装旨在简化使用、提高安全性和增强可维护性。通过抽象和隐藏底层细节,提供简洁接口。常见封装方式包括基于 Runnable 和 Callable 接口的任务封装,以及线程池的封装。Runnable 适用于无返回值任务,Callable 支持有返回值任务。线程池(如 ExecutorService)则用于管理和复用线程,减少性能开销。示例代码展示了如何实现这些封装,使多线程编程更加高效和安全。
|
10月前
|
Java Linux 调度
硬核揭秘:线程与进程的底层原理,面试高分必备!
嘿,大家好!我是小米,29岁的技术爱好者。今天来聊聊线程和进程的区别。进程是操作系统中运行的程序实例,有独立内存空间;线程是进程内的最小执行单元,共享内存。创建进程开销大但更安全,线程轻量高效但易引发数据竞争。面试时可强调:进程是资源分配单位,线程是CPU调度单位。根据不同场景选择合适的并发模型,如高并发用线程池。希望这篇文章能帮你更好地理解并回答面试中的相关问题,祝你早日拿下心仪的offer!
212 6
|
存储 缓存 Java
什么是线程池?从底层源码入手,深度解析线程池的工作原理
本文从底层源码入手,深度解析ThreadPoolExecutor底层源码,包括其核心字段、内部类和重要方法,另外对Executors工具类下的四种自带线程池源码进行解释。 阅读本文后,可以对线程池的工作原理、七大参数、生命周期、拒绝策略等内容拥有更深入的认识。
1527 31
什么是线程池?从底层源码入手,深度解析线程池的工作原理
|
Java 编译器 程序员
【多线程】synchronized原理
【多线程】synchronized原理
151 0
|
存储 缓存 Java
JAVA并发编程系列(11)线程池底层原理架构剖析
本文详细解析了Java线程池的核心参数及其意义,包括核心线程数量(corePoolSize)、最大线程数量(maximumPoolSize)、线程空闲时间(keepAliveTime)、任务存储队列(workQueue)、线程工厂(threadFactory)及拒绝策略(handler)。此外,还介绍了四种常见的线程池:可缓存线程池(newCachedThreadPool)、定时调度线程池(newScheduledThreadPool)、单线程池(newSingleThreadExecutor)及固定长度线程池(newFixedThreadPool)。
|
安全 Java API
Java线程池原理与锁机制分析
综上所述,Java线程池和锁机制是并发编程中极其重要的两个部分。线程池主要用于管理线程的生命周期和执行并发任务,而锁机制则用于保障线程安全和防止数据的并发错误。它们深入地结合在一起,成为Java高效并发编程实践中的关键要素。
180 0

热门文章

最新文章