编程语言线程的增长/回收策略

    作者:承香墨影更新于: 2020-03-01 16:12:58

    大神带你学编程,欢迎选课

    漫画:聊聊线程池中,线程的增长/回收策略。编程语言往往使程序员能够比使用机器语言更准确地表达他们所想表达的目的。对那些从事计算机科学的人来说,懂得程序设计语言是十分重要的,因为在当今所有的计算都需要程序设计语言才能完成。

    我们今天就来借这个问题,聊聊线程池中维护的线程,它增长和回收的策略是什么样的?

    一、序

    编程语言线程的增长/回收策略_编程语言_Python_ java_课课家

    public static ExecutorService newThreadPool() { return new ThreadPoolExecutor( 30, 60, 60L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue());}

    我们今天就来借这个问题,聊聊线程池中维护的线程,它增长和回收的策略是什么样的?

    二、线程池的策略

    2.1 线程池的各项参数

    当我们聊到线程池中线程的增长策略的时候,最抓眼球的就是它的核心线程数(corePoolSize)和最大线程数(maximumPoolSize),但是仅看这两个参数是不够全面的,线程数量的增长,还与任务等待队列有关系。

    我们先来看看 ThreadPoolExecutor 最全参数的构造方法:

    1. public ThreadPoolExecutor( 
    2.   int corePoolSize, 
    3.   int maximumPoolSize, 
    4.   long keepAliveTime, 
    5.   TimeUnit unit, 
    6.   BlockingQueue workQueue, 
    7.   ThreadFactory threadFactory, 
    8.   RejectedExecutionHandler handler) { 
    9.   // ... 

    简单解释一下各个参数是什么意思:

    • corePoolSize:核心线程数;
    • maximumPoolSize:线程池的最大线程数;
    • keepAliveTime:核心线程数之外的线程,最大空闲存活的时长;
    • unit:keepAliveTime 的时间单位;
    • workQueue:线程池的任务等待队列;
    • threadFractory:线程工厂,用来为线程池创建线程;
    • handler:拒绝策略,当线程池无法处理任务时的拒绝方式;

    这其中很多参数的配置,都是相互影响的。例如任务等待队列 workQueue 配置不当,可能导致线程池中的线程,永远无法增长到核心线程数(maximumPoolSize)配置的线程数。

    2.2 线程池中线程的增长策略

    看到这里你应该就清楚了,线程池线程的增长策略,和 3 个参数有关系:

    • corePoolSize:核心线程数
    • maximumPoolSize:最大线程数;
    • workQueue:等待任务队列;

    它们之前的关系是这样的:

    接下来我们看看理想情况下,线程池中线程的增长策略。

    默认情况下,初始时线程池是空的,当有新任务来了时,线程池开始通过线程工厂(threadFractory)创建线程来处理任务。

    新的任务会不断的触发线程池中线程的创建,直到线程数量达到核心线程数(corePoolSize),接下来会停止线程的创建,而是将这个新任务放入任务等待队列(workQueue)。

    新任务不断进入任务等待队列,当该队列满了时,开始重新创建线程处理任务,直到线程池中线程的数量,到达 maximumPoolSize 配置的数量。

    到这一步时,线程池的线程数达到最大值,并且没有空闲的线程,任务队列也存满了任务,这时如果还有新的任务进来,就会触发线程池的拒绝策略(handler),如果没有配置拒绝策略就会抛出 RejectedExecutionException 异常。

    到这里线程的增长策略就说清楚了,我们可以通过下图来了解完整的流程。

    其中比较关键的就是任务的等待队列,无论等待队列的实现结构是什么样的,只有在它满的时候,线程池中的线程才会向最大线程数增长。但是一个能够满的队列,它的前提是必须是一个有界队列。

    这就是文章开头举的例子暗藏的坑,我们回顾一下前面构造的线程池。

     

    1. public static ExecutorService newThreadPool() { 
    2.   return new ThreadPoolExecutor( 
    3.     30, 60, 
    4.     60L, TimeUnit.MILLISECONDS, 
    5.     new LinkedBlockingQueue()); 

    可以看到,这里虽然最大线程数是大于核心线程数的,但是它的等待队列配置的是一个 LinkedBlockingQueue,从名字上可以看出这是一个基于链表实现的阻塞队列,而用它的默认构造方法构造时,其容量设定为 Integer.MAX_VALUE,可以简单理解它是一个无界队列。

     

    1. public LinkedBlockingQueue() { 
    2.   this(Integer.MAX_VALUE); 
    3.  
    4. public LinkedBlockingQueue(int capacity) { 
    5.   if (capacity <= 0) throw new IllegalArgumentException(); 
    6.   this.capacity = capacity; 
    7.   last = head = new Node(null); 

    这也就是为什么说,这样构造的线程池,核心线程数的配置参数,永远都用不到,因为它的等待队列永远没有满的时候。

    2.3 线程池中线程的收缩策略

    线程池中执行的任务,总有执行结束的时候。那么线程池当线程池中存在大量空闲线程时,也会有一定的收缩策略,来回收线程池中多余的线程。

    线程池中线程的收缩策略,和以下几个参数相关:

    • corePoolSize:核心线程数;
    • maximumPoolSize:线程池的最大线程数;
    • keepAliveTime:核心线程数之外的线程,空闲存活的时长;
    • unit:keepAliveTime 的时间单位;

    corePoolSize 和 maximumPoolSize 我们比较熟悉了,另外能够控制它的就是 keepAliveTime 空闲存活时长,以及这个时长的单位。

    当线程池中的线程数,超过核心线程数时。此时如果任务量下降,肯定会出现有一些线程处于无任务执行的空闲状态。那么如果这个线程的空闲时间超过了 keepAliveTime&unit 配置的时长后,就会被回收。

    需要注意的是,对于线程池来说,它只负责管理线程,对于创建的线程是不区分所谓的「核心线程」和「非核心线程」的,它只对线程池中的线程总数进行管理,当回收的线程数达到 corePoolSize 时,回收的过程就会停止。

    对于线程池的核心线程数中的线程,也有回收的办法,可以通过 allowCoreThreadTimeOut(true) 方法设置,在核心线程空闲的时候,一旦超过 keepAliveTime&unit 配置的时间,也将其回收掉。

    1. public void allowCoreThreadTimeOut(boolean value) { 
    2.   if (value && keepAliveTime <= 0) 
    3.     throw new IllegalArgumentException("Core threads must have nonzero keep alive times"); 
    4.   if (value != allowCoreThreadTimeOut) { 
    5.     allowCoreThreadTimeOut = value; 
    6.     if (value) 
    7.       interruptIdleWorkers(); 
    8.   } 

    allowCoreThreadTimeOut() 能被设置的前提是 keepAliveTime 不能为 0。

    2.3 查缺补漏

    1. 等待队列还会影响拒绝策略

    等待队列如果配置成了无界队列,不光影响线程数量从核心线程数向最大线程数的增长,还会导致配置的拒绝策略永远得不到执行。

    因为只有在线程池中的工作线程数量已经达到核心线程数,并且此时等待队列也满了的情况下,拒绝策略才能生效。

    2. 核心线程数可以被「预热」

    前面提到默认的情况下,线程池中的线程是根据任务来增长的。但如果有需要,我们也可以提前准备好线程池的核心线程,来应对突然的高并发任务,例如在抢购系统中就经常有这样的需要。

    此时就可以利用 prestartCoreThread() 或者 prestartAllCoreThreads() 来提前创建核心线程,这种方式被我们称为「预热」。

    3. 对于需要无界队列的场景,怎么办?

    需求是多变的,我们肯定会碰到需要使用无界队列的场景,那么这种场景下配置的 maximumPoolSize 就是无效的。

    此时就可以参考 Executors 中 newFixedThreadPool() 创建线程池的过程,将 corePoolSize 和 maximumPoolSize 保持一致即可。

     

    1. public static ExecutorService newFixedThreadPool(int nThreads) { 
    2.   return new ThreadPoolExecutor( 
    3.     nThreads, nThreads, 
    4.     0L, TimeUnit.MILLISECONDS, 
    5.     new LinkedBlockingQueue()); 

    此时核心线程数就是最大线程数,只有增长到这个数量才会将任务放入等待队列,来保证我们配置的线程数量都得到了使用。

    4. 线程池是公平的吗?

    所谓的公平,就是先到的任务会被先执行。这在线程池中,显然是不公平的。

    不提线程池中线程执行任务是通过系统去调度的,这一点就决定了任务的执行顺序是无法保证的,这就是是非公平的。另外只从线程池本身的角度来看,我们只看提交的任务顺序来看,它也是非公平的。

    首先前面到的任务,如果线程池的核心线程已经分配出去了,此时这个任务就会进入任务队列,那么如果任务队列满了之后,新到的任务会直接由线程池新创建线程去处理,直到线程数达到最大线程数。

    那么此时,任务队列中的任务,虽然先添加进线程池等待处理,但是这些任务的处理时机,是晚于后续新创建线程去处理的任务的,所以说仅从任务的角度,依然是非公平的。

    三、小结时刻

    本文我们聊到了线程池中,对于线程数量的增长和收缩策略。

    在这里我们简单总结一下:

    1. 增长策略。默认情况下,线程池是根据任务先创建足够核心线程数的线程去执行任务,当核心线程满了时将任务放入等待队列。待队列满了的时候,继续创建新线程执行任务直到到达最大线程数停止。再有新任务的话,那就只能执行拒绝策略或是抛出异常。

    2. 收缩策略。当线程池线程数量大于核心线程数 && 当前有空闲线程 && 空闲线程的空闲时间大于 keepAliveTime 时,会对该空闲线程进行回收,直到线程数量等于核心线程数为止。

    总之要谨记,慎用无界队列。

    在过去的几十年间,大量的编程语言被发明、被取代、被修改或组合在一起。尽管人们多次试图创造一种通用的程序设计语言,却没有一次尝试是成功的。之所以有那么多种不同的编程语言存在的原因是,编写程序的初衷其实也各不相同;新手与老手之间技术的差距非常大,而且有许多语言对新手来说太难学;还有,不同程序之间的运行成本(runtime cost)各不相同。

课课家教育

未登录