09Java线程(上)Java线程的生命周期
Java并发编程领域实现并发程序的主要手段就是多线程,线程是操作系统的一个概念。虽然各种语言都进行了封装,但是万变不离其操作系统。Java语言里面的线程本质上就是操作系统的线程,他们是一一对应的。
在操作系统层面,线程也有生老病死。专业的说法叫声明周期。对于有声明周期的事物,要学好它非常简单,只要搞懂声明周期中各个节点状态的转化就好了。
虽然不同语言进行了不同的封装,但是对于线程生命周期部分基本雷同。
我们先来看下通用的线程生命周期,再来看下Java中的线程生命周期。通用的线程生命周期
通用线程模型可以用如下模型来标识:这五态分别是:初始状态、可运行状态、运行状态、休眠状态、终止状态。
详细介绍如下:初始状态:线程已经被创建,但是还不允许分配CPU执行。这里的被创建是指编程语言层面,操作系统层面,真正的线程还未被创建。可运行状态:线程可以分配CPU执行。这个状态下,真正的操作系统线程已经被创建,所以可以分配CPU执行。当有空闲CPU时候,操作系统会分配一个给可运行状态的线程,被分配到CPU的线程转化为运行状态。运行状态的线程如果调用了一个阻塞的api,或者等待某个事件,那么线程的就会变为等待状态,同时释放CPU使用权,当等待的条件满足了,线程就会转化为可运行状态。线程运行完或者异常就会进去终止状态。终止桩体的线程不会切换到其他任何状态。进入终止桩体意味着线程生命周期结束了。
这五种状态不同的语言可能会有简化合并,Java语言把可运行状态和运行状态合并了。这两个状态在操作系统层面有调用。而JVM不关心这两个状态,因为JVM把线程调度交给操作系统执行了。Java中线程的声明周期
Java语言中线程有六种状态:new初始状态RUNNABLE可运行状态运行状态BLOCKED阻塞状态WAITING无时限等待TIMEDWAITING有时限等待TERMINATED终止状态
看上去很复杂,状态类型也比较多,其实在操作系统层面,Java线程中的BLOCKED、WAITING、TIMEDWAITING是一种状态,即前面我们提到的休眠状态。也就是说,只要Java线程处于这三种状态之一,那么这个线程就永远没有CPU的使用权。
所以Java线程的生命周期可以简化为:
其中,BLOCKED、WAITING、TIMEDWAITING可以理解为线程导致休眠状态的三种原因。那具体是哪些情形会导致线程从RUNNABLE转化到这三种状态呢?而这三种状态又是何时转换回RUNNABLE的呢?以及NEW、TERMINATED和RUNNABLE状态是如何转换的?RUNNABLE与BLOCKED的状态转换
只有一种场景会触发,就是线程等待synchronized的隐式锁,synchronized修饰的代码库、方法同一时刻只能有一个线程执行,其他线程只能等待,这种情况下,等待的线程就会从RUNNABLE转换到BLOCKED状态。而当等待的线程获取到了synchronized的隐式锁时,就又会从BLOCKED转换到RUNNABLE状态。
如果你熟悉操作系统声明周期,可能有疑问:线程调用阻塞API时,是否会转换到BLOCKED状态呢?操作系统层面是会转换到休眠状态,但是jvm层面Java线程是不会发生变化的,也就是说Java线程的状态依然保持RUNNABLE状态。JVM层面并不关心操作系统调度相关的状态,因为在JVM看来,等待CPU使用权(操作系统层面此时处于可执行状态)与等待IO(操作系统层面此时处于休眠状态)没有区别,都是在等待某个资源,所以都归入了RUNNABLE状态。
所以我们平时Java在调用阻塞式API时,线程会阻塞,指的是操作系统线程的状态,并不是Java线程的状态。RUNNABLE与WAITING的状态转换
第一场景,获得synchronized隐式锁的线程,调用无参数的Object。wait()方法,其中wait()方法我们在上一篇讲解管程的时候已经深入介绍过了,这里就不再赘述。
第二场景,调用无参数的Thread。join()方法。其中的join()是一种线程同步方法,例如有一个线程对象threadA,当调用A。join()的时候,执行这条语句的线程会等待threadA执行完,而等待中的这个线程,其状态会从RUNNABLE转换到WAITING。当线程threadA执行完,原来等待它的线程又会从WAITING状态转换到RUNNABLE。
第三场景,调用LockSupport。park()方法。其中的LockSupport对象,也许你有点陌生,其实Java并发包中的锁,都是基于它实现的。调用LockSupport。park()方法,当前线程会阻塞,线程的状态会从RUNNABLE转换到WAITING。调用LockSupport。unpark(Threadthread)可唤醒目标线程,目标线程的状态又会从WAITING状态转换到RUNNABLE。RUNNABLE与TIMEDWAITING的状态转换
有五种场景触发这种转换:
1、调用带有超时参数的Thread。sleep(longmillis)方法;
2、获得synchronized隐式锁的线程,调用带超时参数的Object。wait(longtimeout)方法;
3、调用带超时参数的Thread。join(longmillis)方法;
4、调用带超时参数的LockSupport。parkNanos(Objectblocker,longdeadline)方法;
5、调用带超时参数的LockSupport。parkUntil(longdeadline)方法。从NEW到RUNNABLE状态
Java刚创建出来的Thread就是NEW状态的,而创建Thread对象主要有两种方法。
一种是继承Thread对象,重写run()方法。
另一种是实现Runnable接口,重写run()方法,并将该实现类作为创建Thread对象的参数。
NEW状态的线程,不会被操作系统调度,因此不会被执行。Java线程要执行,就必须转换到RUNNABLE状态,从NEW状态转换到RUNNABLE状态很简单,只要调用线程对象的start()方法就可以了。从RUNNABLE到TERMINATED状态
线程执行完run()方法后,会自动转换到TERMINATED状态,当然如果执行run()方法的时候异常抛出,也会导致线程终止。有时候我们需要强制中断run()方法的执行,例如run()方法访问一个很慢的网络,我们等不下去了,想终止怎么办呢?Java的Thread类里面倒是有个stop()方法,不过已经标记为Deprecated,所以不建议使用了。正确的姿势其实是调用interrupt()方法。那stop()和interrupt()方法的主要区别是什么呢?
stop()方法会真的杀死线程,不给线程喘息的机会,如果线程持有ReentrantLock锁,被stop()的线程并不会自动调用ReentrantLock的unlock()去释放锁,那其他线程就再也没机会获得ReentrantLock锁,这实在是太危险了。
所以该方法就不建议使用了,类似的方法还有suspend()和resume()方法,这两个方法同样也都不建议使用了,所以这里也就不多介绍了。而interrupt()方法就温柔多了,interrupt()方法仅仅是通知线程,线程有机会执行一些后续操作,同时也可以无视这个通知。被interrupt的线程,是怎么收到通知的呢?一种是异常,另一种是主动检测。
当线程A处于WAITING、TIMEDWAITING状态时,如果其他线程调用线程A的interrupt()方法,会使线程A返回到RUNNABLE状态,同时线程A的代码会触发InterruptedException异常。上面我们提到转换到WAITING、TIMEDWAITING状态的触发条件,都是调用了类似wait()、join()、sleep()这样的方法,我们看这些方法的签名,发现都会throwsInterruptedException这个异常。这个异常的触发条件就是:其他线程调用了该线程的interrupt()方法。
当线程A处于RUNNABLE状态时,并且阻塞在java。nio。channels。InterruptibleChannel上时,如果其他线程调用线程A的interrupt()方法,线程A会触发java。nio。channels。ClosedByInterruptException这个异常;而阻塞在java。nio。channels。Selector上时,如果其他线程调用线程A的interrupt()方法,线程A的java。nio。channels。Selector会立即返回。
上面这两种情况属于被中断的线程通过异常的方式获得了通知。还有一种是主动检测,如果线程处于RUNNABLE状态,并且没有阻塞在某个IO操作上,例如中断计算圆周率的线程A,这时就得依赖线程A主动检测中断状态了。如果其他线程调用线程A的interrupt()方法,那么线程A可以通过isInterrupted()方法,检测是不是自己被中断了。
理解Java线程的各种状态以及生命周期对于诊断多线程Bug非常有帮助,多线程程序很难调试,出了Bug基本上都是靠日志,靠线程dump来跟踪问题,分析线程dump的一个基本功就是分析线程状态,大部分的死锁、饥饿、活锁问题都需要跟踪分析线程的状态。同时,本文介绍的线程生命周期具备很强的通用性,对于学习其他语言的多线程编程也有很大的帮助。