Linux进程状态简介教程
查看进程状态
- -
在Linux常用以下两个命令查看进程状态:
ps -ef
ps aux
这两个命令都可以列出所有进程及其状态,具体各命令的含义可以参考man手册。
下文以使用ps aux
为例,会列出 USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
各列。
本文主要探讨列出的信息中的STAT
列,它表示的是当前进程的状态。
进程状态
- -
进程的状态可能是R(task_running)、S(task_interruptible)、D(task_uninterruptible)、T(task_stopped/task_traced)、Z(task_dead/exit_zombie)、X(task_dead/exit_dead)
,具体如下:
- R: 可执行状态。
- 只有在该状态的进程才可能在CPU上运行。
- 同一时刻可能有多个进程处于可执行状态,这些进程的task\_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。
- 进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。
- S: 可中断的睡眠状态。
- 处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。
- 这些进程的task\_struct结构被放入对应事件的等待队列中。
- 当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。
- 一般情况下,进程列表中的绝大多数进程都处于TASK\_INTERRUPTIBLE状态(除非机器的负载很高)。
- D: 不可中断的睡眠状态。
- 与TASK\_INTERRUPTIBLE状态类似,进程处于睡眠状态,但是此刻进程是不可中断的。
- 不可中断,指的并不是CPU不响应外部硬件的中断,而是指进程不响应异步信号,如
kill -9
将不能杀死该进程。 - TASK\_UNINTERRUPTIBLE状态存在的意义就在于,内核的某些处理流程是不能被打断的(一般是底层操作,并且该状态通常非常短暂,ps基本捕获不到)。
- T: 暂停状态或跟踪状态。
- 当进程正在被跟踪时,它处于TASK\_TRACED这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行操作(如gdb中对进程下一个断点)。
- 向进程发送一个SIGSTOP信号,它就会因响应该信号而进入TASK\_STOPPED状态(除非该进程本身处于TASK\_UNINTERRUPTIBLE状态而不响应信号)。
- 向进程发送一个SIGCONT信号,可以让其从TASK\_STOPPED状态恢复到TASK\_RUNNING状态。
- 对于进程本身来说,TASK\_STOPPED和TASK\_TRACED状态很类似,都是表示进程暂停下来。
- 而TASK\_TRACED状态相当于在TASK\_STOPPED之上多了一层保护,处于TASK\_TRACED状态的进程不能响应SIGCONT信号而被唤醒。只能等到调试进程通过ptrace系统调用执行PTRACE\_CONT、PTRACE\_DETACH等操作(通过ptrace系统调用的参数指定操作),或调试进程退出,被调试的进程才能恢复TASK\_RUNNING状态。
- Z: 退出状态,进程成为僵尸进程。
- 进程在退出的过程中,处于TASK\_DEAD状态。
- 退出过程中,进程占有的所有资源将被回收,除了task\_struct结构(以及少数资源)以外。于是进程就只剩下task\_struct这么个空壳,故称为僵尸。
- 之所以保留task\_struct,是因为task\_struct里面保存了进程的退出码、以及一些统计信息。而其父进程很可能会关心这些信息(如shell中的$?变量)。
- 父进程可以通过wait系列的系统调用(如wait4、waitid)来等待某个或某些子进程的退出,并获取它的退出信息。然后wait系列的系统调用会顺便将子进程的尸体(task\_struct)也释放掉。
- 子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。
- 当进程退出的时候,会将它的所有子进程都托管给别的进程(可能是退出进程所在进程组的下一个进程,或者是1号进程)。所以每个进程、每时每刻都有父进程存在。除非它是1号进程。
- 1号进程,pid为1的进程,又称init进程。系统启动后,第一个被创建的用户态进程就是init进程。它不会被暂停、也不会被杀死(这是由内核来保证的)。它在等待子进程退出的过程中处于TASK\_INTERRUPTIBLE状态,“收尸”过程中则处于TASK\_RUNNING状态。
- 对于用户应用程序,如果进程退出后仍然存在僵尸进程,则说明程序内有bug,有进程退出后没有被清理。
- X: 退出状态,进程即将被销毁。
- 而进程在退出过程中也可能不会保留它的task\_struct。比如这个进程是多线程程序中被detach过的线程,或者父进程通过设置SIGCHLD信号的handler为SIG\_IGN,显式的忽略了SIGCHLD信号。
- 此时,进程将被置于EXIT\_DEAD退出状态,这意味着接下来的代码立即就会将该进程彻底释放
- EXIT\_DEAD状态是非常短暂的,几乎不可能通过ps命令捕捉到。
进程状态的变迁
- -
进程是通过fork系列的系统调用(fork、clone、vfork)来创建的,内核(或内核模块)也可以通过kernel\_thread函数创建内核进程。
这些创建子进程的函数本质上都完成了相同的功能——将调用进程复制一份,得到子进程。(可以通过选项参数来决定各种资源是共享、还是私有。)
尽管进程状态有好几种,但是进程状态的变迁却只有两个方向:
- 从TASK\_RUNNING状态变为非TASK\_RUNNING状态
- 从非TASK\_RUNNING状态变为TASK\_RUNNING状态
具体来说:
- 进程从非TASK\_RUNNING状态变为TASK\_RUNNING状态,是由别的进程(也可能是中断处理程序)执行唤醒操作来实现的。执行唤醒的进程设置被唤醒进程的状态为TASK\_RUNNING,然后将其task\_struct结构加入到某个CPU的可执行队列中。于是被唤醒的进程将有机会被调度执行。
进程从TASK\_RUNNING状态变为非TASK\_RUNNING状态,则有两种途径:
- 响应信号而进入TASK\_STOPED状态、或TASK\_DEAD状态
- 执行系统调用,如主动进入TASK\_INTERRUPTIBLE状态(如nanosleep系统调用)、或TASK\_DEAD状态(如exit系统调用);或由于执行系统调用需要的资源得不到满足,而进入TASK\_INTERRUPTIBLE状态或TASK\_UNINTERRUPTIBLE状态(如select系统调用)。
小结
- -
查看进程状态是调试Linux程序的必备技能,一般情况下,进程状态会是前三种情况。
在程序调试中,处于Z状态的程序也不少见,通过查看进程状态,方便定位问题。
参考资料
- -
Linux进程状态解析 之 R、S、D、T、Z、X (主要有三个状态)
guotianqing发布了131 篇原创文章 · 获赞 185 · 访问量 38万+ 私信 关注