僵尸进程

什么是僵尸进程

僵尸进程是指它的父进程已经退出(父进程没有等待(调用wait/waitpid)它),而该进程dead之后没有进程接受,就成为僵尸进程,也就是(zombie)进程。

产生原因

一个进程在调用exit命令结束自己的生命的时候,其实它并没有真正的被销毁,而是留下一个称为僵尸进程(Zombie)的数据结构 (系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。

在Linux进程的状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保 留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。它需要它的父进程来为它收尸。

如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,如果这时父进程结束了,那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。

但是如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。系统所能使用的进程号是有限的,如果大量的产生僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程。(ps -ef|grep defunc查看僵尸进程)

如何避免

  • 父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起;
  • 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler,因为子进程结束后,父进程会收到该信号,可以在handler中调用wait回收;
  • 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCHLD, SIG_IGN) 通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,并不再给父进程发送信号;

如何处理

  • 改写父进程

  • kill -18 PPID (PPID是其父进程)

    这个信号是告诉父进程,该子进程已经死亡了,请收回分配给他的资源。

  • 终止父进程

    kill -15 PPID

调度程序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main(int argc,char *argv[])
{
if (argc<3)
{
printf("Using:./procctl timetvl program argv ...\n");
printf("Example:/project/tools1/bin/procctl 5 /usr/bin/tar zcvf /tmp/tmp.tgz /usr/include\n\n");

printf("本程序是服务程序的调度程序,周期性启动服务程序或shell脚本。\n");
printf("timetvl 运行周期,单位:秒。被调度的程序运行结束后,在timetvl秒后会被procctl重新启动。\n");
printf("program 被调度的程序名,必须使用全路径。\n");
printf("argvs 被调度的程序的参数。\n");
printf("注意,本程序不会被kill杀死,但可以用kill -9强行杀死。\n\n\n");

return -1;
}

// 关闭信号和IO,本程序不希望被打扰。
for (int ii=0;ii<64;ii++)
{
signal(ii,SIG_IGN); close(ii);
}

// 生成子进程,父进程退出,让程序运行在后台,由系统1号进程托管。
if (fork()!=0) exit(0);

// 启用SIGCHLD信号,让父进程可以wait子进程退出的状态。
signal(SIGCHLD,SIG_DFL);

char *pargv[argc];
for (int ii=2;ii<argc;ii++)
pargv[ii-2]=argv[ii];

pargv[argc-2]=NULL;

while (true)
{
if (fork()==0)
{
execv(argv[2],pargv);
exit(0);
}
else
{
int status;
wait(&status);
sleep(atoi(argv[1]));
}
}
}