【Linux】进程控制 — 进程终止 + 进程等待

news/2024/11/15 3:47:25/

文章目录

  • 📖 前言
  • 1. 再次理解fork()函数
    • 1.1 fork()之后子进程代码和数据问题:
    • 1.2 fork()之后操作系统做了什么:
    • 1.3 为什么要写时拷贝??
  • 2. 进程终止
    • 2.1 main函数的返回值:
    • 2.2 exit() 和 _exit():
    • 2.3 关于终止,内核做了什么??
  • 3. 进程等待
    • 3.1 为什么要有进程等待:
    • 3.2 wait():
    • 3.3 waitpid():
    • 3.4 获取子进程status:
    • 3.5 阻塞等待
    • 3.6 非阻塞等待
  • 4. makefile的新增知识点

📖 前言

在此之前,我们学过进程的概念,进程的状态,进程地址空间等一系列进程相关的问题。本章我们继续学习进程,我们要来学习一下进程的控制,关于进程等待,进程替换等问题。


1. 再次理解fork()函数

1.1 fork()之后子进程代码和数据问题:

在此之前我们学过如何创建子进程【复习传送门】,我们之前讲的是,fork之后父子进程共享代码,在学完【进程地址空间】,之后我们知道进程具有独立性,所以进程之间为了做到互不影响,所以在创建子进程时候,一旦子进程要对父进程的数据进行修改时,就会发生写时拷贝。

  • fork之前父进程独立执行,fork之后,父子两个执行流分别执行
  • fork之前只有父进程执行
  • fork之后父子进程代码共享
  • 进程具有独立性,代码和数据必须独立的
  • 因为代码只能读取,所以就不会有人写入,更不会发生写实拷贝
  • 这就是父子进程代码共享的原因
  • 通常父子代码共享,父子再不写入时,数据也是共享的
  • 当任意一方试图写入,便以写时拷贝的方式各自一份副本
  • 那么fork之后,是否只有fork之后的代码是被父子进程共享的??
  • 这种说法并不准确
  • 一般情况下,fork之后,父子共享所有的代码!!
  • fork之后本质上是父子将所有的代码全部都共享了,只不过子进程只能从这里(fork)开始执行。
  • fork之后,父子进程谁先运行并不能给答案,是调度器给答案。

所以,fork之前父进程独立执行,fork之后,父子两个执行流分别执行。 注意,fork之后, 谁先执行完全由调度器决定。

子进程执行的后续代码 != 共享的所有代码只不过子进程只能从这里开始执行!!

为什么:?

  • eip程序计数器会拷贝给子进程,子进程便从该eip所指向的代码处开始执行啦!
    在这里插入图片描述
  • eip叫做:保存当前正在执行指令的下一条指令(保存当前进程执行到什么位置)
  • 也叫做:pc指针
  • eip属于当前父进程的上下文,会被拷贝到子进程当中

fork之后的代码父子都会跑,但并不代表,之 前的代码子进程不能拿到。如果愿意是可以拿到的,怎么个愿意法呢?
将子进程的eip改成main函数的入口,子进程就从头开始执行了,这种情况是存在的。

总结:

  • fork之后父子进程必须保证独立性,就必须保证代码和数据互相独立,数据以写时拷贝的方式互相独立,代码是共享的。

1.2 fork()之后操作系统做了什么:

  • 进程调用fork,当控制转移到内核中的fork代码后,内核做:
  • 分配新的内存块和内核数据结构给子进程
  • 将父进程部分数据结构内容拷贝至子进程
  • 添加子进程到系统进程列表当中
  • fork返回,开始调度器调度
  • 进程 = 内核的进程数据结构 + 进程的代码和数据

创建子进程的内核数据结构(struct task_struct + struct mm_struct + 页表) + 代码继承父进程,数据以写时拷贝的方式,来进行共享或者独立。

1.3 为什么要写时拷贝??

在这里插入图片描述
创建子进程的时候,就把数据分开,不行吗??

  • 父进程的数据,子进程不一定全用,即便使用,也不一定全部写入(会有浪费空间的嫌疑)。
  • 最理想的情况,只有会被父子修改的数据,进行分离拷贝。不需要修改的共享即可(但是从技术角度实现复杂)。
    • 如果我只把我用的数据拷贝一份,如果这个拷贝的数据我不写的话,那么这不还是浪费空间吗?
    • 就像char*p = "hello world",只读的并不写入,此时就不需要两份。
    • 更重要的是这种技术很难实现,只有子进程的代码跑了才知道要用什么数据,要修改什么变量。
  • 如果fork的时候,就无脑拷贝数据给子进程,会增加fork的成本(内存和时间)。

所以最终采用写时拷贝:

  • 只会拷贝父子修改的,变相的,就是拷贝数据的最小成本。
  • 拷贝的成本依旧存在。

写时拷贝是一种延迟拷贝的策略~~

写时拷贝(Copy-On-Write,简称COW)是一种延迟拷贝(Lazy Copy)技术。它在需要修改共享资源时,会先复制一份相应的资源副本,并且只有在修改时才会将原始资源复制一份,从而避免了不必要的复制和浪费。这种技术可以用于内存管理、文件系统等方面,可以提高系统的性能和资源利用率。由于写时拷贝只有在需要修改时才会进行复制,因此也被称为“延迟拷贝”技术。

最大的价值:

  • 只有真正使用的时候,才给写实拷贝。

最大的意义:

  • 需要时,但是不立马使用的空间,先不给该空间。
  • 那么也就意味着该控件,可以先给别的需要用的地方。
  • 变相的提高内存的使用率!!

写时拷贝本身就是有OS的内存管理模块完成的!


2. 进程终止

2.1 main函数的返回值:

我们在学习C/C++的时候,main,是入口函数,而我们清一色return 0

  • return 0,给谁return?
    • 让父进程读取的,表征进程退出的信息。
  • 为什么是return 0,其他值可以吗?

可以使其他返回值,进程代码跑完,结果是否正确:

  • 0:sucessy
  • 非零:失败()

main函数的代码,应该在实现对应逻辑的时候,对要完成的工作做判定,代码跑完结果正确才能返回0,否则返回非零值。

成功了话,知道成功就可以了,失败的话:

  • 最想知道的是,失败的原因!
  • 所以:非零标识不同的原因!
  • return X,X进程退出码。
  • echo内置命令, 让bash执行自己内部的函数:

我们把退出码设置成非零:

#include <stdio.h>int main()
{return 123;
}

在bash中,最近一次执行完毕时,对应进程的退出码!

在这里插入图片描述
系统中指令代码可没有无脑return 0,当我们随便输入一个指令的时候:

在这里插入图片描述
一般而言,失败的非零值我该如何设置呢??以及默认表达的含义?

  • 我们可以自定义
  • 错误码退出码可以对应不同的错误原因,方便定位问题!

2.2 exit() 和 _exit():

常见进程退出:

  1. 代码跑完,结果正确。
  2. 代码跑完,结果不正确。
  3. 代码没跑完,程序异常了。

进程的结果鉴定是由退出码和退出信号共同决定。

终止的创建做法:

  • 1.在main函数中return。为什么其他函数不行呢??
    • 因为只有main函数return叫进程退出,其他地方叫函数返回
  • 2.在自己的代码任意地点中,调用exit() — 进程退出
    • 带的参数就是退出码。

exit() 和 _exit()的区别:

  • exit终止进程刷新缓冲区。
  • exit直接中止进程,不会有任何刷新操作。

exit():

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>void func()
{printf("hehe");exit(111);
}int main()
{func();return 123;
}

在这里插入图片描述
缓冲区刷新了~

_exit():
在这里插入图片描述
缓冲区没刷新~

exit调用了_exit:

在这里插入图片描述

2.3 关于终止,内核做了什么??

  • 进程 = 内核的进程数据结构 + 进程的代码和数据

首先进入Z状态,父进程会去等待它回收子进程的信息,读取退出时的一些信息,然后将进程设置成X状态,这时才真正的退出,释放内核结构,释放曾经进程加载到内存所对应的代码和数据。

  • struct task_struct && struct mm_struct 都是数据结构,操作系统可能并不会释放该进程的内核数据结构。

Liunx可能会维护一张废弃的数据结构链表:

  • 创建对象:1. 要开辟空间,2. 要初始化,当反复高频这种操作时候,将会大大影响效率。
  • 内核的数据结构缓冲池,slab分派器(在操作系统里面)
    • 高频的操作,直接就不再对结构重新申请。
    • 直接将数据结构缓存起来,要就拿,不要就还回来。

3. 进程等待

3.1 为什么要有进程等待:

  • 之前讲过,子进程退出,父进程如果不管不顾,就可能造成僵尸进程的问题,进而造成内存泄漏。
  • 另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼” 的kill -9也无能为力,因为谁也没有办法杀死一个已经死去的进程。
  • 父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。

进程等待是必要的:

  • 不是所有父进程都需要关心子进程。
  • 一个进程应该获取子进程的退出状态。
  • 进程的退出是有退出码的,要获取进程的退出状态

确实存在一些情况,父进程不等待子进程的情况,信号部分讲解…

3.2 wait():

  • 将进程由僵尸状态变为释放状态:

在这里插入图片描述

pid_t wait(int *status);
  • status为输出型参数,获取子进程退出状态,不关心则可以设置成为NULL~~
  • 等待成功时,返回进程的pid,等待失败则返回-1

wait等待代码演示:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>int main()
{pid_t id = fork();if(id == 0){//子进程创建成功while(1){printf("我是子进程, 我正在运行...Pid: %d\n", getpid());sleep(1);}}else{//父进程//想看到等待成功之后僵尸进程就不见了printf("我是父进程:pid:%d, 我准备电脑等待子进程啦\n", getpid());sleep(30);pid_t ret = wait(NULL);if(ret < 0){printf("等待失败!\n");}else {printf("等待成功: result: %d\n", ret);}//父进程等20后再退出sleep(20);}
}

看到三个状态:

  1. 子进程由S状态变成Z状态
  2. Z状态在打印完 “等待成功” 时候就没了
  3. 等待的返回值就是子进程的pid
  • 要在30s之内将子进程干掉,干掉之后未满30s的时候子进程处于僵尸状态~~
  • 30s之后父进程一醒来就直接把子进程回收掉,就看到了Z状态没了(子进程被掉了)。
  • wait之后子进程就相当于退出了。

写一个监控脚本:

while :; do ps axj | head -1 && ps axj |  grep test | grep -v grep ; echo "--------------------------------------------------------------------"; sleep 1; done

kill -9之后,子进程处于僵尸状态:

在这里插入图片描述
父进程醒来之后直接把僵尸状态的子进程回收掉了:

在这里插入图片描述
wait()的方案可以解决回收子进程Z状态,让子进程进入X。

3.3 waitpid():

pid_t waitpid(pid_t pid, int *status, int options);

返回值:

  • 返回值大于0:等待子进程成功,返回值就是子进程的pid
  • 返回值小于0:等待失败
  • 当正常返回的时候waitpid返回收集到的子进程的进程ID
  • 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0
  • 如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在

pid:

  • pid值大于0:是几就代表等待哪一个子进程, 指定等待
  • pid值等于-1:等待任意进程

status:

  • 这个参数,是一个输出型参数。
  • 通过调用该函数,从函数内部拿出来特定的数据。
  • WIFEXITED(status):若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
  • WEXITSTATUS(status):若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)

wait/waitpid()是系统统调,通过输出型参数从从子进程的task_ struct中拿出子进程退出的退出码!

子进程会将自己的退出信息写入task_ struct~~

子进程一旦死掉,父进程直接把子进程退出码拷贝到自己(通过waitpid传进来的int* status参数,父进程就拿到了子进程的退出结果)

options:

  • 0:阻塞等待
  • WNOHANG:若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID。(非阻塞等待)

3.4 获取子进程status:

  • wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
  • 如果传递NULL,表示不关心子进程的退出状态信息。
  • 否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。

status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位):
在这里插入图片描述
次低八位得到子进程的退出码,最低七位是终止信号。

3.5 阻塞等待

如果子进程还在运行,则父进程会被阻塞等待,直到子进程退出或被终止,才能继续执行下去。

阻塞等待,父进程等的时候,子进程压根没退出的,父进程只能阻塞式的等,只有等到子进程退出之后才能正式拿出来这里的int* status

阻塞等待验证:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>int main()
{pid_t id = fork();if(id == 0){//子进程创建成功while(1){printf("我是子进程, 我正在运行...Pid: %d\n", getpid());sleep(1);int* p = NULL;*p = 100;}}else{//父进程int status = 0;printf("我是父进程:pid:%d, 我准备电脑等待子进程啦\n", getpid());pid_t ret = waitpid(id, &status, 0);if(ret > 0){//status >> 8 并不影响status的值//status >>= 8 才影响status的值printf("wait success, ret : %d, 我所等待子进程的退出码: %d, 退出信号是: %d\n", ret, (status >> 8) & 0xFF, status & 0x7F);}}return 0;
}

我们只需要对status进行位操作,就能拿到对应的退出码和退出信号。

我们很显然做了一个对空指针的解引用:

在这里插入图片描述
我们能看到退出信号是11号信号,我们来看一下11号信号是什么:

在这里插入图片描述
SIGSEGV的全称是Segmentation Violation,即”段错误”。

用宏来获取退出码:

在这里插入图片描述

3.6 非阻塞等待

与阻塞等待不同的是,非阻塞等待不是子进程不退出就一直在那里等,而是多次调用非阻塞接口轮询检测!

非阻塞等待时,条件不满足会直接就返回,此时用户不会因为调用了waitpid () ,让自己阻塞住,一旦条件不满足该函数会立刻返回,父进程或者用户可以继续在返回之后空闲时间段内,做自己的事,做一会之后再去调用waitpid(),这种监测方式叫做非阻塞。

验证非阻塞等待:

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>//非阻塞等待验证
int main()
{pid_t id = fork();if(id == 0){//子进程 //死循环跑不完,但是代码出现异常了,进程收到信号,信号终止了子进程,父进程就要知道while(1){printf("我是子进程,我的PID : %d, 我的PPID : %d\n", getpid(), getppid());sleep(3);}exit(111);}else if(id > 0){//父进程//基于非阻塞的轮询等待方案int status = 0;while(1){pid_t ret = waitpid(-1, &status, WNOHANG);if(ret > 0){   printf("等待成功, %d, exit sig: %d, exit code: %d\n", ret, status & 0x007F, (status & 0xFF00) >> 8);break;}else if(ret == 0){           //等待成功了,但是子进程没有退出 -- 函数调用成功了,只不过是在非阻塞状态printf("子进程好了没,还没,那么父进程就做其他事情...\n");sleep(1);}else {//出错了,暂时不处理}}}else {//do nothing         }return 0;
}

在非阻塞等待的时候,子进程还没退出,父进程虽然是在等子进程,但是不是卡住在那里等待,而是可以做其他的事情:

#include <iostream>
#include <vector>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>typedef void (*handler_t)();std::vector<handler_t> handlers;void func1()
{printf("hello, 我是方法1\n");
}void func2()
{printf("hello, 我是方法2\n");
}void func3()
{printf("hello, 我是方法3\n");
}void Load()
{//加载方法 -- 如果让父进程做更多的事情,把更多的方法加载进去就可以了handlers.push_back(func1);handlers.push_back(func2);handlers.push_back(func3);
}//C++方法集
int main()
{pid_t id = fork();if(id == 0){//子进程 //死循环跑不完,但是代码出现异常了,进程收到信号,信号终止了子进程,父进程就要知道while(1){printf("我是子进程,我的PID : %d, 我的PPID : %d\n", getpid(), getppid());sleep(3);}exit(111);}else if(id > 0){//父进程//基于非阻塞的轮询等待方案int status = 0;while(1){pid_t ret = waitpid(-1, &status, WNOHANG);if(ret > 0){   printf("等待成功, %d, exit sig: %d, exit code: %d\n", ret, status & 0x007F, (status & 0xFF00) >> 8);break;}else if(ret == 0){           //等待成功了,但是子进程没有退出 -- 函数调用成功了,只不过是在非阻塞状态printf("子进程好了没,还没,那么父进程就做其他事情...\n");if(handlers.empty()) Load();for(auto f : handlers){f(); //回调处理对应的任务 }sleep(1);}else {//出错了,暂时不处理}}}else {//do nothing         }return 0;
}

上述代码用了回调函数来实现调用方法。

补充:

  • 阻塞的本质是进程阻塞,把进程阻塞是要改进程状态的,R -> S
  • 把进程的PCB从运行队列放到等待队列,这都是操作系统干的。
  • waitpid0恰好是系统调用,内部的代码里面,就自动会有对进程的一系列操作。

当我们调用某些函数的时候,因为条件不就绪,需要我们阻塞等待,本质:就是当前进程自己变成阻塞状态,等条件就绪的时候,在被唤醒!


4. makefile的新增知识点

在这里插入图片描述


http://www.ppmy.cn/news/74977.html

相关文章

小航助学2023年3月GESP_C++二级试卷(含题库答题软件账号)

GESP在线模拟训练系统请点击 电子学会-全国青少年编程等级考试真题Scratch一级&#xff08;2019年3月&#xff09;在线答题_程序猿下山的博客-CSDN博客_小航答题助手 答案:D 第1题以下存储器中的数据不会受到附近强磁场干扰的是&#xff08; &#xff09;。 A、硬盘B、U 盘C…

RHCE第五次作业

1.总结变量的类型及含义&#xff1f; 2.实现课堂案例计算长方形面积&#xff1f;&#xff08;6种方式&#xff09; 3.定义变量urlhttps://blog.csdn.net/weixin_45029822/article/details/103568815&#xff08;通过多种方法实现&#xff09; 1&#xff09;截取网站访问的协议 …

求爷爷告奶奶,阿里大佬才甩出这份Spark+Hadoop+中台实战pdf

Spark大数据分析实战 1、Spark简介 初识Spark Sp ark生态系统BDAS Sp ark架构与运行逻辑 弹性分布式数据集 2、Spark开发与环境配置 Spark应用开发环境2置 使用Intelli i开发Spark 远程调试Spark程序 Spark编译 配置Spark源码阅读环境 3、BDAS简介 SQL on Spark S…

Swing简述

一、Swing概述 GUI&#xff08;图形用户界面&#xff09;为程序提供图形界面&#xff0c;它最初的设计目的是为程序员构建一个通用的GUI&#xff0c;使其能够在所有的平台上运行&#xff0c;但Java 1.0中基础类AWT&#xff08;抽象窗口工具箱&#xff09;并没有达到这个要求&a…

【C++】 排列与组合算法详解(进阶篇)

文章目录 写在前面算法1&#xff1a;朴素算法思路缺点 算法2&#xff1a;递推预处理思路时间复杂度&#xff1a; O ( n 2 ) O(n^2) O(n2) 算法3&#xff1a;阶乘逆元思路时间复杂度&#xff1a; O ( n log ⁡ n ) O(n \log n) O(nlogn)思考&#xff1a;读者也可以尝试写 O ( n…

一文读懂selenium自动化测试(基于Python)

前言 我们今天来聊聊selenium自动化测试&#xff0c;我们都知道selenium是一款web自动化测试的工具&#xff0c;它应该如何去运用呢?我们接着看下去。 ​1、Selenium简介&#xff1a; 1.1 Selenium&#xff1a; Selenium是一款主要用于Web应用程序自动化测试的工具集合。Sele…

CTF必看~ PHP反序列化漏洞6:绝妙_wakeup绕过技巧

作者&#xff1a;Eason_LYC 悲观者预言失败&#xff0c;十言九中。 乐观者创造奇迹&#xff0c;一次即可。 一个人的价值&#xff0c;在于他所拥有的。可以不学无术&#xff0c;但不能一无所有&#xff01; 技术领域&#xff1a;WEB安全、网络攻防 关注WEB安全、网络攻防。我的…

RocketMQ学习

各MQ 并发性能比较 吞吐量 kafka 17.3w/s rocketMQ 11.6w/s RabbitMQ 5.96w/s RocketMQ组件 broker 核心业务组件 nameServe 保存broker 的ip、端口、上下线信息等。 类似注册中心 启动nameServe 时会调用 runserver 启动broker &#xff0c;会默认读取/conf/broker.conf …