进程创建

fork

#include <unistd.h>
pid_t fork(void);

操作系统做了什么？

调用fork之后，内核的工作：

分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回，开始调度器调度

进程 = 内核数据结构 + 代码和数据

创建子进程的过程就是：创建子进程的内核数据结构，即task_struct + mm_struct + paper_table等等，继承父进程的代码，同时拷贝数据。

fork之后，操作系统会create一个新的process，copy_process，copy_mem，把父进程的所有资源（包括代码段，数据段、堆栈数据等），以及寄存器的值继承给子进程。之后再以写时拷贝的形式保证进程的数据独立性。

do_fork

int sys_fork(struct pt_regs *regs)
{return do_fork(SIGCHLD, regs->sp, regs, 0, NULL, NULL);
}asmlinkage int sparc_do_fork(unsigned long clone_flags,unsigned long stack_start,struct pt_regs *regs,unsigned long stack_size)
{unsigned long parent_tid_ptr, child_tid_ptr;unsigned long orig_i1 = regs->u_regs[UREG_I1];long ret;parent_tid_ptr = regs->u_regs[UREG_I2];child_tid_ptr = regs->u_regs[UREG_I4];ret = do_fork(clone_flags, stack_start,regs, stack_size,(int __user *) parent_tid_ptr,(int __user *) child_tid_ptr);/* If we get an error and potentially restart the system* call, we're screwed because copy_thread() clobbered* the parent's %o1.  So detect that case and restore it* here.*/if ((unsigned long)ret >= -ERESTART_RESTARTBLOCK)regs->u_regs[UREG_I1] = orig_i1;return ret;
}

fork返回之后，两个进程的PC指针都指向fork函数之后的代码，但实际上是父子进程共享了整个代码。子进程运行的时候是从pc指针中取值得到下一次运行的代码的地址。
当然，子进程完全可以通过goto等方法让执行流回到fork之前的地方。

一个有趣的现象

#include <stdio.h>
#include <unistd.h>
#include <cstdlib>int main()
{printf("我是父进程，我要来执行fork了\n");pid_t id = fork();again:  printf("这是fork之后的代码，子进程跳转后才能访问到的\n");if(id == 0){printf("我是子进程 pid = %d, ppid = %d\n",getpid(), getppid());for(int i = 0; i < 3; i++)sleep(1);printf("子进程要跳转了\n");goto again;exit(1);}while(1){printf("我是父进程 pid = %d, ppid = %d\n",getpid(), getppid());for(int i = 0; i < 3; i++){sleep(1);}break;}return 0;
}

Ctrl+C杀掉进程后，命令行开始提供服务，过了一会还会继续打印？这里看起来是Ctrl+C不起作用？
这不难理解，./a.out之后，运行的是从始至终的父进程，父进程会被杀掉，但是子进程还在一直运行。父进程挂掉之后，shell继续提供服务，但是子进程还在向显示器打印。要用kill命令发送信号杀掉子进程，子进程会进入终止态，但是因为父进程早就挂掉了，所以子进程会被init领养，之后被回收资源。

进程终止

进程退出

进程退出的场景：运行完毕，结果正确；运行完毕，结果不正确；运行没完毕，被终止。
echo $？命令可以查询最近一次进程执行完毕时对应进程的退出码，退出码是一个8位无符号数。

main函数为什么要return，return给谁，为什么是0？
为了向操作系统或者其他程序报告自己的运行状态。
函数的返回值为0表示成功，因为成功只有一个标志就行，不需要知道原因，失败可以有无数个原因。
例如STM32开发中调用MPU6050的DMP库的初始化函数，如果不成功会有多种错误原因，用正整数可以标识。

如何终止进程？

#include <unistd.h>
void _exit(int status);
void exit(int status);

正常终止

在main函数中return
用exit或者_exit函数
区别：exit会终止进程且刷新缓冲区，但是_exit不会。
调用exit，系统会关闭所有打开的流，刷新缓冲区，之后再调用_exit。

虽然status是int，但是操作系统会把int转换成uint，因为退出码的范围是0-255。所以exit(-1)时，echo $? 结果是255。

异常终止

如收到信号。

进程等待

为什么要等待？

如果子进程退出，父进程不回收就会变成僵尸进程，操作系统是无法杀死的，可能内存泄漏，除非父进程也结束了，子进程被操作系统领养。因此父进程应该等待子进程，回收子进程的资源，获取其退出信息，例如退出码。

如何进程等待？

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int* status);
pid_t waitpid(pid_t pid, int* status, int options);

调用这两个函数，可以从task_struct中拿到进程的退出状态，退出状态是进程退出后仍留在数据结构中的。

wait

wait的参数是输出型参数，等待任意一个子进程，并输出退出信息。

waitpid

pid：-1表示任意进程，大于0的数表示要等待的进程的pid。
status：该进程的退出状态。
options：0表示阻塞等待、WNOHANG表示非阻塞等待。
返回值：大于0表示等待成功，并且进程已退出；等于0表示等待成功，但是进程还没有退出。

进程阻塞

调用scanf和cin的时候，没有输入就会一直等待，task_struct的R状态变为S状态，从运行队列转移到等待队列。

非阻塞等待

等待的时候如果事件没就绪就直接返回，执行别的东西，待会再来检查。多次调用费阻塞等待接口的检测行为称为轮询检测。

等待的结果

退出码的组成

status的低八位是进程的退出信号，高8位是进程的退出码。当进程被杀死了还会有一个core_dump标志位。

printf("退出信号 = %d, 退出码 = %d\n", (status & 0x7F), (status >> 8) & 0x7F);

例如：当用kill杀死进程的时候，比如kill -9 进程，进程的低八位就会收到9号信号。
如果一个进程收到信号，就说明进程出现异常，这时候退出码就没用了，因为不是正常退出，所以只关心收到的信号。

进程替换

什么是进程替换？

之前创建进程后，父子进程共享代码。如果想让子进程执行其他逻辑呢？

进程替换不会创建新进程，因为进程替换只是将该进程的数据替换为指定的可执行程序。而进程PCB没有改变，所以不是新的进程，pid不变。
进程替换后，如果替换成功则开始执行新程序，原替换函数之后的代码不会执行，因为进程替换是覆盖式的替换，替换成功后进程原来的代码就消失了。如果进程替换失败则会执行原替换函数后的代码。

原理

将磁盘中的别的程序加载到内存中，通过写时拷贝，重新建立页表的映射，将原子进程中数据段和代码段的映射改变为到别的程序的映射，这样父子进程的代码和数据就完全分离了。

进程替换的接口

#include <unistd.h>
int execl (const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);int execv (const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

execl

path：用来替换的程序路径：/usr/bin/ls，也可以是相对路径。要执行一个程序，系统需要知道如何执行这个程序，就要带参数：ls -a -l
arg：表示可变参数，用于传入选项。以NULL为终止符表示参数传递完毕。
返回值不用判断，因为替换成功不会返回，替换失败将会执行原文件后续代码。
调用方式：execl ("/usr/bin/ls", "ls", "-a", "-l", NULL);

execlp

（p代表环境变量path）

file：要替换的程序名，可以是相对路径，也可以在环境变量中搜索。
arg：可变参数，跟上面一样。
返回值：不用判断
调用方式：execlp(“./hello”,“./hello” ,NULL);

execv和execvp

跟execl的区别是可变参数变成字符串数组。

char* commands[] = {"./hello", NULL};                                        
std::cout << "我要替换了\n";
execv("./hello",commands);

execle和execve

则是可以自己导入环境变量。

Linux——进程控制：创建、终止、等待、替换