【从浅学到熟知Linux】进程间通信之匿名管道方式（进程间通信方式汇总、匿名管道的创建、匿名管道实现进程池详解）

在这里插入图片描述

🏠关于专栏：Linux的浅学到熟知专栏用于记录Linux系统编程、网络编程等内容。
🎯每天努力一点点，技术变化看得见

文章目录

进程间通信介绍
- 如何实现进程间通信
- 进程间通信分类
管道通信方式
- 什么是管道
- 匿名管道pipe
- 匿名管道读写规则
- 管道的特点
- 匿名管道的应用——进程池

进程间通信介绍

如何实现进程间通信

什么是通信？
所谓通信，就是要实现两个或多个进程实现数据层面的交互。而在操作系统中，为了保持进程的独立性，不允许其他进程访问某个进程的地址空间。正因为进程独立性的存在，导致进程的通信成本比较高。（因为A进程无法直接将通信数据写入B进程的地址空间中，而需要通过在两进程外部创建某个空间来实现进程的通信，故成本较高）。
为什么进程需要通信呢？
①数据传输：一个进程需要将它的数据发送给另一个进程；
②资源共享：多个进程之间共享同样的数据，当前进程需要将共享数据发送给需要该数据的进程；
③通知事件：一个进程需要向另一个或一组进程发送消息，通知它（它们）发送了某种事件（如：子进程退出时需要通知父进程）；
④进程控制：有些进程希望完全控制另一个进程的执行，控制进程希望能够知道另一个进程的状态改变，通过状态来确定如何控制。
实现进程间通信的思想是什么呢？
①进程间通信的本质，必须让不同的进程看到同一份进程外的“资源”（A进程向该资源写入信息，B进程从该资源中读取，从而实现通信）；
②“资源”就是特定形式的内存空间；
③这个“资源”谁提供？一般是操作系统提供的第三方空间。
④由于该空间是操作系统提供的，则通信进程访问该空间进行通信，本质就是访问操作系统。进程处于用户，而“资源”属于操作系统，即内核级。故该“资源”从创建、使用、到释放，都需要操作系统参与，因而操作系统需要提供对应的系统调用。一般操作系统会提供一个独立的通信系统——LPC通信模块（隶属于文件系统）。

★ps：为什么不是通信的两个进程中的一个，提供通信的“资源”呢？如果由A进程提供，则该资源属于A进程。若想实现通信，则B进程也要访问这个空间，则会破坏进程独立性。

进程间通信分类

进程间通信方式可以分为3类：管道、System V IPC、POSIX IPC三种方式。其中，System V版本常用于本机进程间通信，而POSIX版本常用于网络中不同主机间的进程间通信。

以下是上述三类通信方式包含的具体通信形式↓↓↓

管道方式

● 匿名管道pipe
● 命名管道fifo

System V IPC

● System V消息队列
● System V共享内存
● System V信号量

POSIX IPC

● 消息队列
● 共享内存
● 信号量
● 互斥量
● 条件变量
● 读写锁

上述列出的各个通信形式，将于本文及后序文章中陆续介绍，本文先介绍匿名管道。

管道通信方式

什么是管道

管道是Unix操作系统中最古老的进程间通信方式，我们将一个进程链接到另一个进程的数据流缓冲区称为一个“管道”。

【示例】当我们执行ps axj | grep test.c的时候，ps axj的标准输出结果写入到内核的管道中，grep test.c从该内核管道获取输入，将将结果输出给用户显示器。

在这里插入图片描述
★ps：建立通信为什么那么费劲？因为进程具有独立性。

匿名管道pipe

在这里插入图片描述

创建匿名管道的系统调用原型为int pipe(int pipefd[2]);。参数pipefd是文件描述符数组，其中pipefd[0]表示读端，pipefd[1]表示写端。

在这里插入图片描述
从上图可以看出，当需要进行通信时，需要通过pipefd[1]文件描述符，将数据拷贝到管道文件中；再通过pipefd[0]文件描述符，将管道文件中的数据拷贝到用户空间中。因而，管道通信时，需要产生两次拷贝。

下面是一个进程向管道内写入数据，并从管道内读取数据的代码↓↓↓

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>int main()
{int fds[2];pipe(fds);	//创建匿名管道//向匿名管道文件中写入数据char* msg = "Jammingpro";write(fds[1], msg, strlen(msg));//从匿名管道文件中读取输入char buffer[1024];ssize_t n = read(fds[0], buffer, sizeof(buffer));buffer[n] = '\0';printf("The info read from pipe is %s\n", buffer);return 0;
}

在这里插入图片描述

但我们创建匿名的目的是为了实现进程间的通信，在同一个进程内读写匿名管道文件并没有多大意义。由于匿名管道只能实现具有血缘关系的进程进行通信（如父子进程、兄弟进程、爷孙进程等具有血缘关系的进程），下面我们来探索父子进程如何进行匿名管道通信。↓↓↓

当父进程创建匿名管道时，则会在父进程的文件描述符表中，为匿名管道的读端和写端各分配一个文件描述符。
在这里插入图片描述
当父进程fork创建子进程时，子进程会继承父进程的文件描述符表，即子进程的3号和4号文件符和父进程一样，指向刚刚创建的匿名管道的读写端。

在这里插入图片描述
若我们希望子进程向父进程发送数据，则对于父进程来说，管道的写文件描述符的存在是没有意义的；对于子进程来说，管道的读文件描述符是没有意义的。我们可以将父进程的写文件描述符pipefd[1]和子进程读文件描述符pipefd[0]关闭。

在这里插入图片描述

下面我们实现一个子进程向父进程发送数据的代码↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>int main()
{int fds[2];pipe(fds);pid_t id = fork();if(id == 0)//子进程{close(fds[0]);int cnt = 10;while(cnt--){char buffer[1024];snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);write(fds[1], buffer, strlen(buffer));sleep(1);}close(fds[1]);exit(0);}//父进程close(fds[1]);char info[1024];while(true){ssize_t n = read(fds[0], info, sizeof(info) - 1);if(n != 0){info[n] = '\0';printf("get a info from child process! --> %s\n", info);}else{close(fds[0]);break;}}int status = 0;pid_t ret = waitpid(id, &status, 0);if(WIFEXITED(status)){printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));}return 0;
}

在这里插入图片描述
上面代码中，子进程每间隔1秒向管道中写入一条数据，我们并没有对父进程做任何限制。但父进程却可以实现每隔一秒从管道中读取数据。并且，子进程在写入时，父进程并没有立即读取，而是等子进程写完才读取（如果子进程在写的时候，父进程就开始读，就会出现读取的数据不完整的情况）。

由上面代码执行结果可知，管道具有同步机制，即只有写端写入数据后，读端才能读取，读写存在先后顺序。当读写端均正常时，写端没有写入时，读端会阻塞等待。当写端文件描述符关闭时，读端read返回结果为0，表示读到文件末尾。

那如果我们让读端每隔1秒读一次，写端不限制，则会出现什么情况呢↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>int main()
{int fds[2];pipe(fds);pid_t id = fork();if(id == 0)//子进程{close(fds[0]);int cnt = 100;while(cnt--){char buffer[1024];snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);write(fds[1], buffer, strlen(buffer));}close(fds[1]);exit(0);}//父进程close(fds[1]);char info[1024];while(true){ssize_t n = read(fds[0], info, sizeof(info) - 1);if(n != 0){info[n] = '\0';printf("get a info from child process! --> %s\n", info);}else{close(fds[0]);break;}sleep(10);}int status = 0;pid_t ret = waitpid(id, &status, 0);if(WIFEXITED(status)){printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));}return 0;
}

在这里插入图片描述
由上面程序执行结果可以看出，当读端没有读取匿名管道文件中的数据时，写端将匿名管道文件写满后，只能阻塞等待，待读端将数据读走后，才能继续写入。

由上面的程序执行结果我们可以得出，当读写端正常时，读端读的慢，则写端写满管道文件后会阻塞等待。

同时，从上面程序的执行结果来看。多次写入管道文件中的内容，被一次性读取出来，说明管道是基于字节流的。

那如果父进程的读端关闭，则写端会出现什么情况呢？↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/wait.h>int main()
{int fds[2];pipe(fds);pid_t id = fork();if(id == 0)//子进程{close(fds[0]);int cnt = 100;while(cnt--){char buffer[1024];snprintf(buffer, sizeof(buffer), "%d->child process sending a message", cnt);write(fds[1], buffer, strlen(buffer));sleep(1);}close(fds[1]);exit(0);}//父进程close(fds[1]);char info[1024];int count = 0;while(true){ssize_t n = read(fds[0], info, sizeof(info) - 1);if(n != 0){info[n] = '\0';printf("get a info from child process! --> %s\n", info);}else{close(fds[0]);break;}if(count == 2){close(fds[0]);break;}count++;}int status = 0;pid_t ret = waitpid(id, &status, 0);if(ret > 0){printf("exitcode = %d, sig = %d\n", WEXITSTATUS(status), (status & 0x7F));}return 0;
}

在这里插入图片描述
上面程序中，当父进程读取3次管道文件内容后，将父进程的读端文件描述符关闭。由程序执行结果可以看到，子进程收到了13号信号，即SIGPIPE信号。

匿名管道读写规则

由上面的多个代码执行结果，我们可以得到如下结论↓↓↓

读写端正常，若管道如果为空，读端就要阻塞；
读写端正常，若管道如果被写满，写端被阻塞；
读端正常读，写端关闭，读端就会读到0，表明读到pipe文件末尾。这种情况，读端并不会阻塞。
写端正常写，读端关闭，操作系统会用13号信号SIGPIPE杀死系统中正在写入的进程。

多执行流共享，难免出现访问冲突。例如，A进程本想向管道中写入"Hello World"，但当A进程写完"Hello"时，B进程就来读取，导致数据不完整。管道能提供协同机制（包含同步和互斥），对于同步来说，只有写端写入数据后，读端才能读取数据；对于互斥来说：先进来读写的进程要完成其读写任务后，下一个进程才能进行读写，不允许两个进程同时访问管道。

但对于管道的互斥机制来说，之后当管道内数据小于PIPE_BUF大小时，才能保证。当读写入的数据不大于PIPE_BUF时，Linux将可以保证写入的原子性，即保证写进程写入时没有进程读取，进程读取时没有其他进程写入。当读写数据大于PIPE_BUF大小时，Linux不再保证读写的原子性。

★ps：原子性操作表示只有两种结果的操作，这里的原子性读写操作表示读写成功或不进行读写。

管道的特点

具有血缘关系的进程才可以进行通信（常用于父子通信）；
管道是半双工的，数据只能单向流动；
父子进程是会进程协同的，匿名管道会提供同步与互斥机制——保护管道文件的数据安全；
管道提供面向流式的通信服务——面向字节流；
管道是基于文件的，而文件的生命周期是随进程的。当进程执行结束，则对应的匿名管道文件会被释放。

★ps：匿名管道只能让父子进程之间实现单向通信，如果我们需要实现双向通信，则需要使用两个管道。
在这里插入图片描述

★ps：如果两个进程不存在任何关系（不是父子进程、兄弟进程、爷孙进程等有血缘的关系），则这两个进程能不能通信呢？不能。进程之间必须有血缘关系，常用于父子进程。这种方式打开的管道文件，称为匿名管道。

管道是有固定大小的，不同内核里，大小可能有差异。我们可以使用ulimit -a查看当前系统中的匿名管道文件pipe的大小。↓↓↓ 在这里插入图片描述

匿名管道的应用——进程池

注意：进程池应用代码使用C++语言

当我们的系统中有大量的任务需要被处理时，我们可以将这些任务派发给各个子进程。但由于多次创建和销毁进程会带来较大的时间开销。我们可以通过提前创建一批子进程（避免需要时再创建），且子进程空闲时就阻塞等待（避免子进程执行完被销毁，下次需要子进程时还需要创建）。

实现上述需求时，我们需要借助匿名管道。通过在各个父子进程间建立匿名管道，实现父进程向指定子进程派发任务。↓↓↓

在这里插入图片描述
但需要注意的是，父进程不应该将大量任务集中派发给某个子进程，而让其他子进程处于空闲状态，这样会使得整机效率低下。我们可以通过轮询或随机派发的方式给子进程派发任务，实现负载均衡。

要给子进程派发任务，我们就需要先拥有任务（Task.hpp）↓↓↓

#include <iostream>
#include <vector>typedef void(*func_t)();void task1()
{std::cout << "昭君一技能" << std::endl;
}void task2()
{std::cout << "回城中..." << std::endl;
}void task3()
{std::cout << "大招特效" << std::endl;
}void task4()
{std::cout << "暴君降临" << std::endl;
}void LoadTask(std::vector<func_t>& tasks)
{tasks.push_back(task1);tasks.push_back(task2);tasks.push_back(task3);tasks.push_back(task4);
}

当我们创建进程池时，需要保存各个子进程的写端、进程PID和进程名称（写端是必须保存的，后两者只是为了调试时方便），故我们可以创建一个channel类，用于保存子进程信息↓↓↓

//先描述
class channel
{
public:channel(int cmdfd, pid_t slaverid, std::string processname):_cmdfd(cmdfd),_slaverid(slaverid),_processname(processname){}int _cmdfd;      //发送任务的文件描述符pid_t _slaverid; //子进程的PIDstd::string _processname;    //子进程的名字——方便打印日志信息
};

下面给出子进程处理任务的函数（子进程fork之后循环执行该函数代码）↓↓↓

std::vector<func_t> tasks;void slaver()
{while(true){int cmdcode = 0;int n = read(0, &cmdcode, sizeof(int)); //如果父进程没有给子进程发送，子进程阻塞等待if(n == sizeof(int)){   std::cout << getpid() << "收到一个任务，并开始执行：" << std::endl;tasks[cmdcode]();}if(n == 0){close(0);std::cout << getpid() << " quit" << std::endl;break;}}exit(0);
}

下面我们就要开始编写主体逻辑了，即进程池↓↓↓

std::vector<func_t> tasks;
const int processNum = 5;	//进程池中进程个数void InitProcessPull(std::vector<channel> *channels)
{std::vector<int> wfd;for(int i = 0; i < processnum; i++){int pipefd[2];      //临时空间int n = pipe(pipefd);assert(!n);(void)n;wfd.push_back(pipefd[1]);pid_t id = fork();if(id == 0) //child{for(auto e : wfd) close(e);dup2(pipefd[0], 0);slaver();exit(0);}//fatherclose(pipefd[0]);//添加channel字段std::string name = "process-" + std::to_string(i);channels->push_back(channel(pipefd[1], id, name));}
}

下面函数用于给进程池中的进程派发任务↓↓↓

std::vector<func_t> tasks;
const int processNum = 5;
void distribute(const std::vector<channel>& channels)
{for(int i = 0; i < 10; i++){//1.选择任务int cmdcode = rand() % tasks.size();//2.选择进程int processpos = rand() % channels.size();//3.发送任务write(channels[processpos]._cmdfd, &cmdcode, sizeof(int));sleep(1);}
}

下面是最终的进程池代码↓↓↓

#include "Task.hpp"
#include <iostream>
#include <string>
#include <vector>
#include <cstdlib>
#include <cassert>
#include <ctime>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>const int processnum = 5;
std::vector<task_t> tasks;//先描述
class channel
{
public:channel(int cmdfd, pid_t slaverid, std::string processname):_cmdfd(cmdfd),_slaverid(slaverid),_processname(processname){}int _cmdfd;      //发送任务的文件描述符pid_t _slaverid; //子进程的PIDstd::string _processname;    //子进程的名字——方便打印日志信息
};void slaver()
{while(true){int cmdcode = 0;int n = read(0, &cmdcode, sizeof(int)); //如果父进程没有给子进程发送，子进程阻塞等待if(n == sizeof(int)){   std::cout << getpid() << "收到一个任务，并开始执行：" << std::endl;tasks[cmdcode]();}if(n == 0){close(0);std::cout << getpid() << " quit" << std::endl;break;}}exit(0);
}//输入：const &
//输出：*
//输入输出：&void InitProcessPull(std::vector<channel> *channels)
{std::vector<int> wfd;for(int i = 0; i < processnum; i++){int pipefd[2];      //临时空间int n = pipe(pipefd);assert(!n);(void)n;wfd.push_back(pipefd[1]);pid_t id = fork();if(id == 0) //child{for(auto e : wfd) close(e);dup2(pipefd[0], 0);slaver();exit(0);}//fatherclose(pipefd[0]);//添加channel字段std::string name = "process-" + std::to_string(i);channels->push_back(channel(pipefd[1], id, name));}
}void debug(std::vector<channel>& channels)
{for(auto &c : channels){std::cout << c._cmdfd << " " << c._slaverid << " " << c._processname << std::endl;}
}void distribute(const std::vector<channel>& channels)
{for(int i = 0; i < 10; i++){//1.选择任务int cmdcode = rand() % tasks.size();//2.选择进程int processpos = rand() % channels.size();//3.发送任务write(channels[processpos]._cmdfd, &cmdcode, sizeof(int));sleep(1);}
}void clean(const std::vector<channel>& channels)
{for(int i = 0; i < channels.size(); i++){close(channels[i]._cmdfd);waitpid(channels[i]._slaverid, NULL, 0);}// 方式1// for(int i = 0; i < channels.size(); i++)// {//     close(channels[i]._cmdfd);// }// sleep(2);// for(int i = 0; i < channels.size(); i++)// {//     waitpid(channels[i]._slaverid, NULL, 0);// }
}int main()
{srand(time(nullptr));   //种随机数种子LoadTask(&tasks);//在组织std::vector<channel> channels;//初始化InitProcessPull(&channels);//开始控制子进程//debug(channels);distribute(channels);//清理收尾clean(channels);return 0;
}