Linux系统编程之进程基础知识

embedded/2024/11/26 9:56:51/

概述

        在Linux系统中,进程是指一个正在运行的程序实例。每个进程都有一个唯一的进程标识符,即PID,操作系统通过这个PID来唯一识别和管理各个进程进程不仅仅是程序代码的运行实例,它还包含了程序运行时所需的各种资源,包括:内存空间、文件描述符、输入输出设备等。

进程的组成

        一个Linux进程主要由以下几个部分组成。

        程序段进程执行的机器指令,通常是从磁盘或Flash上的可执行文件加载到内存中的。

        数据段:包含全局变量和静态变量,通常也被加载到内存中。

        :动态分配的内存区域,用于存储动态分配的数据结构,比如:通过malloc或new分配的内存。

        :用于存储函数调用时的局部变量和函数参数,每次函数调用都会在栈上分配一个新的栈帧。

        文件描述符表:用于记录进程打开的文件和网络连接等,每个进程都有一个文件描述符表。

        进程控制块:英文全称为Process Control Block,通常简写为PCB。操作系统为每个进程维护的一个数据结构,记录了进程的所有相关信息,包括PID、状态、内存分配情况等。

进程的状态

        Linux进程的生命周期是指从进程被创建开始,到进程终止并释放所有资源为止的整个过程。在这个过程中,进程会经历不同的状态,并随着系统环境和任务需求的变化而在这些状态之间转换。

        一个典型的Linux进程,其生命周期通常包括以下几个阶段。

        创建:通过fork系统调用,创建一个新的进程

        执行进程在CPU上执行,可能经历多次状态转换。

        阻塞进程因等待I/O操作或其他事件,暂停执行。

        终止进程正常结束,或因错误而终止。

        回收:父进程通过wait或waitpid系统调用,回收子进程的资源。

        在Linux系统中,进程可以处于以下几种状态之一。

        就绪状态进程已经准备好运行,等待CPU时间片。

        运行状态进程正在CPU上执行。

        阻塞状态进程因为等待某些事件的发生而暂停运行,如等待I/O操作完成。

        终止状态进程已经完成或者因错误而终止。

        僵尸状态进程已经结束,但其父进程尚未调用 wait 或 waitpid 函数回收其资源。

        停止状态进程被暂停执行,通常是因为接收到 SIGSTOP 或 SIGTSTP 信号。

        进程的上述状态之间可以互相转换,常见的状态转换如下。

        就绪 -> 运行:当进程被调度程序选中,并分配到CPU上执行时,从就绪状态转换为运行状态。

        运行 -> 就绪:当进程的时间片用尽,或被更高优先级的进程抢占时,从运行状态转换为就绪状态。

        运行 -> 阻塞:当进程等待I/O操作完成,或其他事件发生时,从运行状态转换为阻塞状态。

        阻塞 -> 就绪:当进程等待的事件发生后,从阻塞状态转换为就绪状态。

        运行 -> 终止:当进程正常结束,或因错误终止时,从运行状态转换为终止状态。

        终止 -> 僵尸:当进程结束,但父进程尚未回收其资源时,从终止状态转换为僵尸状态。

        运行 -> 停止:当进程接收到SIGSTOP或SIGTSTP信号时,从运行状态转换为停止状态。

        停止 -> 运行:当进程接收到SIGCONT信号时,从停止状态转换为运行状态。

        为了更清晰地查看进程状态之间的转换过程,可参考下面的状态转换图。

        如果想查看进程的当前状态,可以使用ps、top等命令。比如:使用ps aux命令可以查看系统中所有进程的详细信息,包括:状态、PID、CPU使用率、内存使用率等。

进程控制块

        进程控制块,即PCB,是操作系统为每个进程维护的一个数据结构,记录了进程的所有相关信息。PCB是系统感知进程存在的唯一标志,系统通过PCB来管理和控制进程PCB可以被操作系统中的多个模块读取或修改,比如:调度程序、资源分配程序、中断处理程序等。这些模块通过访问或修改PCB,来管理和控制进程的执行状态和资源分配情况。

        PCB中包含的主要信息如下。

        进程标识符:即PID,唯一标识进程的整数。PID在任何时刻都是唯一的,但可以重用。当进程终止并被系统回收后,其PID可以被其他新创建的进程使用。

        进程状态:记录进程当前所处的状态。

        程序计数器:指向进程下一条要执行的指令。

        寄存器状态:保存进程的寄存器值,用于进程切换时恢复现场。

        内存管理信息:包括进程的虚拟地址空间、页表等。

        文件描述符表:记录进程打开的文件和网络连接等。

        优先级:用于调度程序确定进程的优先级。

        进程ID:记录创建该进程的父进程的PID。

        进程列表:记录该进程创建的所有子进程的PID。

        资源限制:包括进程可以使用的最大内存、文件描述符数量等。

// 进程控制块PCB
struct task_struct
{pid_t pid;  // 进程IDchar comm[16];  // 进程名mm_struct *mm;  // 内存描述符files_struct *files;  // 文件描述符表fs_struct *fs;  // 文件系统信息signal_struct *signal;  // 信号处理信息thread_info *thread_info;  // 线程信息struct list_head tasks;  // 进程链表节点struct task_struct *parent;  // 父进程指针struct task_struct *children;  // 子进程链表头struct task_struct *sibling;  // 兄弟进程链表unsigned long state;  // 进程状态int priority;  // 进程优先级int nice;  // 进程的nice值int static_prio;  // 静态优先级int policy;  // 调度策略struct sched_param sched_param;  // 调度参数unsigned long flags;  // 进程标志unsigned long timeout;  // 超时时间unsigned long rt_priority;  // 实时优先级unsigned long deadline;  // 截止时间unsigned long runtime;  // 运行时间unsigned long vruntime;  // 虚拟运行时间unsigned long utime;  // 用户模式下的运行时间unsigned long stime;  // 内核模式下的运行时间unsigned long nvcsw;  // 自愿上下文切换次数unsigned long nivcsw;  // 非自愿上下文切换次数unsigned long start_time;  // 进程启动时间unsigned long exit_time;  // 进程退出时间// ...
};

进程调度

        Linux系统中的所有进程形成一个树状结构,称为进程树。进程树的根节点是进程ID为1的init进程,它是系统启动后的第一个进程,负责启动其他系统进程和服务。每个进程都可以创建子进程,子进程又可以创建自己的子进程,从而形成一个多级的进程树。

        Linux内核负责决定哪个进程何时获得CPU时间,调度算法决定了进程的优先级和执行顺序,常见的调度策略如下。

        先来先服务:英文全称为“First-Come, First-Served”,缩写为FCFS。FCFS是一种简单的调度算法,按照进程到达的顺序进行调度。第一个到达的进程最先执行,然后是第二个到达的进程,依此类推。FCFS算法逻辑简单,容易理解和实现。但不够公平,缺乏优先级。比如:如果一个长作业首先到达,它会占用CPU较长时间,导致后续到达的短作业等待时间过长。

        短作业优先:英文全称为“Shortest Job First”,缩写为SJF。SJF是一种基于进程预计执行时间的调度算法,优先调度执行时间较短的进程。SJF可以减少平均等待时间,提高系统的整体吞吐量。但必须预先知道或估计每个进程的执行时间,这在实际应用中可能难以实现。

        时间片轮转:英文全称为“Round Robin”,缩写为RR。RR是一种基于时间片的调度算法,每个进程轮流分配固定的时间片,时间片用尽后切换到下一个进程。这样,每个进程都能获得平等的CPU时间,避免了某些进程长时间占用CPU。RR适用于交互式系统,可以快速响应用户的输入,但频繁的上下文切换可能会增加系统开销。

        优先级调度:英文全称为“Priority Scheduling”,缩写为PS。PS根据进程的优先级进行调度,高优先级的进程优先获得CPU时间。它的特点是比较灵活,可以根据进程的重要性和紧急程度动态调整优先级。缺点是低优先级的进程可能会因为高优先级进程的存在,而长期得不到CPU时间。

        完全公平调度:英文全称为“Completely Fair Scheduler”,缩写为CFSCFS是Linux内核从版本2.6.23开始采用的默认调度算法,其设计目标是:在所有可运行的任务之间公平地分配CPU时间,确保没有任务长期得不到处理。CFS的主要特点有以下几点。

        (1)公平性CFS使用一个称为虚拟运行时间的概念来衡量任务的执行时间,虚拟运行时间反映了任务相对于其他任务的执行情况。另外,CFS使用红黑树来维护等待执行的任务列表。任务根据其虚拟运行时间进行排序,确保运行时间最少的任务优先得到CPU时间。

        (2)可预测性CFS提供了确定性的响应时间,实时任务优先于普通任务执行,这对于需要及时响应的应用程序非常重要。

        (3)适应性CFS能够动态调整其行为,以适应不同的工作负载,包括:交互式应用和批处理任务。在多核系统中,CFS尝试将任务分配到不同的核心上,以减少CPU的空闲时间。

        (4)调度延迟CFS会设定一个目标调度周期(通常为100毫秒),并试图让所有任务在这个周期内至少执行一次。CFS还会动态调整每个任务的时间片,确保运行时间较少的任务获得更多的机会。

        (5)优先级支持CFS根据nice值调整任务的权重,从而影响其虚拟运行时间。


http://www.ppmy.cn/embedded/140588.html

相关文章

【JavaEE初阶】枫叶经霜艳,梅花透雪香-计算机是如何运行的?

本篇博客给大家带来的是与计算机相关的知识点, 包括:计算机的组成, 指令, 进程(重点). 文章专栏: JavaEE初阶 若有问题 评论区见 欢迎大家点赞 评论 收藏 分享 如果你不知道分享给谁,那就分享给薯条. 你们的支持是我不断创作的动力 . 1. 计算机的组成 1.1 计算机的发展史 计算…

基于SSM的校园订餐管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

【Qt流式布局改造支持任意位置插入和删除】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、源代码二、删除代码三、扩展总结 前言 最近在做一个需求需要流式布局,虽然官方example里有一个流式布局范例,但是不能满足我的需求…

蒙特卡洛方法(Monte Carlo,MC)

目录 1 序言 2 Monte Carlo法计算积分 3 最优化计算Monte Carlo法 1 序言 蒙特卡罗方法(Monte Carlo)是由冯诺依曼和乌拉姆等人发明的,“蒙特卡罗”这个名字是出自摩纳哥的蒙特卡罗赌场,这个方法是一类基于概率的方法的统称。是一种应用随机数来进行…

PMP–一、二、三模、冲刺–分类–5.范围管理–技巧–引导

文章目录 技巧一模5.范围管理--3.定义范围--工具与技术--引导--在研讨会和座谈会中使用引导技能来协调具有不同期望或不同专业知识的关键干系人,使他们就项目可交付成果以及项目和产品边界达成跨职能的共识。引导:题干关键词 “需求不同、需求差异、需求…

【jvm】new对象的过程

目录 1. 说明2. 类加载3. 对象创建4. 返回对象引用 1. 说明 1.在Java中,使用new关键字创建对象的过程是一个复杂而精细的过程,它涉及多个步骤,包括类加载、内存分配、初始化等。 2. 类加载 1.加载:Java虚拟机(JVM&a…

AI服务器核心部件产业链升级分析

AI服务器核心部件产业链剖析(2024) "本文探讨了AI服务器的产业链,涵盖了芯片CPU、GPU,内存DRAM和HBM,本地存储SSD,NIC、PCIe插槽、散热等关键元素。同时,对服务器CPU架构进行了深度剖析,包括X86、ARM、MIPS和RISC…

弹幕发送功能‘简单’实现

导入依赖 <!-- websocket弹幕依赖 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId></dependency>后端代码 package com.by.danmaku;import org.springfra…