进程的概念、组成、特征
程序:是静态的,就是个存放在磁盘里的可执行文件,如:xx.exe
进程:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
同一个程序多次执行会对应多个进程。
进程的组成——PCB
- 当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”—— PID(Process ID,进程ID
- 操作系统要记录PID、进程所属用户ID(UID);根据这个最基本的描述信息,可以让操作系统区分各个进程
- 操作系统要记录给进程分配了哪些资源;可用于实现操作系统对资源的管理
- 操作系统要记录进程的运行情况(eg:CPU使用情况、磁盘使用情况、网络流量使用情况等);可用于实现操作系统对进程的控制、调度
以上这些信息都被保存在一个数据结构PCB (Process Control Block)中,即进程控制块
操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中
进程的组成——程序段、数据段
程序段:程序的代码(指令序列)
数据段:运行过程中产生的各种数据
程序段和数据段都是给进程自己用的
一个进程实体(进程映像)由PCB、程序段、数据段组成。进程是动态的,进程实体(进程映像)是静态的
进程的特征:
进程的状态与转换
- 创建态
进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化PCB。
- 就绪态
当进程创建完成后,便进入“就绪态”,处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,就暂时不能运行。
- 运行态
当CPU空闲时,操作系统就会选择一个就绪进程,让它上处理机运行;一个进程在CPU上运行,那么这个进程处于运行态
- 阻塞态
在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应)。在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入“阻塞态”;当CPU空闲时,又会选择另一个“就绪态”进程上CPU运行
- 终止态
一个进程可以执行 exit 系统调用,请求操作系统终止该进程。此时该进程会进入“终止态”,操作系统会让该进程下CPU,并回收内存空间等资源,最后还要回收该进程的PCB。当终止进程的工作完成之后,这个进程就彻底消失了
进程PCB中,会有一个变量 state 来表示进程的当前状态。如:1表示创建态、2表示就绪态、3表示运行态…
为了对同一个状态下的各个进程进行统一的管理,操作系统会将各个进程的PCB组织起来。
进程状态的转换
进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。
进程控制需要使用“原语”实现,原语的执行具有原子性,它的运行必须是一气呵成,不可中断。如果不能“一气呵成”,就有可能导致操作系统中的某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作。
原语的“原子性”原理:他是使用“关中断指令”和“开中断指令”这两个特权指令实现原子性。正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有,则暂停运行当前这段程序,转而执行相应的中断处理程序。而CPU执行了“关中断指令”之后,就不再例行检查中断信号,直到执行“开中断信号指令”后才会恢复检查。关中断和开中断之间的指令就是不可中断的,因为他们不会检查是否有中断程序。
进程控制相关的原语:
CPU会设置很多“寄存器”,用来存放程序运行过程中所需的某些数据;常见的有:
- PSW:程序状态字寄存器
- PC:程序计数器,存放下一条指令的地址
- IR:指令寄存器,存放当前正在执行的指令
- 通用寄存器:其它一些必要信息
总结:
无论哪个进程控制原语,要做的事情无非就是以下几种:
- 更新PCB中的信息;所有的进程控制原语一定都会修改进程状态标志;剥夺当前运行进程的CPU使用权必然需要保存其运行环境;某进程开始运行前必然要恢复前运行环境
- 将PCB插入合适的队列
- 分配/回收资源
进程通信
进程间通信(Inter-Process Communication, IPC)是指两个进程之间产生数据交互。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。为了保证安全,一个进程不能直接访问另一个进程的地址空间;进程通信是需要操作系统支持。
共享存储
- 基于存储区的共享
基于存储区的共享:操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。
为了避免错误,各个进程对共享空间的访问应该是互斥的;各个进程可以使用操作系统内核提供的同步互斥工具。(由通信进程自己负责实现互斥)
- 基于数据结构的共享
这种就是对共享空间做了限制,这种共享方式速度慢、限制多,是一种低级通信方式。
消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
格式化的消息包括消息头(发送进程ID、接受进程ID、消息长度等格式化的信息)和消息体两部分
- 直接通信方式
消息发送进程要指明接收进程的ID。
进程P向进程Q发送消息:首先进程P执行发送原语,send(Q,msg),随后操作系统内核会把该消息挂入进程Q的消息队列,然后进程Q使用接收原语,receive(P,msg);最后消息从内核区复制到进程Q的地址空间。
- 间接通信方式
通过“信箱”间接的通信;又称“信箱通信方式”。
进程P向进程Q发送消息:首先进程P在自己的地址空间完善要发送的消息内容,然后使用发送原语,send(A(A是信箱),msg);随后进程Q执行接受原语,receive(A,msg),从信箱A接受信息。
注意:允许多个进程往同一个信箱send发送消息,也可以多个进程从同一个信箱接受信息。
管道通信
“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓存区。
注意:
- 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
- 各进程要互斥地访问管道(由操作系统实现)
- 当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程
- 当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程
- 管道中的数据一旦被读出,就彻底消失;对此一个管道允许多个写进程,一个读进程(这是14年408考题答案);但是Linux中的方案是允许有多个写进程,多个读进程的,系统会让各个读进程轮流从管道中读数据。
- 共享存储是一片共享存储区,写数据可以写在该区域的任何地方;而管道通信写数据是有规定的,只能写在队头,是以数据流的形式传递。
线程的概念
在很早没有引入进程之前,系统中各个程序只能串行执行(即很多功能不能同时享用,使用QQ的同时就不能听音乐)。有了进程后有些进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序,因此,引入了“线程”,来增加并发度。
引入线程后,线程成为了程序执行流的最小单位。
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任(如QQ视频、文字聊天、传文件)引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
线程则作为处理机的分配单元。
引入线程后的变化:
线程的属性:
- 线程是处理机调度的单位
- 多CPU计算机中,各个线程可占用不同的CPU
- 每个线程都有一个线程ID、线程控制块(TCB)
- 线程也有就绪、阻塞、运行三种基本状态
- 线程几乎不拥有系统资源
- 同一进程的不同线程间共享进程的资源
- 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
- 同一进程中的线程切换,不会引起进程切换
- 不同进程中的线程切换,会引起进程切换
- 切换同进程内的线程,系统开销很小;切换进程,系统开销大
线程的实现方式
- 用户级线程(User-Level Thread,ULT)
背景知识:早期的操作是不支持线程,只支持进程;当时的线程是由线程库(就是一段代码逻辑的执行,简单的说就是通过代码实现)来实现的。
- 用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
- 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预
- 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程”
- 优点:
- 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
- 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
- 内核级线程(Kernel-Level Thread,KLT)
- 内核级线程的管理工作由操作系统内核完成
- 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
- 操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程
- 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行
- 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多线程模型
- 一对一模型
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大
- 多对一模型
多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
-
多对多模型
n用户及线程映射到 m 个内核级线程(n >= m)。每个用户进程对应 m 个内核级线程。克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销大的缺点。
总结:
- 用户级线程可以理解为“代码逻辑”的载体
- 内核级线程可以理解为“运行机会”的载体
- 内核级线程才是处理机分配的单位
- 内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有所有内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞
线程的状态与转换
线程的组织和控制
处理及调度
调度概述
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题。
调度的三个层次
- 高级调度(作业调度)
按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。(作业就是指一个具体的任务)
- 中级调度(内存调度)
内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列
中级调度就是按照某种策略决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
- 低级调度(进程调度/处理机调度)
按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。进程调度的频率很高,一般几十毫秒一次。
进程的挂起态
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend);挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态。
“挂起”和“阻塞”的区别:
两种状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中。有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列
进程调度的时机、切换与过程、方式
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
进程调度时机
需要进行进程调度与切换的情况:
- 当前运行的进程主动放弃处理机
- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞
- 当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理
- 有更高优先级的进程进入就绪队列
不能进行进程调度与切换的情况:
- 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换
- 进程在操作系统内核程序临界区中(进程处于临界区时是能进行处理机调度、切换的)
- . 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
进程调度的方式
- 非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。
实现简单、系统开销小但是无法及时处理紧急任务。适用于早期的批处理系统
- 剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。
可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统
进程的切换与过程
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤
进程切换的过程:
- 对原来运行进程各种数据的保存
- 对新的进程各种数据的恢复
注意:进程切换是有代价的,因此过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于进程执行的时间减少。
调度器和闲逛进程
[
2、3由调度程序引起,调度程序决定了让哪个进程运行(调度算法)、运行时间
触发“调度程序”的事件:
- 创建新进程
- 进程退出
- 运行进程阻塞
- I/O中断发生
- 非抢占式调度策略,只有运行进程阻塞或退出才能触发调度程序工作
- 抢占式调度策略,每个时钟中断或k个时钟中断会触发调度程序工作
不支持内核级线程的操作系统,调度程序的处理对象是进程;支持内核级线程的操作系统,调度程序的处理对象是线程。
闲逛进程:是调度程序永远的备胎,没有其它就绪进程时,运行闲逛进程(idle)。
闲逛进程的特性:优先级最低、能耗低、可以是0地址指令,占一个完整的指令周期
调度算法的评价指标
- CPU利用率
指CPU“忙碌”的时间占总时间的比例。
利用率=忙碌的时间/总时间
- 系统吞吐量
指单位时间内完成作业的数量
系统吞吐量=总共完成的作业/总共完成作业花费时间
- 周转时间
指从作业被提交给系统开始,到作业完成为止的这段时间的间隔。它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待I/O操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次。
周转时间=作业完成时间-作业提交时间(对于用户来说,更关心自己的单个作业的周转时间)
平均周转时间=各作业周转时间之和/作业数(对于操作系统来说,更关心的是系统的整体的表现,更关心所有作业周转时间的平均值)
带权周转时间=作业周转时间/作业实际运行的时间(一定>1)
平均带权周转时间=各作业带权周转时间之和/作业数
周转时间和带权周转时间都是越小越好
- 等待事件
指进程/作业处于等待处理机状态时间之和,等待的时间越长,用户越不满意。
对于一个进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进程也是被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后被队列中等待时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体
- 响应时间
指从用户提交请求到首次产生响应所用的时间。
调度算法
先来先服务(FCFS)
算法思想/规则:主要从”公平“的角度考虑,按照作业/进程到达的先后顺序进行服务。
用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列
该算法是非抢占式的算法;不会导致饥饿(饥饿就是某进程/作业长期得不到服务)
优点:公平、算法实现简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利。
短作业优先(SJF,Shortest Job First)
算法思想/规则:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间;最短的进程/作业优先得到服务(最短指的是服务时间最短)
用于进程调度时称为“短进程(SPF)优先算法”
SJF和SPF是非抢占式的算法,但是也有抢占式的——最短剩余时间优先算法(SRTN,ShortestRemainingTimeNext)
优点:“最短的”平均等待时间、平均周转时间
缺点:对短作业有利,对长作业不利;可能会产生饥饿现象
可能会导致饥饿现象,如果一直有短作业一直到来,可能长作业长时间得不到服务,产生“饥饿”现象。
抢占式的短作业优先算法又称“最短剩余时间优先算法”
注意:
- 题目中未特别说明,所提的短作业/进程优先算法默认是非抢占式的
- 在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少。如果没有前半句条件,则是抢占式的短作业/进程优先调度算法(最短剩余时间优先)的平均等待时间、平均周转时间最短
高响应比优先(HRRN,Highest Response Ratio Next)
算法思想/规则:要综合考虑作业/进程的等待时间和要求服务时间;在每次调度时要计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务。(既可用于进程调度,也可用于作业调度)
该算法是非抢占式的,只有当前运行进程/作业主动放弃处理机时,才需要调度,才需要计算响应比。
优点:综合考虑了等待时间和运行时间,等待时间相同时,要求服务时间短的优先(SJF的优点),服务相同时间时,等待时间越长的优先(FCFS的优点);该算法不会导致饥饿
总结:
以上三种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也不区分任务的紧急程度,交互性很差。这三种算法适用于早期的批处理系统。
时间片轮转(RR,Round-Robin)
算法思想/规则:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应;按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如 100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。
用于进程调度,只有作业放入内存建立了相应的进程后,才能被分配处理机时间片
若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到。
优点:公平;响应快,适用于分时操作系统;
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
该算法不会导致饥饿。常用于分时操作系统,更注重“响应时间”,因而此处不计算周转时间。
注意:
- 如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间,,所以时间片不能太大。
- 进程调度、切换是有时间代价的,如果时间片太小,会导致进程切换过于频繁,系统会花大量时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。
优先级调度算法
算法思想/规则:随着实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定执行顺序;每个作业/进程都有自己的优先级,调度时选择优先级最高的作业/进程。
该算法用于作业调度,也可用于进程调度。
该算法抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。
非抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度
抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度。另外,当就绪队列发生改变时也需要检查是会发生抢占
优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。
缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
注意:
- 系统进程优先级 高于 用户进程
- 前台进程优先级 高于 后台进程
- 操作系统更偏好 I/O型进程(或称 I/O繁忙型进程),因为I/O设备和CPU可以并行工作。如果优先让I/O繁忙行进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升
- 与I/O型进程相对的是计算型进程(或称 CPU繁忙型进程)
多级反馈队列调度算法
算法思想:对其他调度算法的折中权衡;
算法规则:
- 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
- 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾
- 只有第 k 级队列为空时,才会为 k+1 级队头的进程分配时间片
该算法用于进程调度。
抢占式的算法。在 k 级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列队尾。
优点:对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级。)
该算法会导致饥饿感。
注:比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此这三种算法适合用于交互式系统。(比如UNIX使用的就是多级反馈队列调度算法)
多级队列调度算法
系统中按进程类型设置多个队列,进程创建成功后插入某个队列