1、Linux进程、线程概念/区别
Linux进程和线程是计算机系统中两种不同的资源分配和调度单位。
进程是计算机系统进行资源分配和调度的基本单位,也被认为是正在运行的程序。在面向线程的计算机结构中,进程是线程的容器。进程拥有独立的内存和系统资源,并且它的创建、销毁和切换等操作都需要付出较大的开销。进程间的数据共享需要操作系统的干预,同时进程的逻辑控制相对复杂,需要和主程序进行交互,以及需要跨进程边界。
线程是一种轻量级的进程,没有系统资源,可以被看作是进程中的一条执行路径。线程是操作系统调度的最小单位,它与进程相比,切换的开销较小。在一个进程内部,多个线程之间可以共享资源,并且线程间通信更简单,因为它们共享相同的地址空间和数据。线程的创建、销毁和切换等操作也相对于进程来说较简单。
总的来说,进程和线程在资源分配、工作效率和执行方式上有明显的区别。进程拥有独立的资源,而线程则是轻量级的进程,没有独立资源。进程切换时需要保留资源,而线程切换时不需要保留资源。此外,进程可以被操作系统直接调度,而线程则必须在进程中运行。
2、进程、线程的同步方式
Linux进程和线程的同步方式有多种,以下是一些常见的方式:
- 进程间的同步方式:
信号量(Semaphore):主要作为进程间以及同一进程不同线程之间的同步手段。
套接口(Socket):更为一般的进程间通信机制,可用于不同机器之间的进程间通信。
- 线程间的同步方式:
互斥锁(Mutex):通过锁机制实现线程间的同步。同一时刻只允许一个线程执行一个关键部分的代码。
条件变量(Condition Variable):与互斥锁结合使用,用于线程间的同步。当某个条件不满足时,线程可以等待,直到条件满足为止。
信号量(Semaphore):同样可以用于线程间的同步。
无锁互斥访问(Lock-Free Access):通过一些特殊的技术,使得多个线程在并发条件下对共享资源进行无锁访问的方式。例如,使用原子操作或CAS操作等。
需要注意的是,进程和线程的同步方式主要是为了解决并发访问共享资源时可能出现的冲突和竞争条件,保证数据的一致性和正确性。不同的同步方式具有不同的特点和适用场景,需要根据实际情况进行选择和设计。
3、锁的概念,互斥锁、自旋锁等
锁是计算机科学中用于实现并发控制的一种同步机制。在多线程编程中,锁被用来防止多个线程同时访问共享资源,避免数据竞争和状态不一致的问题。
互斥锁(Mutex)是一种常用的锁机制,其基本原理是当一个线程获取了互斥锁后,其他尝试获取该锁的线程将会被阻塞,直到原线程释放该锁。这样可以确保每个时刻只有一个线程可以访问共享资源。
自旋锁(spinlock)是一种非阻塞锁,当一个线程尝试获取锁而失败时,它不会像互斥锁那样进入阻塞状态,而是继续循环尝试获取锁,同时消耗CPU时间。自旋锁适合用于短时间内的资源保护,避免频繁的线程上下文切换带来的开销。
在使用这些锁时,需要注意避免死锁和饥饿问题。死锁是指多个线程相互等待对方释放锁,导致所有线程都无法继续执行的情况。饥饿问题是某些线程长时间无法获取到锁,从而使其他线程一直执行而无法获得机会获取锁的问题。
另外,还有读写锁(read-write lock)这种锁,允许多个线程同时读取共享资源,但在写入时需要独占式的访问。这样可以提高并发性能,适用于读操作远多于写操作的情况。
4、fork clone
在Linux下,fork和clone都是用于创建进程的技术。
- Fork(分叉):在Linux中,fork()系统调用用于创建一个新的进程,该进程是原始进程的副本。新进程(子进程)继承原始进程(父进程)的代码、数据、打开的文件描述符等。子进程有一个新的进程ID,并且其大部分状态与父进程相同,但也有一些状态(如PID、父PID等)是不同的。fork()调用返回两次:一次在父进程中返回子进程的PID,另一次在子进程中返回0。
- Clone(克隆):clone()系统调用是Linux 2.6.23版本引入的一种创建新进程的方法,它允许创建一个共享部分或全部地址空间的新进程。clone()调用创建一个新进程,并可以选择性地共享父进程的地址空间(例如堆、栈、代码段等)。这种共享使得新进程可以访问和修改共享地址空间的内容,从而实现更高效的进程间通信。clone()调用返回一个新的进程ID,该ID可以用于识别新创建的进程。
需要注意的是,fork和clone都是Linux系统调用,它们的使用需要遵循相应的系统调用规范和参数约定。在编写使用这些系统调用的程序时,需要确保正确地处理返回值和错误情况。
5、创建守护进程
在Linux中,创建一个守护进程通常需要以下步骤:
- 在父进程中创建子进程:使用fork()系统调用创建一个子进程。子进程是父进程的副本,并且继承父进程的代码、数据和打开的文件描述符。
- 在子进程中创建新的会话:使用setsid()系统调用在子进程中创建一个新的会话。这将使子进程成为新的会话的领导者,并脱离父进程的控制终端。
- 设置 umask 为 0:使用umask()函数将文件模式创建掩码设置为0,以确保守护进程创建的文件具有适当的权限。
- 更改当前工作目录:使用chdir()系统调用将当前工作目录更改为根目录(/),以确保守护进程不会保持对原始工作目录的引用。
- 关闭不再需要的文件描述符:使用close()系统调用关闭父进程和子进程之间共享的文件描述符,例如标准输入、标准输出和标准错误输出。
- 设置新的标准输入、标准输出和标准错误输出:使用open()系统调用将标准输入、标准输出和标准错误输出重定向到适当的文件或设备。
- 设置进程组ID和会话ID:使用setpgid()和setsid()系统调用设置进程组ID和会话ID,以确保守护进程正确地与其他进程隔离。
- 将文件创建掩码重置为0:再次使用umask()函数将文件模式创建掩码重置为0,以确保守护进程创建的文件具有适当的权限。
- 进入主循环:在守护进程中编写主循环逻辑,以便它可以执行所需的任务。
这些步骤可以帮助您创建一个基本的守护进程。请注意,这只是一个基本的框架,您可能需要根据您的具体需求进行修改和扩展。此外,还应注意处理错误和异常情况,并确保正确释放资源。
6、用户空间、内核空间
Linux操作系统将虚拟内存分为两部分:用户空间和内核空间。
用户空间供各个进程使用,包括用户应用程序和操作系统内核模块(例如Linux内核)。每个进程都有其独立的用户空间,它们之间相互隔离且不能互相访问。在用户空间中,每个进程都有其自己的虚拟地址空间,并且可以通过系统调用进入内核空间。
内核空间是Linux内核使用的虚拟内存区域。它包括操作系统内核模块、设备驱动程序、内存管理系统等关键组件。内核空间对所有进程都是共享的,即所有进程都可以访问内核空间中的代码和数据。内核空间具有更高的权限级别,可以执行诸如管理内存、控制硬件设备等敏感操作。
用户空间和内核空间之间的转换需要通过系统调用完成。系统调用是用户空间进程和内核空间之间的接口,它允许用户空间进程将请求传递给内核,并使内核执行相应的操作。例如,当用户空间进程需要访问文件系统时,它会通过系统调用将请求传递给内核,然后内核会加载适当的文件系统模块并执行所需的操作。
需要注意的是,内核空间和用户空间都是虚拟内存,它们并不直接对应于物理内存。虚拟内存是一种内存管理技术,它通过将进程的虚拟地址映射到物理内存来实现内存的独立管理。这样,每个进程都有自己的独立虚拟地址空间,可以保护不同进程之间的数据和代码不相互干扰。