Linux -- 线程的优点、pthread 线程库

server/2024/12/25 12:37:12/

目录

线程的优点

pthread 线程库 

前言

认识线程库

简单验证线程的独立栈空间


线程的优点

与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少得多。

调度进程时,CPU 中有一个 cache(缓存,提高运行效率),CPU在虚拟地址转物理地址后,在内存中找到了一行代码,然而程序在运行时,比如运行到了第50行代码,下一次大概率会运行下一行代码,也就是第51行代码,也有可能跳转到其他代码,但是大概率还是运行下一行代码,所以系统把第50行代码的周边代码都加载到 cache 中,CPU 在运行时直接从 cache 中读取代码,提高 CPU 寻址效率。

进程切换时,会把当前缓存到 cache 的数据都切换掉,而线程切换时,寄存器中的数据会被切换,但 cache 中的数据不会被丢弃,大概率还是可以用的,线程切换只需要更改少量寄存器和栈指针等信息,而不需要像进程那样进行完整的上下文切换。所以线程切换时操作系统做的工作比进程的切换少。

创建一个新线程的代价要比创建一个新进程小得多,线程占用的资源比进程少得多。

进程是资源分配的基本单位,线程是调度的基本单位,当多个线程属于同一个进程时,它们会共享以下资源:

  1. 地址空间:包括代码段、数据段、堆区和栈区(每个线程有自己的栈)。所有线程都可以访问进程的整个虚拟地址空间,这意味着它们可以读写相同的全局变量和静态变量。

  2. 打开的文件描述符:如文件、网络连接等。所有线程都能操作这些描述符,因此对文件或网络连接的操作可以在不同线程间共享。

  3. 环境变量:进程启动时设置的环境变量是所有线程共有的。

  4. 内存映射:如果进程使用了内存映射文件或其他形式的内存映射,那么这些映射也是所有线程可见并可访问的。

  5. 信号处理程序:虽然信号通常是针对整个进程的,但某些信号(如SIGSEGV)可以由特定线程捕捉到,并且线程可以安装自己的信号处理器。

  6. 当前工作目录:所有线程共享同一进程的工作目录,任何线程改变工作目录都会影响其他线程。

  7. 用户ID和组ID:与安全性和权限相关的标识信息是所有线程共有的。

  8. 资源限制:例如最大文件大小、CPU时间等,这些限制适用于整个进程,因此也适用于所有线程。

因为多个线程共享资源,所以一个线程占用的资源比进程少。

但是线程也会有自己私有的资源

  1. 栈空间每个线程都有自己的栈,用于存储函数调用时的局部变量、返回地址等信息。这是线程之间保持独立性的关键之一,因为每个线程可以在其栈上进行独立的操作而不干扰其他线程。

  2. 寄存器集合(上下文数据):当线程被调度执行时,它有自己的寄存器集,包括程序计数器(PC)、堆栈指针和其他通用寄存器。这些寄存器保存了线程执行的状态信息。

  3. 线程ID:操作系统赋予每个线程一个唯一的标识符(TID),用于区分不同的线程。这个ID是线程私有的,因为它唯一地识别了一个线程。

  4. 线程优先级和调度属性:某些系统允许为每个线程设定独立的调度参数,如优先级和策略,这些属性影响线程的执行顺序和时间片分配。 

pthread 线程库 

前言

Linux 的线程是用进程模拟的,线程在Linux底层被视为轻量级进程。对于同一个进程中的新、主线程,可以看出线程的 tid 和 LWP 的数值是不一样的:

线程被创建、等待、分离、终止,且拥有独立的栈结构,这些都是系统在管理线程,

1、系统管理线程时,并没有对用户暴露 在系统中线程被视为轻量级进程的事实,用户认为那就是线程;

2、系统中没有线程的概念,只有轻量级进程的概念,用户却能创建管理、操作线程。

能实现以上两点是因为系统对底层的轻量级进程进行了封装,用户能操作线程都是因为有了库,所以在Linux中线程也叫做用户级线程。既然线程因库而起,就应该由库来维护。

认识线程库

为了管理线程,“先描述再组织”,定义线程的控制块 TCB,TCB是操作系统内核用来管理和调度线程的数据结构

#include <pthread.h>int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg);

pthread_create 的第一个参数 thread 是一个 pthread_t 类型的输出型参数,函数调用结束后,thread 指向一个虚拟内存单元,该内存单元的地址即为新创建线程的线程 ID,所以 pthread_t 类型的线程 ID 实际上就是一个进程地址空间的一个地址!线程库的后续操作就是根据该线程 ID 来操作线程的,用户也可以调用 pthread_self 函数来获得线程自身的 ID。

线程库中还包含了一系列用于创建、管理和操作线程的函数、类和数据结构。具体来说,一个典型的线程库会提供以下组件:

1. 线程管理

  • 创建线程:函数或构造函数用来启动一个新的线程,通常需要指定要在线程中执行的函数(即线程函数)。

    • 示例:pthread_create() (POSIX Threads)
  • 销毁/终止线程:方法来结束线程的执行,可以是自然结束(当线程函数返回时),也可以是通过特定API强制结束。

    • 示例:pthread_cancel()std::thread::join() 或 std::thread::detach()
  • 等待线程完成:允许主线程或其他线程等待某个特定线程完成其任务。

    • 示例:pthread_join()std::thread::join()

2. 线程同步机制

为了确保多个线程之间安全地共享资源,线程库提供了各种同步工具:

  • 互斥锁(Mutex):防止多个线程同时访问临界区代码段。

    • 示例:pthread_mutex_tstd::mutex
  • 读写锁(Read-write Locks):允许多个读者或单个写者访问资源。

    • 示例:pthread_rwlock_t
  • 条件变量(Condition Variables):用于线程间的通信,一个线程可以在满足特定条件时唤醒另一个线程。

    • 示例:pthread_cond_tstd::condition_variable
  • 信号量(Semaphores):控制对有限数量资源的访问。

    • 示例:sem_t (POSIX Semaphores)

3. 线程属性设置

  • 设置线程属性:在创建线程之前,可以设定一些线程属性,如栈大小、调度策略等。
    • 示例:pthread_attr_t (POSIX Threads)

4. 线程本地存储(TLS)

  • 线程局部数据:为每个线程提供独立的数据副本,即使这些变量是在全局范围内声明的。
    • 示例:pthread_key_create()pthread_getspecific()pthread_setspecific()std::thread_local (C++)

5. 高级特性

  • 线程池:预先创建一组工作线程,以便快速响应任务请求而不必频繁创建和销毁线程。

    • 示例: C++ 中可以通过第三方库如Boost实现。
  • 并发容器:线程安全的数据结构,例如队列、堆栈、哈希表等。

    • 示例:std::shared_timed_mutexconcurrent_queue (Intel TBB)
  • 原子操作:提供无锁编程的支持,保证某些操作的原子性。

    • 示例:std::atomic (C++)

6. 工具和辅助函数

  • 当前线程信息:获取当前线程ID等信息。

    • 示例:pthread_self()std::this_thread::get_id()
  • 线程调度:调整线程优先级或让出CPU给其他线程。

    • 示例:sched_yield()std::this_thread::yield()

简单验证线程的独立栈空间

#include<iostream>
#include<pthread.h>
#include<unistd.h>
using namespace std;
#include<string>void* newthreadRun(void* args)
{std:string threadname=(char*)args;int cnt=5;while(true){std::cout<<"I am "<<threadname<<",cnt: "<<cnt<<", &cnt: "<<&cnt<<std::endl;cnt--;sleep(1);}return nullptr;
}int main()
{pthread_t tid1;pthread_t tid2;pthread_create(&tid1,nullptr,newthreadRun,(void*)"thread-1");   pthread_create(&tid2,nullptr,newthreadRun,(void*)"thread-2");pthread_join(tid2,nullptr);pthread_join(tid1,nullptr);return 0;
}

同一局部变量的地址不同, 说明每个线程的栈空间都私有一份该变量

 


http://www.ppmy.cn/server/153037.html

相关文章

Linux RTC 驱动框架

目录 一、实时时钟&#xff08;RTC&#xff09;介绍1.1 概述1.2 功能1.3 应用场景1.4 工作原理1.5 对外接口1.6 常见 RTC 芯片1.7 在 Linux 系统中的应用1.8 注意事项 二、Linux 内核 RTC 驱动框架2.1 相关源码文件介绍2.2 核心数据结构2.2.1 struct rtc_device2.2.2 rtc_class…

memcached 与 redis 的区别?

1、Redis 不仅 仅 支 持 简 单 的 k/v 类型 的 数 据 &#xff0c;同时 还 提 供 list&#xff0c;set&#xff0c;zset&#xff0c;hash等数 据 结 构 的 存 储 。而 memcache 只支 持 简 单 数 据 类 型 &#xff0c;需要 客 户 端 自 己 处 理 复杂对 象 2、 Redis 支持 数 …

对象、函数、原型之间的关系

在 JavaScript 中&#xff0c;对象、函数 和 原型 是三者紧密联系的核心概念。它们共同构成了 JavaScript 中面向对象编程的基石&#xff0c;并通过原型链实现了继承与代码复用。本文将从对象、函数、原型的基础概念到它们之间的关系进行详细的讲解&#xff0c;帮助你理解 Java…

Hive其三,数据库操作,小技巧设置,加载数据等操作

目录 一、操作数据库 二、关于表的操作 1&#xff09;关于字符类型的 2&#xff09;创建表 3) 修改表 4&#xff09;删除表 5) 小案例演示 三、Hive中经常使用的小技巧的设置 四、加载数据 1&#xff09;加载本地数据&#xff1a; 2&#xff09;从HDFS加载到Hive中&a…

基于Spring Boot的校园商城系统

一、系统背景与意义 随着互联网技术的快速发展&#xff0c;电子商务已经渗透到生活的方方面面。校园作为一个相对封闭但活跃的社群&#xff0c;同样需要一个专门的线上平台来满足其特殊的需求。基于Spring Boot的校园商城系统正是为此目的而设计&#xff0c;它结合了微服务架构…

【开源】一款基于SpringBoot的智慧小区物业管理系统

一、下载项目文件 项目文件源码链接&#xff1a;https://pan.quark.cn/s/3998d958e182如出现网盘空间不够存的情况&#xff01;&#xff01;&#xff01;解决办法是先用夸克手机app注册&#xff0c;然后保存上方链接&#xff0c;就可以得到1TB空间了&#xff01;&#xff01;&…

【深入理解@EnableCaching】

深入理解EnableCaching EnableCaching 是 Spring Framework 中用于启用和配置缓存机制的一个注解。它通常被应用在配置类上&#xff0c;用来告诉 Spring 容器需要激活缓存相关的功能。Spring 的缓存抽象提供了一种简单的机制来管理缓存&#xff0c;可以减少重复的计算或数据库…

人工智能学习框架入门教程(一)

人工智能&#xff08;AI&#xff09;学习框架是指为开发、训练和部署人工智能模型提供的结构化工具和环境。它们帮助开发者实现AI项目的高效性、可扩展性、可维护性&#xff0c;并提供了优化算法、模型训练、评估、调优等功能。根据任务的不同&#xff0c;人工智能框架可以分为…