深入剖析Linux RCU原理(一)初窥门径

news/2024/11/28 15:38:08/

说明:

  1. Kernel版本:4.14
  2. ARM64处理器,Contex-A53,双核
  3. 使用工具:Source Insight 3.5, Visio

1. 概述

RCU, Read-Copy-Update,是Linux内核中的一种同步机制。RCU常被描述为读写锁的替代品,它的特点是读者并不需要直接与写者进行同步,读者与写者也能并发的执行。RCU的目标就是最大程度来减少读者侧的开销,因此也常用于对读者性能要求高的场景。

  • 优点:
  • 读者侧开销很少、不需要获取任何锁,不需要执行原子指令或者内存屏障;
  • 没有死锁问题;
  • 没有优先级反转的问题;
  • 没有内存泄露的危险问题;
  • 很好的实时延迟;
  • 缺点:
  • 写者的同步开销比较大,写者之间需要互斥处理;
  • 使用上比其他同步机制复杂;

来一张图片来描述下大体的操作吧:

  • 多个读者可以并发访问临界资源,同时使用rcu_read_lock/rcu_read_unlock来标定临界区;
  • 写者(updater)在更新临界资源的时候,拷贝一份副本作为基础进行修改,当所有读者离开临界区后,把指向旧临界资源的指针指向更新后的副本,并对旧资源进行回收处理;
  • 图中只显示一个写者,当存在多个写者的时候,需要在写者之间进行互斥处理;

上述的描述比较简单,RCU的实现很复杂。本文先对RCU来一个初印象,并结合接口进行实例分析,后续文章再逐层深入到背后的实现原理。开始吧!

    资料直通车:Linux内核源码技术学习路线+视频教程内核源码

学习直通车:Linux内核源码内存调优文件系统进程管理设备驱动/网络协议栈

2. RCU基础

2.1 RCU基本要素

RCU的基本思想是将更新Update操作分为两个部分:1)Removal移除;2)Reclamation回收。直白点来理解就是,临界资源被多个读者读取,写者在拷贝副本修改后进行更新时,第一步需要先把旧的临界资源数据移除(修改指针指向),第二步需要把旧的数据进行回收(比如kfree)。

因此,从功能上分为以下三个基本的要素:Reader/Updater/Reclaimer,三者之间的交互如下图:

  1. Reader
  2. 使用rcu_read_lock和rcu_read_unlock来界定读者的临界区,访问受RCU保护的数据时,需要始终在该临界区域内访问;
  3. 在访问受保护的数据之前,需要使用rcu_dereference来获取RCU-protected指针;
  4. 当使用不可抢占的RCU时,rcu_read_lock/rcu_read_unlock之间不能使用可以睡眠的代码;
  5. Updater
  6. 多个Updater更新数据时,需要使用互斥机制进行保护;
  7. Updater使用rcu_assign_pointer来移除旧的指针指向,指向更新后的临界资源;
  8. Updater使用synchronize_rcu或call_rcu来启动Reclaimer,对旧的临界资源进行回收,其中synchronize_rcu表示同步等待回收,call_rcu表示异步回收;
  9. Reclaimer
  10. Reclaimer回收的是旧的临界资源;
  11. 为了确保没有读者正在访问要回收的临界资源,Reclaimer需要等待所有的读者退出临界区,这个等待的时间叫做宽限期(Grace Period);

2.2 RCU三个基本机制

用来提供上述描述的功能,RCU基于三种机制来实现。

2.2.1Publish-Subscribe Mechanism

订阅机制是个什么概念,来张图:

  • Updater与Reader类似于Publisher和Subsriber的关系;
  • Updater更新内容后调用接口进行发布,Reader调用接口读取发布内容;

那么这种订阅机制,需要做点什么来保证呢?来看一段伪代码:

/* Definiton of global structure */1 struct foo {2   int a;3   int b;4   int c;5 };6 struct foo *gp = NULL;7 8 /* . . . */9 /* =========Updater======== */ 10 p = kmalloc(sizeof(*p), GFP_KERNEL);11 p->a = 1;12 p->b = 2;13 p->c = 3;14 gp = p;15 16 /* =========Reader======== */17 p = gp;18 if (p != NULL) {19   do_something_with(p->a, p->b, p->c);20 }

乍一看似乎问题不大,Updater进行赋值更新,Reader进行读取和其他处理。然而,由于存在编译乱序和执行乱序的问题,上述代码的执行顺序不见得就是代码的顺序,比如在某些架构(DEC Alpha)中,读者的操作部分,可能在p赋值之前就操作了do_something_with()。

为了解决这个问题,Linux提供了rcu_assign_pointer/rcu_dereference宏来确保执行顺序,Linux内核也基于rcu_assign_pointer/rcu_dereference宏进行了更高层的封装,比如list, hlist,因此,在内核中有三种被RCU保护的场景:1)指针;2)list链表;3)hlist哈希链表。

针对这三种场景,Publish-Subscribe接口如下表:

2.2.2Wait For Pre-Existing RCU Readers to Complete

Reclaimer需要对旧的临界资源进行回收,那么问题来了,什么时候进行呢?因此RCU需要提供一种机制来确保之前的RCU读者全部都已经完成,也就是退出了rcu_read_lock/rcu_read_unlock标定的临界区后,才能进行回收处理。

  • 图中Readers和Updater并发执行;
  • 当Updater执行Removal操作后,调用synchronize_rcu,标志着更新结束并开始进入回收阶段;
  • 在synchronize_rcu调用后,此时可能还有新的读者来读取临界资源(更新后的内容),但是,Grace Period只等待Pre-Existing的读者,也就是在图中的Reader-4, Reader-5。只要这些之前就存在的RCU读者退出临界区后,意味着宽限期的结束,因此就进行回收处理工作了;
  • synchronize_rcu并不是在最后一个Pre-ExistingRCU读者离开临界区后立马就返回,它可能存在一个调度延迟;

2.2.3Maintain Multiple Versions of Recently Updated Objects

从2.2.2节可以看出,在Updater进行更新后,在Reclaimer进行回收之前,是会存在新旧两个版本的临界资源的,只有在synchronize_rcu返回后,Reclaimer对旧的临界资源进行回收,最后剩下一个版本。显然,在有多个Updater时,临界资源的版本会更多。

还是来张图吧,分别以指针和链表为例:

  • 调用synchronize_rcu开始为临界点,分别维护不同版本的临界资源;
  • 等到Reclaimer回收旧版本资源后,最终归一统;

3. RCU示例分析

是时候来一波fucking sample code了。

  • 整体的代码逻辑:
  • 构造四个内核线程,两个内核线程测试指针的RCU保护操作,两个内核线程用于测试链表的RCU保护操作;
  • 在回收的时候,分别用了synchronize_rcu同步回收和call_rcu异步回收两种机制;
  • 为了简化代码,基本的容错判断都已经省略了;
  • 没有考虑多个Updater的机制,因此,也省略掉了Updater之间的互斥操作;
#include <linux/module.h>
#include <linux/init.h>
#include <linux/slab.h>
#include <linux/kthread.h>
#include <linux/rcupdate.h>
#include <linux/delay.h>struct foo {int a;int b;int c;struct rcu_head rcu;struct list_head list;
};static struct foo *g_pfoo = NULL;LIST_HEAD(g_rcu_list);struct task_struct *rcu_reader_t;
struct task_struct *rcu_updater_t;
struct task_struct *rcu_reader_list_t;
struct task_struct *rcu_updater_list_t;/* 指针的Reader操作 */
static int rcu_reader(void *data)
{struct foo *p = NULL;int cnt = 100;while (cnt--) {msleep(100);rcu_read_lock();p = rcu_dereference(g_pfoo);pr_info("%s: a = %d, b = %d, c = %d\n",__func__, p->a, p->b, p->c);rcu_read_unlock();}return 0;
}/*  回收处理操作 */
static void rcu_reclaimer(struct rcu_head *rh)
{struct foo *p = container_of(rh, struct foo, rcu);pr_info("%s: a = %d, b = %d, c = %d\n",__func__, p->a, p->b, p->c);kfree(p);
}/* 指针的Updater操作 */
static int rcu_updater(void *data)
{int value = 1;int cnt = 100;while (cnt--) {struct foo *old;struct foo *new = (struct foo *)kzalloc(sizeof(struct foo), GFP_KERNEL);msleep(200);old = g_pfoo;*new = *g_pfoo;new->a = value;new->b = value + 1;new->c = value + 2;rcu_assign_pointer(g_pfoo, new);pr_info("%s: a = %d, b = %d, c = %d\n",__func__, new->a, new->b, new->c);call_rcu(&old->rcu, rcu_reclaimer);value++;}return 0;
}/* 链表的Reader操作 */
static int rcu_reader_list(void *data)
{struct foo *p = NULL;int cnt = 100;while (cnt--) {msleep(100);rcu_read_lock();list_for_each_entry_rcu(p, &g_rcu_list, list) {pr_info("%s: a = %d, b = %d, c = %d\n",__func__, p->a, p->b, p->c);}rcu_read_unlock();}return 0;
}/* 链表的Updater操作 */
static int rcu_updater_list(void *data)
{int cnt = 100;int value = 1000;while (cnt--) {msleep(100);struct foo *p = list_first_or_null_rcu(&g_rcu_list, struct foo, list);struct foo *q = (struct foo *)kzalloc(sizeof(struct foo), GFP_KERNEL);*q = *p;q->a = value;q->b = value + 1;q->c = value + 2;list_replace_rcu(&p->list, &q->list);pr_info("%s: a = %d, b = %d, c = %d\n",__func__, q->a, q->b, q->c);synchronize_rcu();kfree(p);value++; }return 0;
}/* module初始化 */
static int rcu_test_init(void)
{struct foo *p;rcu_reader_t = kthread_run(rcu_reader, NULL, "rcu_reader");rcu_updater_t = kthread_run(rcu_updater, NULL, "rcu_updater");rcu_reader_list_t = kthread_run(rcu_reader_list, NULL, "rcu_reader_list");rcu_updater_list_t = kthread_run(rcu_updater_list, NULL, "rcu_updater_list");g_pfoo = (struct foo *)kzalloc(sizeof(struct foo), GFP_KERNEL);p = (struct foo *)kzalloc(sizeof(struct foo), GFP_KERNEL);list_add_rcu(&p->list, &g_rcu_list);return 0;
}/* module清理工作 */
static void rcu_test_exit(void)
{kfree(g_pfoo);kfree(list_first_or_null_rcu(&g_rcu_list, struct foo, list));kthread_stop(rcu_reader_t);kthread_stop(rcu_updater_t);kthread_stop(rcu_reader_list_t);kthread_stop(rcu_updater_list_t);
}module_init(rcu_test_init);
module_exit(rcu_test_exit);MODULE_AUTHOR("Loyen");
MODULE_LICENSE("GPL");

为了证明没有骗人,贴出在开发板上运行的输出log,如下图:

4. API介绍

4.1 核心API

下边的这些接口,不能更核心了。

a.      rcu_read_lock()  //标记读者临界区的开始
b.      rcu_read_unlock()  //标记读者临界区的结束
c.      synchronize_rcu() / call_rcu() //等待Grace period结束后进行资源回收
d.      rcu_assign_pointer()  //Updater使用这个宏对受RCU保护的指针进行赋值
e.      rcu_dereference()  //Reader使用这个宏来获取受RCU保护的指针

4.2 其他相关API

基于核心的API,扩展了其他相关的API,如下,不再详述:

RCU list traversal::list_entry_rculist_entry_locklesslist_first_entry_rculist_next_rculist_for_each_entry_rculist_for_each_entry_continue_rculist_for_each_entry_from_rculist_first_or_null_rculist_next_or_null_rcuhlist_first_rcuhlist_next_rcuhlist_pprev_rcuhlist_for_each_entry_rcuhlist_for_each_entry_rcu_bhhlist_for_each_entry_from_rcuhlist_for_each_entry_continue_rcuhlist_for_each_entry_continue_rcu_bhhlist_nulls_first_rcuhlist_nulls_for_each_entry_rcuhlist_bl_first_rcuhlist_bl_for_each_entry_rcuRCU pointer/list update::rcu_assign_pointerlist_add_rculist_add_tail_rculist_del_rculist_replace_rcuhlist_add_behind_rcuhlist_add_before_rcuhlist_add_head_rcuhlist_add_tail_rcuhlist_del_rcuhlist_del_init_rcuhlist_replace_rculist_splice_init_rculist_splice_tail_init_rcuhlist_nulls_del_init_rcuhlist_nulls_del_rcuhlist_nulls_add_head_rcuhlist_bl_add_head_rcuhlist_bl_del_init_rcuhlist_bl_del_rcuhlist_bl_set_first_rcuRCU::Critical sections       Grace period            Barrierrcu_read_lock           synchronize_net         rcu_barrierrcu_read_unlock         synchronize_rcurcu_dereference         synchronize_rcu_expeditedrcu_read_lock_held      call_rcurcu_dereference_check   kfree_rcurcu_dereference_protectedbh::Critical sections       Grace period            Barrierrcu_read_lock_bh        call_rcu                rcu_barrierrcu_read_unlock_bh      synchronize_rcu[local_bh_disable]      synchronize_rcu_expedited[and friends]rcu_dereference_bhrcu_dereference_bh_checkrcu_dereference_bh_protectedrcu_read_lock_bh_heldsched::Critical sections       Grace period            Barrierrcu_read_lock_sched     call_rcu                rcu_barrierrcu_read_unlock_sched   synchronize_rcu[preempt_disable]       synchronize_rcu_expedited[and friends]rcu_read_lock_sched_notracercu_read_unlock_sched_notracercu_dereference_schedrcu_dereference_sched_checkrcu_dereference_sched_protectedrcu_read_lock_sched_heldSRCU::Critical sections       Grace period            Barriersrcu_read_lock          call_srcu               srcu_barriersrcu_read_unlock        synchronize_srcusrcu_dereference        synchronize_srcu_expeditedsrcu_dereference_checksrcu_read_lock_heldSRCU: Initialization/cleanup::DEFINE_SRCUDEFINE_STATIC_SRCUinit_srcu_structcleanup_srcu_structAll: lockdep-checked RCU-protected pointer access::rcu_access_pointerrcu_dereference_rawRCU_LOCKDEP_WARNrcu_sleep_checkRCU_NONIDLE

好吧,罗列这些API有点然并卵。

 


http://www.ppmy.cn/news/4058.html

相关文章

【Java笔记】 深入理解序列化和反序列化

深入理解序列化和反序列化 文章目录深入理解序列化和反序列化1.是什么2.为什么3.怎么做3.1 实现Serializable接口3.2 实现Externalizable接口3.3 注意知识点3.4 serialVersionUID的作用4 扩展1.是什么 序列化&#xff1a;就是讲对象转化成字节序列的过程。 反序列化&#xff…

Redis框架(十五):大众点评项目 共同关注方案实现?双指针筛选DB数据:Redis取交集

大众点评项目 好友关注 共同关注需求&#xff1a;好友关注 共同关注业务逻辑展示点击关注功能实现判断当前用户是否关注了此博主共同好友列表查询业务逻辑实现双指针筛选DB数据Redis取交集总结SpringCloud章节复习已经过去&#xff0c;新的章节Redis开始了&#xff0c;这个章节…

数据结构---各类排序算法详解

Lesson6–排序 文章目录Lesson6--排序一、.排序的概念及其应用1.1排序的概念1.2常见的排序算法二、.常见排序算法的实现2.1插入排序2.1.1插入排序的基本思想&#xff1a;2.1.2直接插入排序&#xff1a;2.1.3 直接插入排序代码实现2.1.4希尔排序&#xff08;缩小增量排序&#x…

NR RedCap UE关键技术与标准化进展

【摘 要】为满足工业无线传感器、视频监控和可穿戴设备等中端物联网用例的需求,3GPP Rel-17研究定义5G新空口(NR)低复杂度低成本终端(即RedCap UE)。介绍了5G RedCap UE的主要用例与标准化目标,分析了RedCap UE降低复杂度与成本、终端节能、终端指示与识别等关键技术,分…

Mac如何做才能彻底清理垃圾

Mac磁盘空间又爆满了&#xff1f;系统运行又卡了&#xff1f;你的Mac需要清理内存缓存垃圾啦&#xff01;本文教会你如何彻底清除Mac垃圾文件&#xff0c;释放存储空间。 现在&#xff0c;Mac电脑最顶配的硬盘可达2TB。这么大的容量&#xff0c;应该够用了吧&#xff1f;可真正…

git --- revert用法

1. 什么情况下使用revert? 比如你改代码改错了,并没有发现,叫代码提交到了github,结果队友发现了,需要将你的某次提交回退,就可以使用,使用后作为一次新的提交,可以很方便的push到github,并不会有冲突的问题。 git revert 撤销某次操作,此次操作之前和之后的commit…

KEIL5软件仿真支持的器件

问题的提出 用KEIL进行软件仿真&#xff0c;想观察一下处理器STM32F091RCY的I2C和DAC引脚输出的波形&#xff0c;发现无法向波形中添加信号&#xff0c;如下图所示 当在命令行中输入 dir vtreg 指令时&#xff0c;仅仅能够显示内核的寄存器&#xff0c;外设的寄存器无法输出&a…

王卫点赞友商?北京快递保卫战,顺丰彰显大格局大气度

当下&#xff0c;随着全面放开&#xff0c;国内新冠疫情到了另一个严峻的拐点时刻&#xff0c;特别是北京&#xff0c;正日益逼近感染高峰期。 作为社会生活的毛细血管&#xff0c;快递物流企业们在当下的新冠疫情大背景下上演了一幕幕的鲜活的画面&#xff0c;快递行业市场新…