cpu throttle原理浅析

news/2025/1/12 1:42:33/

文章目录

  • 基本原理
  • 数据结构
    • QEMUTimer
    • qemu_work_item
  • 实现流程
    • 定时器注册
    • 启动cpu throttle
    • vcpu睡眠
    • 停止cpu throttle

基本原理

  • cpu throttle主要目的是限制虚机vcpu的运行,降低虚机的脏页速率。在热迁移长时间无法完成的情况下,可以使用这个手段降低脏页速率,从而促使迁移收敛。
  • cpu throttle核心思想非常简单:让处于运行状态的vcpu退出到kvm,然后返回用户态qemu,睡眠一段时间后再进入guest。cpu throttle的输入参数是vcpu睡眠时间与总时间的百分比。公式如下:
    throttle计算公式
  • 这里我们将sleep_time+run_time称为一个throttle周期,qemu在限制vcpu运行时,保证了vcpu在一个throttle周期内的运行时间固定,因此,不同百分比(throttle_percentage)会导致throttle周期不同,throttle_percentage越大,vcpu睡眠的时间越多,throttle周期越长。
  • 下面我们以throttle周期内运行时间10ms为例(这是qemu的默认实现),介绍不同迁移过程中设置不同cpu throttle时qemu的工作流程:
  1. throttle percentage: 50%、run_time: 10ms、sleep_time:10ms、throttle period: 20ms
  • 下图描述的是cpu throttle设置为50的情况下每个vcpu的运行情况,由于每个throttle周期内run_time相同,都是10ms,根据比例计算得到throttle周期为20ms。因此qemu主线程中设置定时器每20ms触发一次回调,回调函数中会kick vcpu。vcpu被kick后退回到用户态,休眠10ms后会重新进入guest态运行,10ms后再次被kick,周而复始。
    throttle为60情况下qem的工作流程
  1. throttle percentage: 60%、run_time: 10ms、sleep_time:15ms、throttle period: 25ms
    throttle为60情况下qem的工作流程

数据结构

QEMUTimer

  • QEMUTimer用来实现定时,周期性触发回调函数,kick处于运行态的vcpu:
struct QEMUTimer {int64_t expire_time;        /* 超时时间,单位为ns */QEMUTimerList *timer_list;QEMUTimerCB *cb;		/* 定时器关联的回调函数 */void *opaque;QEMUTimer *next;int attributes;int scale;
};

qemu_work_item

  • qemu_work_item用来实现vcpu运行任务的封装,所有需要vcpu线程在用户态执行的任务会被链表链接起来,放在CPUState结构体的work_list成员中,一旦vcpu退回到用户态,vcpu线程会遍历该链表的所有任务并依次执行
struct qemu_work_item {QSIMPLEQ_ENTRY(qemu_work_item) node;		/* 需要vcpu线程在用户态执行的任务通过该成员链接到work_list链表 */run_on_cpu_func func;						/* 任务执行时调用的具体函数 */run_on_cpu_data data;						/* 任务执行时调用的具体函数参数 */bool free, exclusive, done;
};
struct CPUState {......QSIMPLEQ_HEAD(, qemu_work_item) work_list;	/* vcpu上所有待执行的任务有work_list维护 */......
}

#define CPU_THROTTLE_PCT_MIN 1					/* 允许cpu睡眠的最小占比 */
#define CPU_THROTTLE_PCT_MAX 99					/* 允许cpu睡眠的最大占比 */
#define CPU_THROTTLE_TIMESLICE_NS 10000000		/* 每个throttle周期固定运行10ms */

实现流程

定时器注册

  • cpu throttle通过定时器周期性kick vcpu实现,需要注册qemu定时器,这个动作包含在qemu主线程启动过程中,流程如下:
qemu_initcpu_timers_initcpu_throttle_init/* 注册throttle timer* 超时单位:ns* timer回调:cpu_throttle_timer_tick* 超时时间:无* 超时时间类型:虚拟机运行时间* */throttle_timer = timer_new_ns(QEMU_CLOCK_VIRTUAL_RT, cpu_throttle_timer_tick, NULL);                

启动cpu throttle

  • 迁移线程通过调用cpu_throttle_set函数触发cpu throttle的定时器,参数为vcpu睡眠时间与throttle周期的百分比,qemu定义全局静态变量throttle_percentage来控制throttle的运行,throttle_percentage大于0时触发cpu throttle,等于0时停止cpu throttle,流程如下:
void cpu_throttle_set(int new_throttle_pct)
{/** boolean to store whether throttle is already active or not,* before modifying throttle_percentage* 取出全局变量throttle_percentage判断throttle是否启动*/bool throttle_active = cpu_throttle_active();/* 确保睡眠百分比在1-99范围内 *//* Ensure throttle percentage is within valid range */new_throttle_pct = MIN(new_throttle_pct, CPU_THROTTLE_PCT_MAX);new_throttle_pct = MAX(new_throttle_pct, CPU_THROTTLE_PCT_MIN);qatomic_set(&throttle_percentage, new_throttle_pct);/* 如果throttle没有启动,触发 */if (!throttle_active) {cpu_throttle_timer_tick(NULL);}
}
  • cpu_throttle_set对输入进行了检查并查看throttle是否启动,如果没有启动则触发,启动cpu throttle的真正工作在cpu_throttle_timer_tick中完成:
static void cpu_throttle_timer_tick(void *opaque)
{CPUState *cpu;double pct;/* Stop the timer if needed */if (!cpu_throttle_get_percentage()) {		/* 检查throttle是否有必要停止 */return;}CPU_FOREACH(cpu) {							/* 遍历虚机每个vcpu */if (!qatomic_xchg(&cpu->throttle_thread_scheduled, 1)) {	/* 如果vcpu启动throttle任务 */async_run_on_cpu(cpu, cpu_throttle_thread,				/* 将cpu_throttle_thread任务添加到vcpu的work_list链表中 */RUN_ON_CPU_NULL);}}/* 根据睡眠百分比计算throttle周期,将其设置为throttle timer的超时时间 * 从这里可以看出,throttle timer的超时时间与睡眠百分比有关**/pct = (double)cpu_throttle_get_percentage() / 100;timer_mod(throttle_timer, qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL_RT) +CPU_THROTTLE_TIMESLICE_NS / (1 - pct));
}
  • cpu_throttle_thread函数封装成任务并挂到vcpu的work_list链表的工作由async_run_on_cpu完成,继续分析:
void async_run_on_cpu(CPUState *cpu, run_on_cpu_func func, run_on_cpu_data data)
{struct qemu_work_item *wi;/* 将cpu_throttle_thread封装成qemu_work_item */wi = g_malloc0(sizeof(struct qemu_work_item));wi->func = func;wi->data = data;wi->free = true;/* 挂入work_list链表 */queue_work_on_cpu(cpu, wi);
}
  • 完成work挂入work_list链表的操作后,queue_work_on_cpu最后会kick vcpu,让vcpu从guest态返回到用户态,如下:
static void queue_work_on_cpu(CPUState *cpu, struct qemu_work_item *wi)
{qemu_mutex_lock(&cpu->work_mutex);QSIMPLEQ_INSERT_TAIL(&cpu->work_list, wi, node);	/* 任务添加到链表 */wi->done = false;qemu_mutex_unlock(&cpu->work_mutex);/* 使vcpu从guest态退出到用户态,处理work_list上的任务 */qemu_cpu_kick(cpu);
}

vcpu睡眠

  • 在分析vcpu如何执行睡眠任务前,我们先追溯一下vcpu线程工作流程:
x86_cpu_realizefnqemu_init_vcpucpus_accel->create_vcpu_thread(cpu)	<=>	kvm_start_vcpu_threadqemu_thread_create(cpu->thread, thread_name, kvm_vcpu_thread_fn, cpu, QEMU_THREAD_JOINABLE);
  • qemu主线在实例化vcpu时会创建vcpu线程kvm_vcpu_thread_fn,此后vcpu线程会一直运行直到虚机被销毁,vcpu线程工作流程如下:
static void *kvm_vcpu_thread_fn(void *arg)
{......do {if (cpu_can_run(cpu)) {/* 下发KVM_RUN命令字让vcpu进入guest态运行* 用户态vcpu线程睡眠 * 迁移线程kick vcpu线程时,内核发送IPI核间中断到vcpu所在物理核* 硬件会让vcpu从guest态退出,返回到用户态* 然后用户态vcpu线程被唤醒,kvm_cpu_exec函数返回* */kvm_cpu_exec(cpu);......}/* 用户态vcpu线程被唤醒后,调用qemu_wait_io_event处理相关工作* 其中就包括执行work_list上的任务* */qemu_wait_io_event(cpu);} while (!cpu->unplug || cpu_can_run(cpu));......
}
  • 从上面分析可知,qemu_wait_io_event是vcpu处理work_list上任务的入口,继续分析:
qemu_wait_io_eventqemu_wait_io_event_commonprocess_queued_cpu_workwi->func(cpu, wi->data)	<=>	cpu_throttle_thread
  • process_queued_cpu_work函数会遍历work_list上的work并逐一执行work注册的任务,包括实现cpu throttle注册的cpu_throttle_thread任务,我们分析cpu_throttle_thread函数的具体实现:
static void cpu_throttle_thread(CPUState *cpu, run_on_cpu_data opaque)
{double pct;double throttle_ratio;int64_t sleeptime_ns, endtime_ns;/* 取出全局变量throttle_percentage判断是否继续睡眠 */if (!cpu_throttle_get_percentage()) {return;}/* 根据睡眠百分比计算得到线程要睡眠的时间 */pct = (double)cpu_throttle_get_percentage() / 100;throttle_ratio = pct / (1 - pct);/* Add 1ns to fix double's rounding error (like 0.9999999...) *//* 算出线程要睡眠的时间 */sleeptime_ns = (int64_t)(throttle_ratio * CPU_THROTTLE_TIMESLICE_NS + 1);endtime_ns = qemu_clock_get_ns(QEMU_CLOCK_REALTIME) + sleeptime_ns;/* 如果线程睡眠时间大于0并且cpu没有终止运行,进入睡眠 */while (sleeptime_ns > 0 && !cpu->stop) {if (sleeptime_ns > SCALE_MS) {/* 如果睡眠时间大于1ms,我们将以ns为单位的sleeptime_ns转化为ms * 让线程在halt_cond信号量上休眠等待sleeptime_ns,休眠过程中如果* 信号量halt_cond由信号发来,线程会被唤醒* */qemu_cond_timedwait_iothread(cpu->halt_cond,sleeptime_ns / SCALE_MS);} else {/* 如果睡眠的时间小于1ms,直接睡眠 */qemu_mutex_unlock_iothread();g_usleep(sleeptime_ns / SCALE_US);qemu_mutex_lock_iothread();}/* 更新睡眠时间 */sleeptime_ns = endtime_ns - qemu_clock_get_ns(QEMU_CLOCK_REALTIME);}/* 完成睡眠,设置throttle_thread_scheduled为0表示vcpu的throttle线程终止 */qatomic_set(&cpu->throttle_thread_scheduled, 0);
}
  • 这里有个疑问,为什么睡眠时间大于1ms和小于1ms要分开处理,个人猜测是为了处理cpu终止的情况,由于睡眠时间大于1ms,时间较长,这个过程中有可能qemu主线程想让vcpu线程终止,qemu主线程会设置cpu->stop为true,并在cpu->halt_cond广播,此时throttle线程睡在cpu->halt_cond上就会被唤醒,然后更新睡眠时间,如果检查到睡眠时间还是大于0但cpu->stop为true,那么throttle线程就不会再进入循环继续睡眠而直接终止。从而达到终止throttle线程的目的。对于睡眠时间小于1ms,qemu可能认为时间较短影响很小。

停止cpu throttle

  • 停止cpu throttle通过cpu_throttle_stop完成,非常简单,直接设置全局变量throttle_percentage为0,定时器的回调函数和throttle线程都会检查这个变量,一旦为0,就会直接返回
void cpu_throttle_stop(void)
{qatomic_set(&throttle_percentage, 0);
}

http://www.ppmy.cn/news/254390.html

相关文章

多CPU和多核CPU对应多进程和多线程调度

目录 cpu架构和工作原理多核cpu和多cpu 架构cpu的缓存进程和线程进程和线程在多核cpu&#xff0c;多cpu中的运行关系 cpu架构和工作原理 计算机有5大基本组成部分&#xff0c;运算器&#xff0c;控制器&#xff0c;存储器&#xff0c;输入和输出。运算器和控制器封装到一起&a…

MIPS单周期CPU

一、单周期CPU介绍 单周期CPU顾名思义就是一个指令周期内只执行一条指令的CPU。 比如下面的指令 在单周期CPU中执行的过程&#xff0c;体现为&#xff1a; 在每一个周期(时钟上升沿)&#xff0c;就执行完一条指令。 二、CPU设计 CPU是由一个指令存储器(IM&#xff0c;instr…

CPU详解

一、CPU简介 现在电脑早已成为人们生活中不可或缺的一部分了&#xff0c;而熟悉电脑的人都知道电脑里面有个CPU&#xff0c;但是要问起来CPU到底是什么&#xff0c;恐怕很多人都是说不上来一个道道的&#xff0c;而今天就来给大家讲解一下CPU到底是什么和一些CPU重要的参数。 …

CPU基础知识详解

CPU基础知识详解 1.CPU的组成: 1.CPU的组成部分: cpu的三大组成部分分别是:1、运算器;2、控制器;3、寄存器 按照功能划分&#xff08;主要组成&#xff09;&#xff1a;控制器、寄存器、运算器 还有说法&#xff08;都是主要大概&#xff09;&#xff1a;CPU 的内部由寄存…

CPU 工作原理(附详细图解)

&#x1f338;学习目标&#x1f338; 本章我们将从软件工程师的角度去了解计算机是如何工作的&#xff0c;通过对计算机核心工作机制的学习&#xff0c;有利于理解我们平时编程时的一些行为&#xff0c;动作的历史渊源。 在学习 CPU&#xff08;中央处理器&#xff09;之前&…

2023/6/6总结

CSS 如果想要实现背景颜色渐变效果&#xff1a; left是从左边开始&#xff0c;如果想要对角线比如&#xff0c;左上角就是left top&#xff0c;渐变效果始终是沿着一条线来实现的。 下面是跟着视频教学用flex布局写的一个移动端网页&#xff1a; html代码&#xff1a; <!…

操作系统死亡启示录

操作系统死亡启示录 文 | itlaoyou-com&#xff0c;作者 | 曹亦卿 以斗争求和平&#xff0c;则和平存。以妥协求和平&#xff0c;则和平亡。 规律不因时代变迁而失效。一代伟人从战争与炮火中总结出的道理&#xff0c;在和平时期的经济与科技博弈中再一次展现智慧。 美国贸…

我们都是IT民工---------流浪人IDE开发札记

你生命中的有些东西终究会失去&#xff0c;比如我住了6年的陈寨&#xff0c;这个聚集了郑州十几万IT民工的地方&#xff0c;说拆就拆了。再比如我玩了3年的坦克英雄&#xff0c;这个带给我太多快乐的游戏&#xff0c;说停就停了。 编程对我而言是种爱好&#xff0c;我上学6年&a…