尝试使用LTTng+TraceCompass分析一下进程周期偏移

news/2024/11/18 3:34:50/

准备工作

我先是在板子里通过LTTng Stream的方式将log保存在了上位机里。
然后在上位机中打开TraceCompass分析log。

导出整理log数据

然后我在events表格中搜索我的进程名,发现主要是sched_switch sched_waking sched_wakeup这三类。
然后我又搜索了一下,发现sched_switch是真正在cpu上切换了进程,waking 和 wakeup是唤醒过程的开始和结束。分别位于try_to_wake_up的入口和出口。

我准备观察一下运行周期。然后我在内容区域搜索:

next_comm=我的进程名

之后选中所有的log 导出到csv中。

然后编写公式上下两个时间戳相减。

时间戳的格式可以在Tracecompass的属性设置里 Trace那个条目下方便的更改。

得出时间差后,开启筛选。轻松找到异常的数据。

回到Tracecompass分析

我发现30ms周期的任务在某一次唤醒间隔了46ms.
我找到shced_waking 和sched_switch的位置。
发现之间确实间隔了16ms属于是wait for cpu的状态。
在这里插入图片描述
在另外的视图中显示被抢占。:
在这里插入图片描述

在仔细观察了执行流之后发现:
该进程先是在CPU0上被唤醒,但是CPU0上先唤醒了一个同优先级的RT进程。
在执行这些RT进程之前,CPU0长期陷入一个叫kworker的进程中。没有被抢占。
这个kworker还多次被irq或者软中断打断。
另外,kworker释放之后,显示被先来的同优先级RT进程占有,中间还被另外一个高优先级的RT进程抢占。

最后我观测的进程等不下去了,迁移到领一个cpu上。得到执行。

在这个过程中,另外一个cpu多次得到闲置。

这里我发现一个小技巧,可以在resources视图下,沿着cpu来走,结合调度flow看cpu的分配。

那这个优先级是20 nice=0的普普通通的kworker是什么?

在往前面看,这个kworker曾经多次被其他的rt进程抢占,甚至优先级不如本进程高。
那我怀疑可能是什么资源被占用了吧。这样需要具体进代码研究了。
好像从内核函数上并没有看出来。


http://www.ppmy.cn/news/4907.html

相关文章

[解决] We don‘t have an op for aten::normal but it isn‘t a special case

pytorch 网络转为 onnx时遇到的问题: 错误 The error is : RuntimeError: 0 INTERNAL ASSERT FAILED at “/pytorch/torch/csrc/jit/ir/alias_analysis.cpp”:532, please report a bug to PyTorch. We don’t have an op for aten::normal but it isn’t a speci…

SpringBoot实战(十)集成多数据源dynamic-datasource

目录1.Maven依赖2. DS注解3.普通Hihari连接池3.1 yml配置4.Druid连接池4.1 Druid依赖4.2 yml配置4.3 排除原生的Druid配置5. UserController6. UserServiceImpl7.测试7.1 新增数据7.2 查询数据7.3 测试结果8.源码地址:dynamic-datasource-spring-boot-starter 是一个…

北京理工大学汇编语言复习重点

汇编是半开卷,可以带纸质资料。理论上,学好了以后,带本书进去就ok了,但是这次是线上,我还没书,就对着考试重点整理一点资料用于打印吧。 因为是线上,所以第4章基本不考框架了,浮点操…

PolarDB-X源码解读:DDL的一生(下)

概述 在《DDL的一生(上)》中,我们以添加全局二级索引为例,从DDL开发者的视角介绍了如何在DDL引擎框架下实现一个逻辑DDL。在本篇,作者将从DDL引擎的视角出发,向读者介绍DDL引擎的架构、实现,以…

Sulfo CY5-MAL|磺基-CY5 马来酰亚胺

Sulfo CY5-MAL|磺基-CY5 马来酰亚胺 英文名称:Cyanine5 maleimide Cyanine5 MAL Cy5 maleimide Cy5 MAL CAS:1437872-46-2 外观:深蓝色粉末 分子量:641.24 分子式:C38H45ClN4O3 花菁染料,一种发…

Linux下/dev和/sys/class初探

文章目录引言1. devfs2. sysfssysfs 和 /dev的关系3. procATTR 与 file_operations参考链接:扩展知识引言 在用户空间操控设备可以通过/dev下的设备文件,也可以通过/sys/class下的设备文件。两者到底有什么区别?学习过程中,对于内…

企业级DevOps容器云平台流水线综合解决方案详解(二)

十、Kubeadm快速部署K8s集群 kubeadm是官方社区推出的一个用于快速部署 kubernetes 集群的工具,这个工具能通过两条指令完成一个kubernetes集群的部署。 环境要求: 一台或多台机器,操作系统CentOS 7.x-86_x64; 硬件配置:内存2GB或2G+,CPU 2核或CPU 2核+; 集群内各个机…

【电气安全】关于医疗专用隔离电源系统在医院配电系统中的应用

【摘要】 根据医疗场所分类说明医院尤其是 2 类 医疗场所的接地方案,分析医疗场所自动切断电源措 施,提出校验医疗 IT 系统配出回路长度;说明 RCD、RCM、IMD、IFLS 等的用途和范围;就应急医 院 2 类场所的配电方案进行探讨。 【…