人工触发NMI获取Kdump

news/2024/11/28 10:48:15/

NMI(non-maskable interrupt),就是不可屏蔽的中断。

根据Intel的Software Developer手册Volume 3,NMI的来源有两个:

  • NMI pin
  • delivery mode NMI messages through system bus or local APIC serial bus

NMI通常用于通知操作系统发生了无法恢复的硬件错误,也可以用于系统调试与采样大多数服务器还提供了人工触发NMI的接口,比如NMI按钮或者iLO命令等。

  1. 无法恢复的硬件错误通常包括:芯片错误、内存ECC校验错、总线数据损坏等等。

  2. 当系统挂起,失去响应的时候,可以人工触发NMI,使系统重置,如果早已配置好了kdump,那么会保存crash dump以供分析。有的服务器提供了NMI按钮,而刀片服务器通常不提供按钮,但可以用iLO命令触发。

  3. Linux还提供一种称为NMI watchdog的机制,用于检测系统是否失去响应(也称为lockup),可以配置为在发生lockup时自动触发panic。原理是周期性地生成NMI,由NMI handler检查hrtimer中断的发生次数,如果一定时间内这个数字停顿了,表示系统失去了响应,于是调用panic例程。NMI watchdog的开关是通过内核参数 kernel.nmi_watchdog 或者在boot parameter中加入”nmi_watchdog=1″参数实现,比如:在RHEL上编辑

vi /boot/grub/menu.lst
kernel /vmlinuz-2.6.18-128.el5 ro root=/dev/sda nmi_watchdog=1

然后你会看到:

grep NMI /proc/interrupts
NMI: 0 0 0 0

Linux kernel笼统地把NMI分为三大类:
4. 内存校验错 mem_parity_error()
5. 总线数据损坏io_check_error()
6. 其他的全部归入unknown_nmi_error()。kernel对NMI是不能精确定位的,对故障诊断很不利,硬件驱动程序可以注册自己的NMI处理例程,kernel会在发生NMI之后通过notify_die()调用这些第三方注册的处理例程。

如何获取Kdump

  1. 装配有kdump service
  2. 配置crashkernel的grub2参数
  3. 开启kdump.service
  4. echo c > /etc/sysrq-trigger触发
  5. 之后应该能在/var/crash/下看到dump

http://www.ppmy.cn/news/668871.html

相关文章

Linux网络系列--PXE高效批量网络装机(使用PXE远程装机、实现无人值守自动装机)

文章目录 一、 部署PXE远程安装服务1.1 搭建PXE远程安装服务器1.1.1 准备安装源1.1.2 安装 、配置dhcp服务1.1.3 安装和配置syslinux、tftp服务1.1.4 准备Linux内核、初始化镜像文件1.1.5 准备PXE引导程序、启动文件菜单1.1.6 启动服务1.1.7 进行测试 二、 kickstart无人值守安…

【AI芯片】第四波计算浪潮到来:人工智能需要怎样的硬件?

来源:本文由电姬翻译自nextplatform,作者Nick Tausanovitch,谢谢。 美国投资公司Jefferies 最近一份报告称第四波计算浪潮已经开始,而且正受到物联网和并行处理方案的发展的推动。自 20 世纪 60 年代以来,计算领域的结…

马上2023年了,《北上广深杭》有哪些值得加入的软件测试大厂公司呢?花了三天三夜整理出各大互联网公司

IT行业做技术很公平,没那么看重出身,只要你技术好,能力强,就能进大厂,拿高薪。IT行业算是目前为数不多的比较容易屌丝逆袭的行业之一,IT行业也从来不缺少造富神话。一起加油吧,打工人&#xff0…

【题目精刷】2022AMD-数字IC-B

为了能够在做题目的过程中学习到需要的知识,对每道题知识参考或者知识详情都做了详细的说明。方便后续复习。欢迎对文中的解答批评指正。 这套题很多硬件知识,由于对硬件不了解,所以题目没有作答。 文章目录 1. Whichs setup timing check i…

ipmi 最新和MegaCli 监控磁盘和raid信息

集群监控之 —— ipmi操作指南 原创 2010年03月23日 16:45:00 标签:集群 /服务器 /command /callback /user /interface 12224 这两天,配置了一堆500来个节点的大型集群,被ipmi的问题困扰了一天半,到下午16:40&#xf…

计算机组成原理-1

小历史computer首先指一种职业,后来才指机器步进计算器(实现,沿用了3世纪,世界上第一台能做加减乘除全部四种运算的机器)(德国莱布尼茨制造)差分机(未实现,有草稿&#x…

芯片科普 | IC行业最全产业链梳理​

芯片种类越多、功能越强大,就越让人忍不住好奇:一颗芯片究竟是如何“披荆斩棘、打磨棱角”来到我们面前的? 芯片设计、芯片制造(晶圆加工)、芯片封装、芯片测试,这四大环节是一颗芯片从无到有的必经之路。…

Imagination开发者系列在线课程第三期:3D 图形介绍

为了让更多开发者和从业者了解 GPU 及相关技术,进行更好的技术探讨交流,Imagination 特别推出开发者系列在线课程。 本系列课程共包含:PowerVR架构概览;PowerVR 工具和SDK;3D 图形;PowerVR 性能建议指南&am…