浪潮信息MUPR自研专利 保障服务器内存运行的可靠性和高效性

devtools/2024/10/18 23:27:31/

在数字化转型的大潮中,服务器作为支撑企业业务运行的核心设备,其稳定性和可靠性显得尤为重要。然而,传统的内存故障预警修复技术往往存在反应滞后、误报率高等问题,难以满足日益增长的数据处理和存储需求。针对这一问题,浪潮信息研发团队深入剖析内存故障机理,结合人工智能和大数据技术,成功研发出新一代内存故障智能预警修复技术。

浪潮信息全新升级服务器内存故障智能预警修复技术MUPR® (Memory UCE Prevent and Repair),基于对上万台服务器故障数据的建模分析和AI模型算法的训练,围绕“预诊愈”核心技术手段,从单端预警,触发隔离防护升级为BIOS、BMC两级防护,从内存故障提前预警、内存错误实时隔离、内存故障智能修复等技术层级创新,实现在架构设计、错误类型、防护等级等方面全面增强。全天候、多方位监测服务器内存健康状态,精准预测UCE(不可纠正错误)故障,及时处理内存风险单元,使由内存故障导致的服务器宕机风险降低80%+,保障客户业务高效稳定运行。

在这里插入图片描述

该技术拥有超过20项核心专利,覆盖内存故障处理策略、防护系统架构设计、内存健康监控机制等关键技术,能够有效规避内存UCE故障的发生,切实保障服务器内存运行的可靠性和高效性。

内存故障智能预诊愈引擎,MUPR®关键修复技术
发现内存风险是第一步,而如何快速修复才是保障系统稳定的关键,MUPR®内存故障智能预警修复技术在操作系统、处理器、内存本体三个层级对风险单元进行全方位防护。

■ 操作系统层级:基于操作系统内存管理与内存故障处理机制的故障页隔离功能,可以将存在风险的内存故障页进行主动隔离不再访问。
■ 处理器层级:使用处理器级别的单颗粒纠正、锁步与块故障替换、内存镜像等技术,针对不同内存错误严重程度调用相应内存修复技术,防止数据丢失和系统崩溃。
■ 内存本体层级:基于内存SPEC及厂商定义的故障行替换机制,可以对内存故障行进行临时或永久性的替换修复。

MUPR®内存故障智能“预诊愈”引擎,可以自主选取当前内存错误最适合的修复技术,用户无需关心服务器底层的各类复杂技术的选择。针对行故障、列故障、Bank故障、块故障、Cell故障等故障的发生给出最优的修复策略。只需在服务器固件中启用MUPR®功能,ISBIOS®、ISBMC®即会通力协作,检测内存发生的每一笔CE错误,强力支撑MUPR®预诊愈引擎运行。同时,深度运用CPU平台的各种RAS修复机制,如PCLS、ADC、ADDDC等,强力释放系统容错潜能,适时启用内存颗粒的故障行PPR修复机制,精确执行Windows、Linux操作系统故障内存Page Offline,大幅度降低内存UCE故障宕机风险。在这里插入图片描述

搭载了MUPR®技术的浪潮信息元脑®服务器,可实时监测内存行、列和Cell中的微观故障,高效匹配内存UCE发生状态特征,准确预测有较大概率发生UCE错误的内存地址,基于预测结果及时启动相应的隔离修复机制,治病于未发、防患于未然。以50万台服务器级别的数据中心为例,内存UCE发生率按年化1%计算,MUPR®技术可以有效规避80%+的内存UCE发生,每年可以节省约5400万的内存故障维护费用,让系统更加平稳、高效运行。

在MUPR®关键修复技术的护航下,浪潮信息元脑®服务器不仅保障了服务器内存运行的可靠性和高效性,更在智能化预警和修复方面取得了显著突破,最终为企业带来了更流畅、稳健的运维体验。


http://www.ppmy.cn/devtools/53494.html

相关文章

three.js 第一节 - 场景、相机、渲染器

基本概念 三维的物体要渲染在二维的屏幕上,首先要创建一个场景来放置物体,那么怎么显示三维的内容呢?首先,应该找一个相机,将相机放在场景的某个位置, 然后,想要显示三维的内容,就要…

Josephus问题

Josephus问题,又称为“约瑟夫环”或“丢手绢问题”,是一个经典的计算机科学和数学问题。这个问题的起源有一个古老的故事背景,但与解决问题的具体算法设计并无直接关联。以下是Josephus问题的详细描述和一种可能的解决方案: ### …

聆思CSK6大模型+AI交互多模态开源SDK介绍

视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能与硬件外设的开发板,采用具备丰富组件生态的 Zephyr RTOS作为操作系统,官方提供了十几种开源SDK,包含大模型语音交互、大模型拍照识图、文生图、人脸识…

计算机组成原理历年考研真题对应知识点(计算机系统层次结构)

目录 1.2计算机系统层次结构 1.2.2计算机硬件 【命题追踪——冯诺依曼计算机的特点(2019)】 【命题追踪——MAR 和 MDR 位数的概念和计算(2010、2011)】 1.2.3计算机软件 【命题追踪——三种机器语言的特点(2015)】 【命题追踪——各种翻译程序的概念(2016)】 1.2.5计算…

转让北京劳务派遣许可证公司需要多少钱办理要求有哪些

北京各区办理要求也不尽相同,有的区的劳务派遣公司相对饱和,审批难度也会加大,比如朝阳,朝阳的劳务公司饱和,办理时间周期上也会需要3-4个月,如果是现有的公司批劳务资质,公司经营范围就必须有企…

海量产地工厂,就上1688找工厂token

参考链接https://blog.csdn.net/2401_84689394/article/details/138427048 h(d.token “&” i “&” g “&” c.data) 在这个JS代码前面打上断点,然后刷新页面,进行js调试。 d.token的生成 -> H5Request -> 在接口的请求头里…

JMM和底层实现原理

一、内存模型 Java内存模型(Java Memory Model,JMM)是一种规范,描述了Java虚拟机如何提供安全、正确地访问共享内存的机制。 它定义了Java程序中各个线程之间的数据交互方式,并规定了volatile关键字等多种同步机制的使…

基于EasyAnimate模型的视频生成最佳实践

EasyAnimate是阿里云PAI平台自主研发的DiT的视频生成框架,它提供了完整的高清长视频生成解决方案,包括视频数据预处理、VAE训练、DiT训练、模型推理和模型评测等。本文为您介绍如何在PAI平台集成EasyAnimate并一键完成模型推理、微调及部署的实践流程。 …