MemVerge与美光科技利用CXL®内存提升NVIDIA GPU利用率

news/2024/11/29 19:19:54/

该联合解决方案将 GPU 利用率提高了 77%,并将 OPT-66B 批量推理的速度提高了一倍以上。

图片

2023 年 3 月 18 日,作为大内存软件领域领导者的 MemVerge,与美光科技联手推出了一项突破性解决方案,该方案通过智能分层的 CXL 内存,提升了大型语言模型(LLMs)的性能,通过从 GPU HBM 卸载到 CXL 内存。这一创新合作正在 GTC 展会的美光展位 #1030 展出,与会者可以亲身体验分层内存对 AI 工作负载的变革性影响。

MemVerge 首席执行官兼联合创始人 Charles Fan 强调了克服 HBM 容量瓶颈的关键重要性。“以成本效益的方式扩展 LLM 性能意味着要持续为 GPU 提供数据,” Fan 表示。“我们在 GTC 的演示表明,分层内存池不仅能提高性能,还能最大化提升 GPU 资源的利用率。”

由 MemVerge 和美光科技的工程师进行的演示,采用了 FlexGen 高吞吐量生成引擎和 OPT-66B 大型语言模型,运行在配备了 AMD Genoa CPU、Nvidia A10 GPU、美光DDR5-4800 DIMMs、CZ120 CXL 内存模块和 MemVerge Memory Machine™ X 智能分层软件的 Supermicro Petascale 服务器上。

演示的结果令人印象深刻。使用分层内存的 FlexGen 基准测试,完成任务的时间不到传统 NVMe 存储方法的一半。同时,GPU 利用率从 51.8% 飙升至 91.8%,这得益于 MemVerge Memory Machine X 软件在 DIMM 和 CXL 模块间透明管理数据分层的能力。

MemVerge、美光科技和 Supermicro 之间的合作标志着推进 AI 工作负载能力的重要里程碑,使企业能够实现前所未有的性能、效率和洞察力获取速度。通过利用 CXL 内存和智能分层的力量,企业可以解锁创新的新机会,并加速其走向 AI 驱动成功的旅程。

美光科技计算与网络业务部门高级副总裁兼总经理 Raj Narasimhan 表示:“通过与 MemVerge 的合作,美光能够展示 CXL 内存模块对提高 AI 应用有效 GPU 吞吐量的显著提升,美光在内存产品组合上的创新为计算提供了必要的内存容量和带宽,以扩展从云到边缘的 AI 用例。”

关于 MemVerge

MemVerge 是大内存计算软件的开创性开发者。无论是在云中还是本地部署,数据密集型工作负载都能以更快的速度、更低的成本运行,并凭借公司的获奖产品 Memory Machine™ 实现自动恢复。Memory Machine X 有望彻底改变未来 CXL®内存的使用方式,而 Memory Machine Cloud 以其持续优化云成本和性能的能力脱颖而出。了解更多关于 MemVerge 及其 Memory Machine 软件的信息,请访问 www.memverge.com。


http://www.ppmy.cn/news/1550968.html

相关文章

《Python语言程序设计》(2018年版)第15遍刷第1章第1题和第2题

2024.11.28 重新开始刷题 第一章 1.1 print( Welcome to Python Welcome to Computer Science Programming is fun )1.2 text_message "Welcome to Python\n"print(text_message * 5)

蓝桥杯每日真题 - 第24天

题目:(货物摆放) 题目描述(12届 C&C B组D题) 解题思路: 这道题的核心是求因数以及枚举验证。具体步骤如下: 因数分解: 通过逐一尝试小于等于的数,找到 n 的所有因数…

鸿蒙征文|鸿蒙技术分享:使用到的开发框架和技术概览

目录 每日一句正能量前言正文1. 开发环境搭建关键技术:2. 用户界面开发关键技术:3. 应用逻辑开发关键技术:4. 应用测试关键技术:5. 应用签名和打包关键技术:6. 上架流程关键技术:7. 后续维护和更新关键技术…

javax.xml.ws.soap.SOAPFaultException: ZONE_OFFSET

javax.xml.ws.soap.SOAPFaultException 表示 SOAP 调用过程中发生了错误,并且服务端返回了一个 SOAP Fault。 错误信息中提到的 ZONE_OFFSET 可能指的是时区偏移量。在日期和时间处理中,时区偏移量是指格林威治标准时间 (GMT) 的偏移量。如果服务期望特…

基于C#+SQLite开发数据库应用的示例

SQLite数据库,小巧但功能强大;并且是基于文件型的数据库,驱动库就是一个dll文件,有些开发工具 甚至不需要带这个dll,比如用Delphi开发,用一些三方组件;数据库也是一个文件,虽然是个文…

【科研】9如何高效阅读和理解学术论文

【科研】9如何高效阅读和理解学术论文 写在最前面一、为什么需要系统的阅读方法?二、阅读论文的11步方法三、实践示例四、常见问题解答五、结语 🌈你好呀!我是 是Yu欸 🌌 2024每日百字篆刻时光,感谢你的陪伴与支持 ~ …

大数据新视界 -- Hive 与其他大数据工具的集成:协同作战的优势(上)(13/ 30)

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

MySQL 中 COUNT(1)、COUNT(*) 和 COUNT(列名) 的区别

MySQL 中 COUNT(1)、COUNT(*) 和 COUNT(列名) 的区别 在MySQL中,COUNT() 函数用于统计查询结果集中的行数。根据传入参数的不同,其行为和性能也会有所不同。本文将详细介绍 COUNT(1)、COUNT(*) 和 COUNT(列名) 之间的主要区别,并提供一些性能…