微软推出最新 Azure 虚拟机 ND H200 v5 系列

server/2024/12/22 9:17:58/

声明:本文翻译自微软全球官方博客,ND H200 v5 系列虚拟机目前只在 Microsoft Azure 海外版上发布。

随着人工智能领域的高速发展,企业对于可扩展和高性能基础设施的需求呈指数级增长。客户需要 Azure AI 基础设施来开发智能驱动的创新解决方案,为满足客户的需求,我们推出了基于 Azure ND H200 v5 系列虚拟机(VM)的新型云端人工智能超级计算集群。这些虚拟机现已在 Microsoft Azure 海外版上正式发布,专为处理复杂的高级人工智能工作负载(从基础模型训练到生成推理)量身定制。ND H200 v5 虚拟机的规模、效率和增强性能,推动了客户对于微软人工智能服务(如 Azure 机器学习和 Azure OpenAI 服务(国际版))的采用。

图片

H200 超级计算集群的设计还能更高效地管理 GPU 内存的模型权重、键值缓存和批处理大小,这些因素都会直接影响基于大语言模型(LLM)的生成式人工智能推理工作负载中的吞吐量、延迟和成本效益。ND H200 v5 VM 拥有更大的高带宽内存容量,可以支持更高的批处理大小。与 ND H100 v5 系列相比,ND H200 v5 VM 可在推理工作负载中实现更高的 GPU 利用率和吞吐量。在早期测试中,我们观察到在运行 LLAMA 3.1 405B 模型的推理工作负载中,ND H200 v5 虚拟机的吞吐量比 ND H100 v5 系列提升高达 35%

Azure ND H200 v5 虚拟机采用微软的系统设计方法,以提高效率和性能。特别要说明的是,它还解决了 GPU 原始计算能力增长速度远快于附带内存和内存带宽的差距问题。相比上一代 Azure ND H100 v5 虚拟机,Azure ND H200 v5 系列虚拟机的高带宽内存(HBM)增加了 76%,141 GB 的高速内存和 4.8 TB/秒的内存带宽,可以处理更大的数据集和更复杂的模型。高带宽内存的增加,使 GPU 能够更快地访问模型参数,从而有助于降低整体应用延迟,这对于交互式代理等实时应用,至关重要。

ND H200 v5 系列以单个虚拟机和 8 个 NVIDIA H200 Tensor Core GPU 开头,与 900 GB/s NVLink 互连。 基于 ND H200 v5 的部署可以纵向扩展到成千上万个 GPU,每个虚拟机的互连带宽为 3.2Tb/秒。VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 400 Gb/秒 NVIDIA Quantum-2 CX7 InfiniBand 连接。 这些连接在占用同一虚拟机规模集的 VM 之间自动配置,并且支持 GPUDirect RDMA。

ND H200 v5 虚拟机已预先集成 Azure 批处理、Azure Kubernetes 服务、Azure OpenAI 服务(国际版)和 Azure 机器学习,可帮助企业快速上手。

您可以扫描下方二维码,了解有关全新 Azure ND H200 v5 虚拟机的更多参数信息。

图片

图片


http://www.ppmy.cn/server/130518.html

相关文章

PHP:下拉列表,颜色展示

PHP展示下拉列表,选项设置为数据库存储颜色进制,colorname是颜色名称,color是颜色进制 一、表结构 produce_info_nav1_colorshow produce_info_nav1 二、核心代码 //查询对应默认颜色 $sql_selcolor "SELECT color FROM produce_i…

鼠标右键删除使用Visual Studio 打开(v)以及恢复【超详细】

鼠标右键删除使用Visual Studio 打开(v) 1. 引言2. 打开注册表3. 进入对应的注册表地址4. 右键删除 AnyCode 项5. 效果6. 备份注册表文件——恢复菜单 1. 引言 安装完 Visual Studio 鼠标右键总有 “使用Visual Studio 打开(v)”,让右键菜单…

2024中国电信天翼云社招TAS人才测评题型分析、真题解密、高分技巧、测评题库

测评项目名称:中国电信天翼云社会招聘人才测评 测评时间:2024年 测评内容: Talent5大五职业性格测评 iLogic言语推理测评(简版) iLogic数字推理测评(简版) iLogic逻辑推理测评(…

高效微调理解(prompt-tuning,p-tuning v1,p-tuning v2,lora)

高效微调(prompt-tuning,p-tuning v1,p-tuning v2,lora) 1.prompt-tuning: 例子理解;保持原本模型参数不变,通过训练提示词的参数调整prompt,使其与下游任务匹配。 例子…

Linux——cp-mv-rm命令

cp命令 复制文件 cp test01.txt test02.txt 复制文件夹 cp -r hsy01 hsy02 mv命令 移动文件/文件夹 rm命令 删除文件 rm test.txt 删除文件夹(目录 rm -r hsy01 通配符 * 匹配任意内容 注意* 位置 强制删除-f root超级管理员

IMS核心网和5GC的区别与联系

IMS核心网(IP多媒体子系统)和5GC(5G核心网)是现代电信网络中两个重要的核心部分,虽然它们都有着核心网络功能,但它们的目标、架构和功能上有显著的区别和一些联系。 1. IMS核心网简介 IMS(IP …

MySQL8.0性能优化方法有哪些

MySQL 8.0 的性能优化是一个多方面的过程,涉及硬件配置、数据库设计、查询优化、系统配置等多个层面。 1. 硬件和操作系统优化 使用 SSD:固态硬盘(SSD)比传统的机械硬盘(HDD)提供更快的 I/O 性能。足够的…

低成本轻量化5G网络部署redcap技术

RedCap(Reduced Capability)轻量化5G路由器旨在提供低功耗、成本效益高、性能较5G完整版稍微降低的解决方案。用于满足工业物联网(IoT)、消费电子产品和轻量级5G设备的需求。通过对5G技术进行一定程度的“功能裁剪”,降…