集合通讯概览

devtools/2025/2/4 18:56:59/

在这里插入图片描述

集合通信概览

在这里插入图片描述

在这里插入图片描述
(1)通信的算法 是根据通讯的链路组成的
(2)因为通信链路 跟硬件强相关,所以每个CCL的库都不一样

芯片与芯片、不同U之间是怎么通信的

在这里插入图片描述
在这里插入图片描述


多卡训练:多维并行(xxx并行在上一期已经讲述过…)

在这里插入图片描述


计算与通信解耦

在这里插入图片描述


计算与通信解耦:分布式加速库

在这里插入图片描述


☆☆☆ 从加速库 -> NPU 的执行过程

在这里插入图片描述

(1)硬件的排布 跟 组网拓扑、XCCL 非常的强相关;XCCL 跟 网络拓扑 强相关
(2)分布式加速库:MindSpeed
(3)在计算的时候,用户调用pytorch等AI框架,计算在单机里面就用到了AI的框架了,
(4)在通信的时候,就会把一些张量放到一些桶里面,当桶满的时候/满足某些条件的时候,MindSpeed加速库 就会控制张量 什么时候去调用集合通信库的接口/源语 P2P all2all 相关的内容
(5)

在这里插入图片描述

(1)XCCL跟链路层、物理层强相关,所以各个公司都有自己的XCCL;
(2)具体XCCL实现了什么功能呢?---- 参照《XCCL、NCCL、HCCL通信库》
(2)all2all 等相关的接口还是保持跟NCCL一致,方便用户调用


通信算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

不同AI时期对通讯的诉求

在这里插入图片描述

在这里插入图片描述


大模型对AI集群训练的诉求:大带宽、强同步

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


集合通讯的难点

在这里插入图片描述


http://www.ppmy.cn/devtools/156072.html

相关文章

LabVIEW透镜多参数自动检测系统

在现代制造业中,提升产品质量检测的自动化水平是提高生产效率和准确性的关键。本文介绍了一个基于LabVIEW的透镜多参数自动检测系统,该系统能够在单一工位上完成透镜的多项质量参数检测,并实现透镜的自动搬运与分选,极大地提升了检…

AJAX综合案例——图书管理

黑马程序员视频地址: AJAX-Day02-10.案例_图书管理AJAX-Day02-10.案例_图书管理_总结_V1.0是黑马程序员前端AJAX入门到实战全套教程,包含学前端框架必会的(ajaxnode.jswebpackgit),一套全覆盖的第25集视频&#xff0c…

DeepSeek大模型系列

DeepSeek 基本使用 对于DeepSeek 的使用来说,可以通过Web和APP两种方式就可以了: Web网站使用地址: https://chat.deepseek.com/APP的下载地址: https://download.deepseek.com/app/ 以上两种方式注册账号就可以,使…

TI 在 Yocto 项目中的应用解析

引言 Yocto 项目(Yocto Project)是一个广泛用于嵌入式 Linux 开发的开源项目,旨在提供一个灵活、可复用的工具链,以便为不同的硬件平台定制 Linux 发行版。德州仪器(TI)作为嵌入式系统领域的重要参与者&am…

Java 大视界 -- Java 大数据在智慧农业中的应用与实践(70)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

csapp笔记3.6节——控制(1)

本节解决了x86-64如何实现条件语句、循环语句和分支语句的问题 条件码 除了整数寄存器外,cpu还维护着一组单个位的条件码寄存器,用来描述最近的算数和逻辑运算的某些属性。可检测这些寄存器来执行条件分支指令。 CF(Carry Flag&#xff09…

最小生成树Prim算法

文章目录 最小生成树是什么Prim算法是什么模板 最小生成树是什么 最小生成树是使图中连接起来与小的最小代价 上边这张图的最小生成树就是下图 Prim算法是什么 Prim算法就是给你一个起点,每次找与这个点相邻边的最小值,直到遍历每个节点 模板 #incl…

android 音视频系列引导

音视频这块的知识点自己工作中有用到,一直没有好好做一个总结,原因有客观和主观的。 客观是工作太忙,没有成段时间做总结。 主观自己懒。 趁着这次主动离职拿了n1的钱,休息一下,对自己的人生做一下总结,…