AdaPipe:动态规划解决显存和GPU在LLM计算中出现气泡问题

ops/2024/11/27 10:31:22/

目录

AdaPipe:动态规划解决显存和GPU在LLM计算中出现气泡问题

0-5表示不同数据

大的方块表示:管道,便于理解了想成GPU

黄色方块表示显存

Stage表示Attention和FFN layer(Projection和MLP)

重计算和分区策略:细化了Attention和FFN layer 

Transformer中的管道


AdaPipe:动态规划解决显存和GPU在LLM计算中出现气泡问题

AdaPipe可以根据3D并行性(即张量、数据和管道并行性)优化重计算和分区策略

张量和数据并行的规模在不同阶段是相同的。

给定一个3D并行策略,我们首先构建一个性能模型来分析时间和内存消耗,其中时间成本是针对内存约束进行优化的。

然后提出一个两级动态规划(DP)算法来优化问题。值得注意的是,在整个DP算法中,分区优化与之前的重计算优化合作,以避免陷入局部最小值。

使AdaPipe能够在不同的集群和配置中处理复杂的大型神经网络。

0-5表示不同数据


http://www.ppmy.cn/ops/137054.html

相关文章

鸿蒙动画开发07——粒子动画

1、概 述 粒子动画是在一定范围内随机生成的大量粒子产生运动而组成的动画。 动画元素是一个个粒子,这些粒子可以是圆点、图片。我们可以通过对粒子在颜色、透明度、大小、速度、加速度、自旋角度等维度变化做动画,来营造一种氛围感,比如下…

【算法】欧几里得与拓展欧几里得算法

目录 一、欧几里得算法 二、拓展欧几里得算法 2.1 裴蜀定理 2.2 拓展欧几里得算法 2.3 例题 三、线性同余方程 3.1 概念 3.2 例题 一、欧几里得算法 欧几里得算法又称辗转相除法,可用于求解两个数的最大公约数 其思路: gcd(a, b) gcd(b, a%b…

241126学习日志——[CSDIY] [ByteDance] 后端训练营 [19]

CSDIY:这是一个非科班学生的努力之路,从今天开始这个系列会长期更新,(最好做到日更),我会慢慢把自己目前对CS的努力逐一上传,帮助那些和我一样有着梦想的玩家取得胜利!!&…

Deepnote、JupyterLab、Google Colab、Amazon SageMaker、VS Code对比

功能比较 平台语言支持扩展性数据连接可视化能力DeepnotePython、R、SQL中等,依赖云端支持主要云平台(BigQuery、Snowflake等)内置仪表盘与交互图表JupyterLab多种语言,插件支持广泛极高,完全可自定义使用库&#xff…

【C++】list模拟实现(完结)

1.普通迭代器(补充) 1.1 后置和后置-- 我们迭代器里面实现了前置和前置--,还需要实现后置和后置--。 在list.h文件的list_iterator类里面实现。 //后置/-- Self& operator(int) {Self tem(*this);//保存原来的值_node _node->_nex…

111.有效数字

class Solution {public boolean isValid(String word) {if(word.length()<3){return false;}int countV0,countC0;//分别统计原音和辅音for(int i0;i<word.length();i){if(Character.isLetterOrDigit(word.charAt(i))){if(word.charAt(i)a||word.charAt(i)e||word.charA…

Xcode15(iOS17.4)打包的项目在 iOS12 系统上启动崩溃

0x00 启动崩溃 崩溃日志&#xff0c;只有 2 行&#xff0c;看不出啥来。 0x01 默认配置 由于我开发时&#xff0c;使用的 Xcode 14.1&#xff0c;打包在另外一台电脑 Xcode 15.3 Xcode 14.1 Build Settings -> Asset Catalog Compliter - Options Xcode 15.3 Build S…

Flutter实现tts语音播报

目录 引言 添加flutter_tts依赖 设置语言和发音人 macOS Android iOS 说话、停止、获取语言、设置语言、设置语音速率、获取声音、设置声音、设置音量、设置音高、是否语言可用、设置共享实例 监听平台 封装代码 使用案例 引言 随着移动应用的不断发展&#xff0c;…