大模型并行:TP, PP, DP,MP

ops/2024/11/29 3:52:33/

目录

大模型并行:TP, PP, DP,MP

张量并行(TP)

数据并行(DP)

模型并行(MP)

流水线并行(PP)

TP:张量模型并行

一、定义与基本原理

二、切分方式

三、主要优势与挑战

优势

挑战

四、应用场景

五、注意事项


大模型并行:TP, PP, DP,MP

数据并行(Data Parallelism, DP)、模型并行(Model Parallelism, MP)和流水线并行(Pipeline Parallelism, PP)是并行计算中三种常见的策略,它们各自具有独特的特点和适用场景。

张量并行(TP)

解决内存墙的问题。模型的权重矩阵被分割成多个部分,每个部分由不同的设备负责计算。TP的通信主要发生在前向和后向传播过程中,设备之间需要交换分割后的中间结果。由于需要在每次前向和后向传播时进行通信,TP的通信量也相当大。需要进行concat操作。

数据并行(DP)

数据并行是一种将数据集划分为多个部分,并


http://www.ppmy.cn/ops/137554.html

相关文章

2024 年河北省职业院校技能大赛网络建设与运维赛项样题五

2024 年河北省职业院校技能大赛网络建设与运维赛项 赛题 赛题说明 一、竞赛项目简介 “网络建设与运维”竞赛共分为模块一:网络理论测试&#x

蓝桥杯练习题

目录 1.劲舞团 2.数字诗意 3.封闭图形个数 4.回文数组 欢迎 1.劲舞团 0劲舞团 - 蓝桥云课 #include <iostream> using namespace std; int main() {int num1,M0;long long c[1000000];int cnt0;string a,b ;while(cin>>a>>b>>c[cnt])//系统自动输入…

【VUE】el-table表格内输入框或者其他控件规则校验实现

1、封装组件 1、规则校验一般基于form表单实现&#xff0c;因此需要给具体控件套一层form表单 新建组件input-required.vue&#xff0c;内容如下 <template><div><el-form ref"formRef" :model"form" :rules"formRules" label-…

Java常见的锁策略

目录 Java常见的锁策略悲观锁和乐观锁轻量级锁和重量级锁自旋锁和挂起等待锁普通互斥锁和读写锁公平锁和非公平锁可重入锁和不可重入锁Java中的synchronized算哪种情况&#xff1f;系统原生的锁算哪种情况&#xff1f;synchronized的加锁过程&#xff0c;尤其是“自适应”是咋回…

【软件入门】Git快速入门

Git快速入门 文章目录 Git快速入门0.前言1.安装和配置2.新建版本库2.1.本地创建2.2.云端下载 3.版本管理3.1.添加和提交文件3.2.回退版本3.2.1.soft模式3.2.2.mixed模式3.2.3.hard模式3.2.4.使用场景 3.3.查看版本差异3.4.忽略文件 4.云端配置4.1.Github4.1.1.SSH配置4.1.2.关联…

Leetcode - 周赛424

目录 一&#xff0c;3354. 使数组元素等于零 二&#xff0c; 3355. 零数组变换 I 三&#xff0c;3356. 零数组变换 II 四&#xff0c;3357. 最小化相邻元素的最大差值 一&#xff0c;3354. 使数组元素等于零 本题实际上是一个前/后缀和的问题&#xff0c;就是判断前缀和与后…

Tri Mode Ethernet MAC IP核详解

本文对 Vivado 的三速 MAC IP 核&#xff08;Tri Mode Ethernet MAC&#xff0c;TEMAC&#xff09;进行介绍。 在自行实现三速以太网 MAC 控制器时&#xff0c;GMII/RGMII 接口可以通过 IDDR、ODDR 原语实现&#xff0c;然而实际使用中自己实现的模块性能不是很稳定&#xff08…

单片机电路基本知识

单片机电路基本知识 MCU(C51) 概念&#xff1a;应用实例家用电子&#xff0c;汽车电子&#xff0c;嵌入式系统&#xff0c;低成本&#xff0c;低功耗&#xff0c;小型化&#xff0c;通常使用c语言或者汇编语言&#xff0c;用于家用电器控制&#xff0c;智能家居&#xff0c;汽…