【AI学习】LLaMA模型的微调成本有几何?

server/2024/9/22 14:58:24/

在前面文章《LLaMA 系列模型的进化(二)》中提到了Stanford Alpaca模型。
Stanford Alpaca 基于LLaMA (7B) 进行微调,通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成,Stanford Alpaca 生成了 52K 条指令遵循样例数据(Alpaca-52K)用于训练。
在这里插入图片描述
据说,这个训练成本不到600美元。那这个成本是如何计算的呢?
训练成本:在8个80GB A100 上训练了3个小时,不到100美元;
数据成本:生成数据使用OpenAl的API,500美元。这里就是通过使用 Self-Instruct 方法,使用了OpenAl的接口的调用成本。

在前面文章《英伟达ChipNeMo,一个领域大模型的训练案例》里,介绍了领域大模型的训练过程。如下图:
在这里插入图片描述
对应的训练时长为:
在这里插入图片描述

使用 128 个 A100 GPU 进行了训练。ChipNeMo 的领域适配预训练成本(包括基于领域数据的继续预训练和SFT),具体见下表,单位是A100 GPU hours
ChipNeMo 的领域适配预训练成本,对比从头开始预训练基础模型的总成本不到 1.5%。
在这里插入图片描述
以LLaMa 7B模型的训练来说,总训练时长=2710,按照前面“在8个80GB A100 上训练了3个小时,不到100美元”的成本折算,成本应该小于11300美金
13B模型,总训练时长=5100,成本应该小于21250美金
70B模型,总训练时长=21340,成本应该小于88920美金

至于数据,ChipNeMo 的领域适配预训练需要24B以上的数据,这个可能与相应的数据积累有很大关系,不好计算了。


http://www.ppmy.cn/server/105102.html

相关文章

电子克隆方法的优缺点有哪些?

电子克隆方法的优缺点有哪些? 李升伟 电子克隆方法的优点: 1. 高效性 - 能够快速从大量的生物信息数据中筛选和分析,大大缩短了新基因发现的时间。 2. 成本低 - 相比传统的实验克隆方法,不需要大量的实验试剂和设备&#…

二十三设计模式速记

文字版 Java设计模式通常被分为三大类:创建型模式(Creational Patterns)、结构型模式(Structural Patterns)和行为型模式(Behavioral Patterns)。每种类型包含若干种具体的设计模式。 创建型模…

存在重复元素 III

题目 给你一个整数数组 nums 和两个整数 k 和 t 。请你判断是否存在 两个不同下标 i 和 j&#xff0c;使得 abs(nums[i] - nums[j]) < t &#xff0c;同时又满足 abs(i - j) < k 。 如果存在则返回 true&#xff0c;不存在返回 false。 示例 1&#xff1a; 输入&…

Lesson 83 Go on holidays

Lesson 83 Go on holidays 词汇 mess n. 咋啊乱&#xff0c;凌乱 v. 弄乱&#xff0c;弄脏 搭配&#xff1a;mess up 事物 弄乱    make a mess 制造麻烦 例句&#xff1a;蓝墨水弄脏了她的新裙子。    She messed up her new dress with the blue ink. pack v. 包装…

html转vue项目

HTML是一种用于构建网页的标记语言&#xff0c;而Vue是一种用于构建用户界面的JavaScript框架。在HTML中使用Vue可以提供更加灵活和动态的用户界面功能。本文将介绍如何将HTML代码转换为Vue&#xff0c;并提供具体的代码示例。 首先&#xff0c;我们需要在项目中引入Vue框架。…

排查端口映射失败的几个案例

端口映射这个话题&#xff0c;已经是老生常谈了&#xff0c;别说这是网工必备技能了&#xff0c;连很多非IT人士都会在路由器上配置端口映射&#xff0c;但我为什么还要单开一篇文章来讲呢&#xff0c;是因为在我的IT外包服务过程中&#xff0c;还是碰到过很多次端口映射失败的…

2024中国AI Agent行业研究报告(PPT 可编辑)+2024中国AI Agent市场研究报告

AI大模型领地 大视研究&#xff1a;2024中国AI Agent行业研究报告 报告共计&#xff1a;60页&#xff08;PPT 可编辑&#xff09; 报告指出&#xff0c;AI Agent作为大模型时代的核心应用&#xff0c;通过自然语言处理和深度学习技术&#xff0c;实现了自主性、反应性与交互…

在表格上,按照单元格数值显示单元格背景进度条

想要实现的效果如下&#xff1a; 单元格背景进度条的大小取决于当前单元格里的数值 TreeList和GridControl的设置方法都是相同的&#xff1a;都是通过给列设置FormatRule来实现的。 相关代码及设置如下&#xff1a; 1、给控件绑定数据源&#xff0c;我的数据源是一个DataTab…