【LoRA】浅谈大模型微调之LoRA技术

devtools/2024/9/23 22:12:04/

在当今的信息时代中,大型语言模型扮演着至关重要的角色,它们在自然语言处理任务中展现出强大的能力。LoRA,英文全称Low-Rank Adaptation of Large Language Models,是一种用于微调大型语言模型的低秩适应技术,由微软的研究人员于 2021 年提出,这种技术能够利用少量显卡和时间对大模型进行微调,降低成本。

LoRA论文:LoRA: Low-Rank Adaptation of Large Language Models

LoRA 的核心思想是使用低秩近似来降低权重矩阵的维度,从而减少模型中可训练参数的数量。它通过添加成对的秩分解权重矩阵,也称为更新矩阵,到现有的权重中,并且只训练这些新添加的权重,从而实现对大模型的有效微调。 

LoRA对Stable Diffusion模型中最关键的部分进行小的修改:交叉注意力层。研究人员发现,微调这部分模型就足以实现良好的训练。在这些层中引入一对低秩矩阵(通常为稀疏的),分别对应于权重矩阵的增加项(additive update)和乘法项(multiplicative update),这些低秩矩阵通常具有较小的秩(rank),比如远小于原始权重矩阵的维度,这意味着它们包含的参数数量远少于直接微调整个模型所需。

通过低秩分解(先降维再升维)来模拟参数的更新量,公式如下: 

模型是过参数化的,它们有更小的内在维度,模型主要依赖于这个低的内在维度(low intrinsic dimension)去做任务适配。假设模型在适配任务时参数的改变量是低秩的,通过低秩分解来模拟参数的改变量,从而以极小的参数量来实现大模型的间接训练。

总之,LoRA 模型是一种低秩适应的训练方法,用于加速大型语言模型的训练,并降低内存消耗。它在保持原始模型性能的同时,允许用户根据需要进行定制化调整。 


http://www.ppmy.cn/devtools/113093.html

相关文章

Siri因ChatGPT-4o升级:我们的个人信息还安全吗?

随着人工智能技术的不断进步,智能语音助手如Siri、Alexa、Google Assistant等已成为我们生活的一部分。这些助手通过自然语言处理(NLP)技术与用户互动,提供更加个性化的服务。 近期,ChatGPT-4o的引入为Siri带来了全新的功能和体验&#xff0c…

如何使用ssm实现流浪动物救助站+vue

TOC ssm593流浪动物救助站vue 绪论 课题背景 身处网络时代,随着网络系统体系发展的不断成熟和完善,人们的生活也随之发生了很大的变化。目前,人们在追求较高物质生活的同时,也在想着如何使自身的精神内涵得到提升,…

【网络安全】-文件上传漏洞

文件操作漏洞包括文件上传漏洞,文件包含漏洞,文件下载漏洞。 文章目录 前言 什么是文件上传漏洞? 文件上传的验证与绕过: 1.前端js验证:   Microsft Edge浏览器: Google Chrome浏览器: 2.后端…

css grid布局属性详解

Grid布局 前言一、认识Grid1.1容器和项目1.2行和列1.3单元格和网格线 二、容器属性2.1.grid-template-columns与grid-template-rows属性2.1.1 直接使用长度单位比如px2.1.2 使用百分比 %2.1.3 使用repeat函数2.1.4 按比例划分 fr 关键字2.1.5 自动填充 auto 关键字2.1.6 最大值…

基于R语言结构方程模型分析与实践技术应用

结构方程模型(Sructural Equation Model)是一种建立、估计和检验研究系统中多变量间因果关系的模型方法,它可以替代多元回归、因子分析、协方差分析等方法,利用图形化模型方式清晰展示研究系统中变量间的因果网络关系,…

Oracle数据库中的动态SQL(Dynamic SQL)

Oracle数据库中的动态SQL是一种在运行时构建和执行SQL语句的技术。与传统的静态SQL(在编写程序时SQL语句就已经确定)不同,动态SQL允许开发者在程序执行过程中根据不同的条件或用户输入来构建SQL语句。这使得动态SQL在处理复杂查询、存储过程中…

【系统分析师】-安全体系

考点综述 (1)综合知识:包括加密密钥和公开密钥算法:计算机病毒及防治技术计算机犯罪基本概念与防范措施、入侵检测与防范、系统访问控制技术;信息删除、修改、插入和丢失;伪造与重放攻击的防止;SHA、MD5;私有信息保护。 (2)案例:根据具体案例,说明在网络与分布式环境…

从Prompt到创造:解锁AI的无限潜能

文章目录 🍊AI内容创作核心:提示词Prompt1 什么是提示词工程?1.1 提示词的原理是什么?1.2 提示词工程师:百万年薪的职业?1.3 谁都能成为提示词工程师吗? 2 提示词书写的基本技巧3 常见的提示词框架3.1 CO-…