高效微调理解(prompt-tuning,p-tuning v1,p-tuning v2,lora)

devtools/2024/10/18 17:32:04/

高效微调(prompt-tuning,p-tuning v1,p-tuning v2,lora)

1.prompt-tuning:

例子理解;保持原本模型参数不变,通过训练提示词的参数调整prompt,使其与下游任务匹配。
例子:

在这里插入图片描述

2.p-tuning:

与prompt-tuning不同的是, prompt 不再是固定的文本,而是通过可学习的向量来表示
例子:
在这里插入图片描述

3.p-tuning v2:

与p-tuning不同的是v2在每一层(encoder / decoder)都加入[learned prefix]。

4.lora:

Lora方法指的是在大型语言模型上对指定参数增加额外的低秩矩阵,也就是在原始PLM旁边增加一个旁路,做一个降维再升维的操作。并在模型训练过程中,固定PLM的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的参数叠加。用随机高斯分布初始化A,用0矩阵初始化B。
结构图:
在这里插入图片描述


http://www.ppmy.cn/devtools/125064.html

相关文章

深度学习+点云实现双目相机物体3D尺寸测量(长、宽、高)

目录 1,深度学习 2,点云 3,双目相机 4,深度学习与点云结合 5,效果展示 1,深度学习 深度学习是机器学习的一个子领域,它基于人工神经网络的学习算法。深度学习模型能够学习数据的多层次表示…

云原生知识点-系统架构师(七十九)

1介绍SOA?介绍ESB? 解析: SOA是面向服务架构,提供ESB总线将各个独立的服务关联起来,解耦各个服务直接关联,通过ESB服务总线把他们关联起来。 ESB服务总线支持不同服务的数据格式统一转换,保证…

架构师知识梳理(八):系统安全

信息安全概念 信息安全包括5个基本要素:机密性、完整性、可用性、可控性与可审查性。 机密性:确保信息不暴露给未授权的实体或进程。完整性:只有得到允许的人才能修改数据,并且能够判别出数据是否已被篡改。可用性:得…

【数据结构】邻接表

一、概念 邻接表是一个顺序存储与链式存储相结合的数据结构,用于描述一个图中所有节点之间的关系。 若是一个稠密图,我们可以选择使用邻接矩阵;但当图较稀疏时,邻接矩阵就显得比较浪费空间了,此时我们就可以换成邻接…

【C语言】使用结构体实现位段

文章目录 一、什么是位段二、位段的内存分配1.位段内存分配规则练习1练习2 三、位段的跨平台问题四、位段的应用五、位段使用的注意事项 一、什么是位段 在上一节中我们讲解了结构体,而位段的声明和结构是类似的,它们有两个不同之处,如下&…

C语言内存管理

内存分布 C代码编译过程 预处理 宏定义展开、头文件展开、条件编译,这里并不会检查语法编译 检查语法,将预处理后文件编译生成汇编文件汇编 将汇编文件生成目标文件(二进制文件)链接 将目标文件链接为可执行程序 进程的内存分布 程序运行起来(没有结…

Go Gin 框架与 HTML 模板学习笔记

文章目录 1. 简介2. 安装与项目结构项目结构: 3. 基本使用3.1 创建基本的 HTTP 服务3.2 创建模板文件3.3 运行程序 4. Gin 模板渲染详解4.1 传递数据 5. 处理复杂数据结构5.1 传递切片数据 6. 静态文件服务7. 模板的高级特性7.1 条件判断7.2 循环语句7.3 自定义模板…

【实时计算 Flink】检查点和快照超时的诊断方法与调优策略

Flink的状态管理是一个复杂而关键的领域,涉及到作业的性能、稳定性和资源利用等多个方面。通过对状态生成机制和优化策略地深入理解与正确应用,结合实时计算Flink版提供的产品能力,可以帮您有效地优化Flink作业以应对大规模状态作业带来的挑战…