微调的种类

news/2025/1/16 15:48:09/

微调的种类

flyfish

  1. 全参数微调(Full Fine-Tuning)

    • 对预训练模型的所有参数进行调整,以优化其在特定任务上的性能。
  2. 指令微调(Instruction Fine-Tuning)

    • 通过提供特定任务的明确指令或示例来微调模型,使其能够执行特定的任务,同时保持大部分预训练的知识。
  3. 部分参数微调(Partial Fine-Tuning)

    • 只调整预训练模型中的一部分参数(如后期层或特定层),而不是所有参数,以减少计算成本和过拟合风险。
  4. 适应性微调(Adapter Fine-Tuning)

    • 在预训练模型的特定层之间插入小型模块(适配器),并仅对这些模块进行微调,主模型参数保持不变,以实现高效的任务适应。
  5. 低秩近似微调(Low-Rank Adaptation, LoRA)

    • 在预训练模型的特定层插入低秩矩阵,并只调整这些矩阵的参数,以此模拟全量微调的效果,同时显著减少需要调整的参数数量。
  6. 提示微调(Prompt Tuning)

    • 通过修改输入文本的提示(Prompt)来引导模型生成符合特定任务或情境的输出,而不直接调整模型的权重,适用于零样本或少样本学习。
  7. 前缀微调(Prefix Tuning)

    • 在输入序列之前添加可学习的虚拟token作为前缀,仅更新这些前缀参数,而保持Transformer架构其他部分固定,用于提高多任务学习效率。
  8. 监督微调(Supervised Fine-Tuning, SFT)

    • 使用带标签的数据(如问答对、指令-响应对)进行有监督训练,以指导模型在特定任务上生成更准确和相关的输出。
  9. 无监督微调(Unsupervised Fine-Tuning)

    • 利用未标注的数据进行自监督学习,通过诸如下一个词预测等任务提升模型的语言理解和生成能力,增强其通用性和泛化能力。
微调方法调整参数数量资源需求适用场景优点缺点
全参数微调所有参数需要最佳性能且资源充足的任务最高的性能提升高计算资源和显存需求
指令微调全部或部分对话系统、聊天机器人等对齐人类意图,提升互动质量需要精心设计的指令和任务数据
部分参数微调部分参数资源有限或需要多任务切换的情况计算资源需求低,过拟合风险小对复杂任务的适应能力可能不如全量微调
适应性微调部分参数(适配器)需要在多个任务上进行微调高效灵活,减少计算成本和内存占用性能提升可能不如全量微调显著
低秩近似微调(LoRA)部分参数(低秩矩阵)资源有限或需要多任务切换的情况高效、低资源消耗、灵活性强可能不如全参数微调表现好
提示微调少量参数(提示嵌入)零样本或少样本学习计算资源需求低,适用于快速适应新任务对复杂任务的适应能力可能不如全量微调
前缀微调少量参数(前缀token)多任务学习减少需要更新的参数数量,提高训练效率对复杂任务的适应能力可能不如全量微调
监督微调全部或部分需要精确任务表现的应用提升特定任务的准确性和相关性需要高质量的带标签数据
无监督微调全部或部分增强模型通用性和语言能力提升泛化能力,利用大量未标注数据需要大量计算资源,效果依赖数据质量

http://www.ppmy.cn/news/1563646.html

相关文章

C语言| 求两个整数的最小值

C语言| 无参函数、有参函数、形参、实参 C语言| 函数声明、函数的返回值 【程序代码】 #include <stdio.h> //主函数&#xff0c;有且只有一个 int main(void) { int Min(int x, int y); //对Min函数的声明&#xff0c;x,y为形参 int a 111, b 222; pri…

虚拟线程JDK与Spring Core Reactor

两种虚拟线程对比&#xff1a;JDK vs. Spring Core Reactor性能对比 1、基于 JDK 的虚拟线程实现&#xff1a; 摘自实际代码&#xff1a; public static void withFlatMapUsingJDK() { ... var virtualThreadExecutor Executors.newThreadPerTaskExecutor( Thread .ofVirtual…

Docker Desktop 中安装 MySQL 并开启远程访问的详细教程

是在 Docker Desktop 中安装 MySQL 并开启远程访问的详细教程&#xff1a; 一、安装 MySQL 容器 拉取 MySQL 镜像&#xff1a; docker pull mysql:latest这将从 Docker Hub 上拉取最新版本的 MySQL 镜像。如果你想使用特定版本的 MySQL&#xff0c;可以将 latest 替换为具体…

UML系列之Rational Rose笔记九:组件图

一、新建组件图 二、组件图成品展示 三、工作台介绍 最主要的还是这个component组件&#xff1b; 然后还有这几个&#xff0c;正常是用不到的&#xff1b;基本的使用第四部分介绍一下&#xff1a; 四、基本使用示例 这些&#xff0c;主要是运用package还有package specifica…

Unity 视频导入unity后,播放时颜色变得很暗很深,是什么原因导致?

视频正常播放时的颜色&#xff1a; 但是&#xff0c;当我在unity下&#xff0c;点击视频播放按钮时&#xff0c;视频的颜色立马变得十分昏暗&#xff1a; 解决办法&#xff1a; 将File—BuildSettings—PlayerSettings—OtherSettings下的Color Space改为&#xff1a;Gamma即可…

C#实现条形码识别

见过不少人、经过不少事、也吃过不少苦&#xff0c;感悟世事无常、人心多变&#xff0c;靠着回忆将往事串珠成链&#xff0c;聊聊感情、谈谈发展&#xff0c;我慢慢写、你一点一点看...... 1.使用Nuget安装第三方库 dotnet add package ZXing.Netdotnet add package ZXing.Net.…

力扣经典练习题之40,组合总和2

今天继续给大家分享一道力扣的做题心得今天这道题目是 40 &#xff0c;组合总和 题目如下&#xff0c;题目链接&#xff1a;40. 组合总和 II 给定一个候选人编号的集合 candidates 和一个目标数 target &#xff0c;找出 candidates 中所有可以使数字和为 target 的组合。 c…

【PCIE734-1 】基于 PCIe 总线架构的 XCKU060 FPGA 4 路 SFP+光纤通道处理平台

产品概述 PCIE734-1 是一款基于 PCIE 总线架构的 Kintex UltraScale 系列 XCKU060 FPGA 高性能 4 路 SFP光纤数据处理平台。该平台具有 1 个 PCIe Gen3 x8 主机接口、4 个 SFP 10G 光纤接口&#xff0c;可以实现 4 路 SFP 10G 光纤的数据实时采集、处理、传输。板 卡 采 用 Xi…