P-tuning、Prompt-tuning和Prefix-tuning区别是什么?

embedded/2024/11/14 19:01:12/

概念

Prompt Tuning 是通过在输入序列前添加额外的 Token 来适配下游任务的方法。这些额外的 Token 是可训练的,而预训练语言模型的参数保持不变。
Prefix Tuning 是在每层 Transformer 结构的输入前添加一组可训练的 Token。这样,模型在处理输入序列时,每一层的输入都会包含这些额外的 Token,从而适配下游任务。
P-Tuning 是 Prompt Tuning 的一种变体,其核心思想是在特定位置插入可训练的 Token,使模型能够更好地理解下游任务的需求。P-Tuning 方法通过在输入序列中间插入额外的 Prompt Token,使模型在处理输入时能更好地捕捉上下文信息。

Prefix Tuning对比P-tuning

  • Prefix Tuning是将额外的embedding加在开头,看起来更像模仿Instruction指令,而P-tuning位置不固定;
  • Prefix Tuning通过在每个层都添加可训练参数,通过MLP初始化,而P-Tuning只在输入的时候加入embedding,并通过LSTM或MLP初始化。

Prefix Tuning对比Prompt-tuning

  • Prompt Tuning方式可以看做是Prefix Tuning的简化,只在输入层加入 prompt tokens,并不需要加入MLP进行调整(MLP处理prefix得到hidden state)来解决难训练的问题。

P-tuning和Prompt-tuning的区别

  • P-Tuning在输入的时候加入embedding,并通过LSTM或MLP初始化,且位置不固定,后续的版本中在每个层也都加了embedding,而prompt-tuning值在输入加上虚拟的token来学习,还不是自由参数形式。

http://www.ppmy.cn/embedded/136821.html

相关文章

MySQL基础-单表查询

语法 select [distinct] 列名1,列名2 as 别名... from数据表名 where组前筛选 group by分组字段 having组后筛选 order by排序的列 [asc | desc] limit 起始索引,数据条数 测试数据 # 建测试表 create table products (id int primary key a…

CMS那点事

大家好,今天我们来深入探讨JVM垃圾回收机制中备受关注的老年代垃圾回收器——CMS(Concurrent Mark Sweep)。 CMS垃圾回收算法:标记-清理 CMS的核心算法是标记-清理。简单来说,它分为两个主要步骤: 标记&a…

外贸行业热门CRM系统大盘点

在全球化的今天,外贸行业面临着激烈的竞争和复杂的市场环境。为了在这个竞争激烈的市场中脱颖而出,企业需要有效的客户关系管理(CRM)系统来帮助他们管理客户信息、优化销售流程和提高客户满意度。本文将盘点外贸行业中一些热门的C…

Redis设计与实现 学习笔记 第十六章 Sentinel

Sentinel(哨岗、哨兵)是Redis的高可用性(high availability)解决方案:由一个或多个Sentinel实例(instance)组成的Sentinel系统可以监视任意多个主服务器,以及这些主服务器属下的从服…

C#强大的应用场景和优势

一、简洁优雅的语法 清晰的代码结构 C# 采用了类似于 C 和 C++ 的语法风格,但更加简洁和易读。它具有明确的代码块结构,通过大括号来界定代码的范围,使得代码的层次结构一目了然。例如,在 C# 中定义一个类和方法非常直观:class MyClass {public void MyMethod(){// 方法体…

Ubuntu 20.04配置ollama并下载安装调用本地大语言模型

Ubuntu 20.04配置ollama并下载安装调用本地大语言模型 ollama 介绍(来自ChatGPT)主要特点 ollama开发环境预配置ollama在ubuntu下的安装直接安装压缩包安装创建开机ollama的脚本启动ollama ollama在ubuntu下的运行 ollama 介绍(来自ChatGPT) Ollama 是一种新的本地语言模型管理…

C++动态库和静态库的特点以及区别

目录 命名规则使用方式发布方式资源占用运行效率更新方式加载方式其他 C的库文件包括动态库和静态库两种,可以说是开发的时候必然会接触的内容,应该都很熟悉了,这篇文章就简单聊一下这两种库的特点以及区别。 命名规则 在Windows系统中动态…

Autosar CP Can State Mangement规范导读

CanSM的主要功能 CAN网络通信模式控制 管理CAN网络的启动、停止和不同通信模式(如全通信、静默通信、无通信)之间的切换。通过状态机实现对CAN网络状态的精确控制,确保网络在不同条件下稳定运行。错误处理与状态报告 根据AUTOSAR基础软件的错误分类方案处理错误,包括开发错…