Composing Parameter-Efficient Modules withArithmetic Operations（(NeurIPS 2023）

Composing Parameter-Efficient Modules withArithmetic Operations（(NeurIPS 2023）

news/2025/2/21 5:32:47/

一、写作动机：

参数高效微调（PEFT）方法——在保持大多数预训练参数冻结的同时仅调整少量参数，由于其竞争性能和减少的内存和存储成本而成为微调预训练语言模型（PLM）的标准方法（Houlsby等，2019；Li & Liang，2021；He等，2022）。当应用于各种数据集和应用程序时，PEFT产生了许多参数高效模块（PEMs），每个模块与不同的模型能力相关联。然后一个自然的问题出现了：我们是否可以组合这些轻量级模块以利用它们所具备的多样化技能？

二、主要贡献：

提出通过权重空间中的线性算术运算来组合这些参数高效模块，从而整合不同的模块能力。具体而言，首先为模块定义加法和取反运算符，然后进一步组合这两个基本运算符来执行灵活的算术运算。这个方法不需要额外的训练，并且实现了高度灵活的模块组合将不同的算术运算应用于组合参数高效模块，包括（1）分布泛化，（2）多任务，（3）取消学习和（4）领域转移。此外，还将我们的方法扩展到了Alpaca-LoRA。

三、方法（算数运算组合）：

（其中取反只专注在隐藏状态h的修改）

四、实验

4.1用于分布泛化的组合：

将在相同任务上训练的但分布不同的PEMs组合起来，以提高模型的泛化能力。

4.2多任务学习组合：

4.3用于取消学习的组合：

4.4用于领域迁移的组合：

http://www.ppmy.cn/news/1379244.html

相关文章

Linux系统部署火狐浏览器结合内网穿透实现公网访问

目录前言 1. 部署Firefox 2. 本地访问Firefox 3. Linux安装Cpolar 4. 配置Firefox公网地址 5. 远程访问Firefox 6. 固定Firefox公网地址 7. 固定地址访问Firefox 结语前言作者简介： 懒大王敲代码，计算机专业应届生今天给大家聊聊Linux系统…

阅读更多...

基于FPGA加速的bird-oid object算法实现

基于FPGA加速的bird-oid object算法实现

导语今天继续康奈尔大学FPGA 课程ECE 5760的典型案例分享——基于FPGA加速的bird-oid object算法实现。 （更多其他案例请参考网站： Final Projects ECE 5760） 1. 项目概述项目网址 ECE 5760 Final Project 模型说明 Bird-oid object …

阅读更多...

面试题：分布式锁用了 Redis 的什么数据结构

面试题：分布式锁用了 Redis 的什么数据结构

在使用 Redis 实现分布式锁时，通常使用 Redis 的字符串（String）。Redis 的字符串是最基本的数据类型，一个键对应一个值，它能够存储任何形式的字符串，包括二进制数据。字符串类型的值最多可以是 512MB。 Re…

阅读更多...

C# 用Trace.WriteLine输出调试信息无法查看

C# 用Trace.WriteLine输出调试信息无法查看

写程序就会遇见BUG，这时候在代码不同部位输出一些标记的信息对查找错误非常有必要，一般情况下我们都是使用Console.WriteLine()方法来打印信息到控制台窗口，但有时候使用Console.WriteLine()方法会存在不方便的情况，比如鄙人遇到的…

阅读更多...

Rust 库是如何根据 features 实现相关 Trait 的？

Rust 库是如何根据 features 实现相关 Trait 的？

看下面配置文件中的依赖库说明： [dependencies] serde { version "1", features ["derive"] } serde_json "1" chrono { version "0.4", features ["serde"] }serde 是如何实现 derive 相关 Trait 的&…

阅读更多...

计算机网络-H3C 交换机FTP与TFTP

计算机网络-H3C 交换机FTP与TFTP

一、FTP与TFTP概述 FTP，全称为File Transfer Protocol，即文件传输协议，是一种用于在Internet上进行文件传输的应用层协议。FTP是基于客户端-服务器架构设计的，并使用TCP作为其传输层协议。TFTP (Trivial File Transfer Protocol) …

阅读更多...

阅读——happy

阅读——happy

1、请简述OSI七层网络模型有哪些层及各自的含义? 物理层：底层数据传输，比如网线、网卡标准数据链路层：定义数据的基本格式，如何传输，如何标识。比如网卡MAC地址网络层：定义IP编码，定义路由功能，比如不同设备的数据转发传输层：端到端传输数据的基本功能，比如TCP、…

阅读更多...

编译支持国密的抓包工具 WireShark

编译支持国密的抓包工具 WireShark

目录前言WireShark支持国密的 WireShark小结前言在上一篇文章支持国密的 Web 服务器中，我们搭建了支持国密的 Web 服务器，但是，我们使用 360 安全浏览器去访问，却出现了错误：是我们的 Web 服务器没有配置好？在这里插入图片描述还是 360 安全浏览器不支持国密？还是两…

阅读更多...

最新文章