Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记

server/2024/10/19 7:05:57/

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

综述阅读笔记
仅记录个人比较感兴趣的部分

基本知识

PEFT的三种分类：additive, selective, reparameterized, and hybrid fine-tuning
selective fine-tuning 不需要任何额外的参数，它从主干模型中选择一小部分参数，并且仅使它们可调，同时保持大多数参数在对下游任务进行微调期间保持不变。
LLM Evaluation的下游任务
(1) the first type is the General Language Understanding Evaluation (GLUE) benchmark
(2) the other type of dataset that has been used in recent LLM papers is common sense reasoning which integrated into our study caters to a variety of research facets: OpenBookQA, PIQA, Social IQA, HellaSwag, BoolQ, WinoGrande, ARC-easy, ARC-challenges
PEFT的评估基准
based on criteria such as performance, convergence, efficiency, combinability, scalability, and transferability.
ShareGPT & Microsoft Azure Function Trace & Gamma process

PEFT的分类

Additive PEFT
(1) adapters
比较感兴趣的的是CoDA
【CoDA采用稀疏激活机制来提高推理效率。具体而言，CoDA使用软top-k选择过程，识别每层中的k个重要token，这些令牌将由冻结的预训练Transformer层和适配器分支处理，以保持模型准确性。相比之下，那些不重要的token只由适配器分支处理，而跳过繁重的预训练层，因此在不影响整体性能的情况下优化推理效率。】
✘没代码
(2) soft prompt
Selective PEFT
（1）unstructured mask
Diff pruning 将可学习的掩码应用于模型权重
PaFi 选择具有最小绝对值大小的权重作为可训练的
FishMask 使用Fisher信息近似决定参数的重要性
Fish-Dip 相比于增加了每个训练周期的动态重计算
LTSFT 引入Lottery Ticket Hypothesis确定参数重要性
SAM使用二阶逼近确定掩码
（2）structured mask
SPT 使用一阶泰勒展开计算敏感参数
Reparameterized PEFT
LoRA
NOAH --> NAS

PEFT的设计

KV缓存
SLoRA在统一内存池中采用统一分页机制，以分页的方式动态分配和管理内存
内存高效的PEFT方法

PEFT的系统设计挑战

PEFT的系统设计

PEFT serving systems的系统性能的评价指标：
System throughout
Memory footprint ：内存利用率来自于模型参数与kv cache
Accuracy performance
Quality of services
PEFT training systems的有效性的评估指标：
Accuracy performance ：微调模型对下游任务的性能
Compute cost ：云服务器和边缘设备上前向和反向传播操作期间的计算成本
Communication cost ：指在云服务器和边缘设备之间传输中间数据过程中涉及的数据量

http://www.ppmy.cn/server/132978.html

相关文章

线性代数基础知识

线性代数基础知识

行列式基础知识一、行列式的定义行列式是一个函数，其定义域为det的矩阵A，取值为一个标量，写作det(A)或 | A |。行列式可以看作是一般欧氏空间中有向面积或体积概念的推广。在n维欧氏空间中，行列式描述了一个线性变换对“体积”…

阅读更多...

本地部署 Milvus

本地部署 Milvus

本地部署 Milvus 1. Install Milvus in Docker2. Install Attu, an open-source GUI tool 1. Install Milvus in Docker curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.shbash standalone_embed.sh …

阅读更多...

TemporalBench：一个专注于细粒度时间理解的多模态视频理解的新基准。

TemporalBench：一个专注于细粒度时间理解的多模态视频理解的新基准。

2024-10-15，由威斯康星大学麦迪逊分校、微软研究院雷德蒙德等机构联合创建了TemporalBench，它通过大约10K个视频问答对，提供了一个独特的测试平台，用以评估各种时间理解和推理能力，如动作频率、运动幅度、事件顺序等。…

阅读更多...

jmeter 从多个固定字符串中随机取一个值的方法

jmeter 从多个固定字符串中随机取一个值的方法

1、先新增用户参数，将固定值设置为不同的变量 2、使用下面的函数，调用这写变量 ${__RandomFromMultipleVars(noticeType1|noticeType2|noticeType3|noticeType4|noticeType5)} 3、每次请求就是随机取的值了

阅读更多...

安卓冻屏bug案例作业分享-千里马学员wms+input实战作业

安卓冻屏bug案例作业分享-千里马学员wms+input实战作业

背景： 近期有学员反馈在aosp14高版本上有了一个新窗口TaskBar，这个但是有需求就是对这个TaskBar进行隐藏，所以有一个需要对这个TaskBar进行进行隐藏需求隐藏TaskBar需求做了之后发现有如下bug： 问题复现步骤： 因…

阅读更多...

Error BackPropagation（误差逆传播）

Error BackPropagation（误差逆传播）

误差逆传播(反向传播，BP算法) 引言E 误差逆传播算法(Error BackPropagation,BP)是神经网络中常用的传播算法（又叫做反向传播）。BP算法可以应用于多层前馈神经网络（FFN）以及其他类型的网络，如训练递归神经…

阅读更多...

Scala的sortedWith

Scala的sortedWith

sortedWith：基于函数的排序，通过一个comparator函数，实现自定义排序的逻辑。 sortWith方法： 它使用传入的比较函数对集合进行排序。在排序过程中，根据比较函数的返回值来决定元素的顺序。如果比较函数返回true&…

阅读更多...

如何通过Chrome设置保护你的在线隐私

如何通过Chrome设置保护你的在线隐私

在当今数字时代，保护个人隐私和在线安全变得尤为重要。谷歌浏览器作为全球最受欢迎的网络浏览器之一，提供了多种功能来帮助用户保护自己的在线隐私。本教程将指导你如何通过谷歌浏览器设置来提高你的在线隐私保护水平。（本文由https://www.li…

阅读更多...

最新文章