语言大模型基础概念一（先了解听说过的名词都是什么）

语言大模型基础概念一（先了解听说过的名词都是什么）

news/2025/2/15 10:40:10/

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

STF（Supervised Fine-Tuning）和RLHF（Reinforcement Learning from Human Feedback）是两种不同的模型训练方法，分别用于不同的阶段和目的。具体介绍参考SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别_sft和rlhf-CSDN博客

LoRA（Low-Rank Adaptation）

Lora（Low-Rank Adaptation）是一种新的模型微调技术。在预训练好的模型中引入并行的低秩矩阵，用于修正预训练模型的输出（有点像ResNet，增加新的参数用来生成预训练模型的残差）。具体介绍参考理解Lora微调只需一个公式-CSDN博客

语言大模型主体架构

参考

Decoder-Only、Encoder-Only、Encoder-Decoder 区别_decoder only-CSDN博客，语言大模型知识点简介_prefix decoder-CSDN博客

1. Decoder-Only 架构
描述：仅包含解码器部分，没有编码器。
应用： 通常用于生成任务，如语言模型和对话系统。
代表模型： GPT（Generative Pre-trained Transformer）
其他： prefix Decoder (输入为之前所有的输出, $Y_{t+1}=f([X_0, X_1,..., X_t])$ ）和 causal Decoder(输入为上一时刻的输出, $Y_{t+1}=f(X_t)$ ）。

2. Encoder-Only 架构
描述：仅包含编码器部分，没有解码器。
应用： 通常用于理解任务，如文本分类和情感分析。
代表模型： BERT（Bidirectional Encoder Representations from Transformers）

3. Encoder-Decoder 架构
描述：同时包含编码器和解码器部分。
应用：通常用于序列到序列（seq2seq）任务，如机器翻译和文本摘要。
代表模型： Transformer、T5

http://www.ppmy.cn/news/1572219.html

相关文章

Lua闭包的使用以及需要注意的问题

Lua闭包的使用以及需要注意的问题

1. 闭包的基本概念在 Lua 中，闭包是一个函数值，它包含了函数本身以及该函数所创建时的环境。闭包允许函数访问其外部函数作用域中的变量，即使外部函数已经执行完毕。 2.闭包的简单使用代码：在下面的代码中，create…

阅读更多...

SGI STL内存池源代码解析----allocate内存分配函数

SGI STL内存池源代码解析----allocate内存分配函数

allocate 函数是 SGI STL 中二级空间配置器的核心函数之一，负责根据请求的内存大小分配内存。它的设计非常精巧，结合了自由链表（free list） 和内存池技术，以高效地管理小块内存（小于等于 128 字节&…

阅读更多...

Cocos Creator 3.8 版本开发 2D 游戏常用组件和方法

Cocos Creator 3.8 版本开发 2D 游戏常用组件和方法

Cocos Creator 3.8 版本开发 2D 游戏常用组件和方法一、常用组件 1. Node（节点） 功能：Cocos Creator 中的所有元素都基于 Node（节点）对象，包括精灵、标签、按钮等。每个节点可以包含多个子节点。常用方…

阅读更多...

2.7 静态方法/构造函数Mock

2.7 静态方法/构造函数Mock

静态方法/构造函数Mock 在单元测试中，静态方法和构造函数的Mock是相对复杂的需求，因为Mockito的核心设计基于对象实例的模拟。然而，通过扩展工具或特定技巧，可以实现对这些场景的处理。本章详解两种主流方案：PowerMoc…

阅读更多...

性格测评小程序04题库管理

性格测评小程序04题库管理

目录 1 创建数据源1.1 题库表1.2 选项表 2 搭建管理后台2.1 搭建题库功能2.2 搭建选项功能2.3 题库和选项联动 3 最终效果总结我们现在性格测评的算法是通过40个题目来测评用户属于哪一个分类，为此后台需要有可以设置题目和选项的功能，本篇我们介绍一下…

阅读更多...

github - 使用

github - 使用

注册账户以及创建仓库要想使用github第一步当然是注册github账号了， github官网地址：https://github.com/。之后就可以创建仓库了（免费用户只能建公共仓库），Create a New Repository，填好名称后Create，之后会出现一些仓库的配置信息，这也是一个git的简单教程。 Git…

阅读更多...

RK3588 Linux平台部署DeepSeek模型教程

RK3588 Linux平台部署DeepSeek模型教程

更多内容可以加入Linux系统知识库套餐（教程＋视频＋答疑） 文章目录一、下载rknn-llm 和 deepseek模型二、RKLLM-Toolkit 安装2.1 安装 miniforge3 工具2.2 下载 miniforge3 安装包2.3 安装 miniforge3 三、创建 RKLLM-Toolkit Cond…

阅读更多...

【xdoj离散数学上机】T283

【xdoj离散数学上机】T283

递归函数易错： 防止出现递归死循环！ 题目题目：求诱导出的等价关系的关系矩阵问题描述给定有限集合上二元关系的关系矩阵，求由其诱导出的等价关系的关系矩阵。输入格式第一行输入n，表示矩阵为n阶方阵&#xff0c…

阅读更多...

最新文章