LLM - Transformer 的 多头自注意力(MHSA) 理解与源码

ops/2024/10/20 15:44:47/

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://spike.blog.csdn.net/article/details/140281680

免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。


MHSA

Transformer 中,多头自注意力机制 (MHSA, Multi-Head Self-Attention) 是核心创新之一,极大地提升模型处理序列数据的能力。

**自注意力机制 (Self-Attention) **

自注意力机制的核心思想是,在序列中的每个元素都与其他所有元素相关,这种关系是通过注意力权重来表示。具体来说,自注意力机制通过以下步骤计算:

  1. 计算 Query、Key 和 Value 矩阵:输入序列,通过线性变换生成 Query(Q)、Key(K) 和 Value(V) 矩阵。
  2. 计算注意力权重:通过点积计算 Query 和 Key 的相似度,通过 softmax 函数归一化,得到注意力权重。
  3. 加权求和

http://www.ppmy.cn/ops/56261.html

相关文章

SAP PS学习笔记01 - PS概述,创建Project和WBS

本章开始学习PS(Project System)。 1,PS的概述 PS(Project System)是SAP企业资源规划系统中的一个关键模块,主要用于项目管理。 它提供了一个全面的框架来规划、控制和执行项目,涵盖了从项目启…

数据结构第08小节:双端队列

双端队列(deque,double-ended queue)是一种具有队列和栈特性的数据结构,允许在其两端进行插入和删除操作。在Java中,java.util.Deque接口就是双端队列的实现,而ArrayDeque和LinkedList是其中的具体实现类。…

压测jmeter 插件 之 tps和响应时间图

1. 背景 进行压测ing 2. 需要插件 TPS 和 响应时间 3. 插件 在 选项-最下面-plugins Manager 在 Available Plugins 中 搜索 :jpgc - Standard Set 重启安装就好啦

dify/api/models/web.py文件中的数据表

源码位置:dify/api/models/web.py SavedMessage 表结构 字段英文名数据类型字段中文名字备注idStringUUIDIDUUID生成app_idStringUUID应用ID非空message_idStringUUID消息ID非空created_by_roleString创建者角色非空,默认值为’end_user’created_bySt…

npm/yarn/cnpm 淘宝镜像配置,包版本管理

一、包管理命令安装 为啥要安装这么多,有些情况会安装失败,npm安装最好设置外网代理 优先级推荐(个人喜好) cnpm > yarn > pnpm > npm # yarn安装 npm i yarn -g yarn config set registry http://registry.npm.taobao.org/# cnpm安装 npm i c…

【ARMv8/v9 GIC 系列 5.1 -- GIC GICD_CTRL Enable 1 of N Wakeup Function】

请阅读【ARM GICv3/v4 实战学习 】 文章目录 GIC Enable 1 of N Wakeup Function基本原理工作机制配置方式应用场景小结GIC Enable 1 of N Wakeup Function 在ARM GICv3(Generic Interrupt Controller第三代)规范中,引入了一个名为"Enable 1 of N Wakeup"的功能。…

56、Flink DataStream 的管理执行配置详解

1)概述 1.执行配置 StreamExecutionEnvironment 包含了 ExecutionConfig,它允许在运行时设置作业特定的配置值。 StreamExecutionEnvironment env StreamExecutionEnvironment.getExecutionEnvironment(); ExecutionConfig executionConfig env.get…

【测试】五子棋项目测试报告

目录 一、项目概述及测试目标 二、项目功能 三、测试类型 1)功能测试 ​编辑 2)自动化测试 四、测试总结 一、项目概述及测试目标 本项目是一个基于Web的五子棋实时对战应用,旨在提供用户之间的多人实时游戏体验。项目采用前…