Transformer - 编码器和解码器中的QKV分别来自哪

news/2024/11/16 3:32:46/

Transformer - 编码器和解码器中的QKV分别来自哪

flyfish
Transformer - 注意⼒机制 Scaled Dot-Product Attention 计算过程
Transformer - 注意⼒机制 代码实现
Transformer - 注意⼒机制 Scaled Dot-Product Attention不同的代码比较
Transformer - 注意⼒机制 代码解释
Transformer - 注意⼒机制 Attention 中的 Q, K, V 解释(1)
Transformer - 注意⼒机制 Attention 中的 Q, K, V 解释(2)

在编码器的self-attention中,QKV是从 source embedding来的
在解码器的self-attention中,QKV是从 target embedding来的
在这里插入图片描述
self-attention画的详细一些
在这里插入图片描述

在encoder-decoder-attention中
Q 是从target embedding来的
K和V 是从 contextualized source embedding来的

在这里插入图片描述
encoder-decoder-attention画的详细一些
在这里插入图片描述

例如解码器的encoder-decoder-attention中的 K和V则来自编码器
在这里插入图片描述

重复说
解码器内部自注意力的QKV均源自解码器自身,而编码器-解码器注意力中的Q来自解码器,K和V则来自编码器在这里插入图片描述
“编码器-解码器注意力”和“交叉注意力”是同一种注意力机制的不同称呼
其他名字
Encoder-decoder attention, also known as inter-attention or cross attention。
在这里插入图片描述


http://www.ppmy.cn/news/1456135.html

相关文章

SpringCloud生态体系介绍

Spring Cloud是一系列框架的有序集合。它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册、配置中心、智能路由、消息总线、负载均衡、断路器、数据监控等,都可以用Spring Boot的开发风格做到一键启动和部署。 必要说…

VBA快速删除Excel工作表

Excel处理数据时,经常需要删除部分工作表,像这样 工作中一个工作薄中十几张甚至几十张工作表是常有的事,手动一张张去删,费时费力,VBA代码可以帮你快速搞定,这就需要非常简单的代码 。 1、如果只留下一张名为“Sheet1”的工作表,其余的全删除,代码如下: For Each She…

Ansible简介版

目录 架构 环境部署 一、Ansible安装部署 1.yum安装Ansible 2.修改主机清单文件 3.配置密钥对验证 4.ansible-doc 5.看被控主机 二、常用模块 1.Command模块 2.Shell模块 3.Cron模块 1.添加 2.删除 4.User模块 5.Group模块 1.创建组 ​编辑 ​编辑 ​编辑…

【docker 】 IDEA 安装 Docker 工具

打开File->Settings->Plugins 配置 Docker 的远程访问连接 Engine APIURL :tcp://192.168.0.1:2375 (换成自己的docker开放端口) 使用diea的docker插件 查看已有的镜像 创建一个容器 下面是最近更新的文章: 【docker 】 …

链式队列基本操作

链式队列的基本概念 链式队列是一种常见的数据结构,它使用链表作为其底层数据存储结构。链式队列的特点是动态的内存分配,可以有效地处理队列的入队和出队操作。下面,我将介绍链式队列的实现方法,并提供相应的C语言代码示例。 链…

redux实现原理

Redux 是一个用于 JavaScript 应用程序状态管理的库。它被设计用来管理整个应用程序的状态,并且与 React 结合使用时非常流行。Redux 的实现原理可以简要概括为以下几个关键概念: 单一数据源 (Single Source of Truth):Redux 应用程序的所有状…

01-xss基本原理

核心:攻击的是前端&#xff0c; 一、课程引入 1、开发一个简单的PHP页面&#xff0c;代码如下&#xff1a; <?php // xss 基础演示代码&#xff1a;从浏览器中接受一个URL地址参数名为content if(isset($_GET[content])){$content$_GET[content];echo "你输入的内容…

k8s保持pod健康

存活探针 Kubemetes 可以通过存活探针 (liveness probe) 检查容器是否还在运行。可以为 pod 中的每个容器单独指定存活探针。如果探测失败&#xff0c;Kubemetes 将定期执行探针并重新启动容器。 Kubemetes 有以下三种探测容器的机制&#xff1a; HTTP GET 探针对容器的 IP 地…