【霹雳吧啦Wz】Transformer中Self-Attention以及Multi-Head Attention详解

news/2025/3/15 16:06:41/

文章目录

来源

b站视频

前天啥也不懂的时候点开来一看,各种模型和公式,直接头大,看完DASOU的视频后,重新来看,串起来了,一下子明白了,霹雳吧啦对细节有了更好的描述。

【DASOU视频记录】Transformer从零详细解读

Transformer起源

Transformer是2017年Google在Computation and Language上发表的,当时主要是针对自然语言处理领域提出的

Self-Attention

1. 求q、k、v

在这里插入图片描述
多个q、k、v可以叠在一起用矩阵来做
在这里插入图片描述

2. 计算 a ^ ( s o f t m a x 那块 ) \hat{a} (softmax那块) a^(softmax那块)

在这里插入图片描述同样可以堆在一起计算
在这里插入图片描述

3. 乘V,计算结果

在这里插入图片描述

Multi-Head Attention

多头就是给定多套q、k、v矩阵
在这里插入图片描述
在这里插入图片描述q第一个上标 表示第几个词向量,第二个上标 表示第几头
在这里插入图片描述
在这里插入图片描述

合并:将所有词向量合并在一起,得到x头个b

在这里插入图片描述

在这里插入图片描述

位置编码

如果没有位置编码,输入的顺序改变会导致不同的结果(不同线程抢占可能导致输入顺序改变。
在这里插入图片描述所以输入词向量embedding后加上位置编码结果作为模型输入。
在这里插入图片描述

这个视频主要用小例子将公式过了一遍,可以用来加深对整体过程细节的认识和把控。


http://www.ppmy.cn/news/732587.html

相关文章

adas测试工程师 车载

1.自我介绍 2.你在过往工作中遇到的比较难的问题是什么,怎么解决的,要体验自己的技术. 3介绍下自己项目 4.项目是怎么设计的,用了哪些方法举例说明 5.说下你工作中是怎么用CANoe的 6.说下你熟悉的用例设计方法 7.我看你考过了istqb证书…

matlab求偏转角,轮胎的回正力矩——侧偏角特性计算实例

轮胎的回正力矩——侧偏角特性计算实例 某轮胎额定载荷N F z 8000,在此载荷作用下附着系数 8.0y μ,侧偏刚度 rad N K /81000,转折系数1.0y E 。该轮胎半径m R 36.0,接地印迹长度m l 3.0, 载荷在印迹上的分布为抛物线)…

小车--AGX上移植程序,TensorRT版本升级遇到的问题(7.X---8.0.1.6)

备注:限8.0.1.6, 如果是tensorrt8.0.3.x会不同。 问题1:“Looser throw specifier for ‘xxxxxxxxxx’” 例子: looser throw specifier for ‘virtual void Logger::log(nvinfer1::ILogger::Severity, const char*)’ 解决:参考…

保姆级Xray安装及使用

xray的安装及使用教程 下载地址:https://github.com/chaitin/xray/releases(网址可能需要代理访问)。 选择版本,一般来说就下载最新的就可以了。我选择的是1.9.3的版本。 下载完成后解压,双击运行后可以看到一个证书…

工程经理离职,苹果自动驾驶汽车项目再遇“减速带”

虽然苹果汽车项目从未得到苹果公司的公开证实,但早在2014年,苹果公司成立“泰坦计划(Project Titan)”以来,苹果造车的动作一直被不断地被曝出。所以,苹果的造车计划早已是一个公开的秘密。 在最新一期的P…

MAX9286+MAX96705高级辅助驾驶系统ADAS方案

1.方案介绍: 1)基于美信MAX9286全数字接口芯片,提供高达1.5Gbps的数字传输 2)通过同轴线缆传输 3)提供4路720P高清影像输入,LVDS/ Parallel RGB高清影像输出 4)2D/3D全景环视集成ADAS功能,超高性价比 5)主处理器基于HI3519芯片 方框图如下&…

腾势D9改装来了,帮大家总结了一些需要改装的项目

最近腾势D9真的太火了,不仅外观霸气,内饰也是非常豪华。 1月份销量在MPV里已经排名第二了,性价比很高。 这边整理了一些改装项目供大家参考,有什么想法可以评论区一起讨论哦 1. 电吸门 有车主吐槽车门难关,由于车内…