深入理解深度学习——注意力机制(Attention Mechanism):Bahdanau注意力

news/2024/11/15 20:03:35/

分类目录:《深入理解深度学习》总目录


之前我们探讨了机器翻译问题: 通过设计一个基于两个循环神经网络的编码器—解码器架构, 用于序列到序列学习。 具体来说,循环神经网络编码器将长度可变的序列转换为固定形状的上下文变量, 然后循环神经网络解码器根据生成的词元和上下文变量按词元生成输出(目标)序列词元。 然而,即使并非所有输入(源)词元都对解码某个词元都有用, 在每个解码步骤中仍使用编码相同的上下文变量。

在为给定文本序列生成手写的挑战中, Graves设计了一种可微注意力模型, 将文本字符与更长的笔迹对齐, 其中对齐方式仅向一个方向移动。 受学习对齐想法的启发,Bahdanau等人提出了一个没有严格单向对齐限制的可微注意力模型。 在预测词元时,如果不是所有输入词元都相关,模型将仅对齐(或参与)输入序列中与当前预测相关的部分。这是通过将上下文变量视为注意力集中的输出来实现的。

下面描述的Bahdanau注意力模型。假设输入序列中有个词元, 解码时间步的上下文变量是注意力集中的输出:
c t ′ = ∑ t = 1 T α ( s t ′ − 1 , h t ) h t c_{t'}=\sum_{t=1}^T\alpha(s_{t'-1}, h_t)h_t ct=t=1Tα(st1,ht)ht

其中,时间步 t ′ − 1 t' - 1 t1时的解码器隐状态 s t ′ − 1 s_{t'-1} st1是查询, 编码器隐状态 h t h_t ht既是键,也是值, 注意力权重 α \alpha α是使用《深入理解深度学习——注意力机制(Attention Mechanism):注意力评分函数(Attention Scoring Function)》中所定义的加性注意力打分函数计算的。 下图描述了Bahdanau注意力的架构。

一个带有Bahdanau注意力的循环神经网络编码器-解码器模型

参考文献:
[1] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015
[2] Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola. Dive Into Deep Learning[J]. arXiv preprint arXiv:2106.11342, 2021.


http://www.ppmy.cn/news/284340.html

相关文章

TP-LINK TL-WR740N 升级系统 总结

今天把家里的TP-LINK路由器型号TL-WR740N升级了下其固件,本来家里的网络就经常会掉,昨晚又一直掉,小米盒子论坛说该路由器可能和新小米盒子有点问题(关于最近小米盒子连接WIFI后其他设备无法上网的说明),那…

不同IP网段连接网络打印机

帮朋友买了个网络打印机,昨天打印机到了,他对电脑不是很懂,所以一定要我来帮忙设置。本来这个东西没什么复杂的,打印机机直接接到路由器上或交换机上,然后电脑端加驱动就行了,电脑一般会自动找到网络打印机…

详解NRF24L01无线收发模块

近日有粉丝朋友留言,希望介绍一下nRF24L01这款无线收发芯片,正巧前不久的电赛有些涉及,因此将自己的一些经验写在这里,希望能有所收获。 前面我们介绍过单片机的几种通信协议,并且初步了解如何操作寄存器进而控制芯片的…

STM32无线通信——nRF24L01通信模块

不同型号STM32的无线通信——基于一样的nRF24L01芯片模块 在此声明一下全部代码均不允许转发以及在商业上的行为等,—Mannix声明。 本次讲解主要内容 1、实验目的 2、实验硬件 3、芯片模块原理 4、实验代码 S T M 32 F 103 通 用 代 码 STM32F103通用代码 STM32F103通用代码 (…

TP-LINK WR847N

今天买了一个TP-LINK WR847N, 想照着 《山东大学H3C校园网无线路由开wifi》 http://www.cnblogs.com/buer1209/p/3370309.html 去刷一下机,结果发现TP-LINK WR847N 还没有 现在的841N好,实在不忍心刷841N了

移植TP-LINK TL-WN721N 驱动到micro2440(by liukun321咕唧咕唧)

内核版本:linux-3.1.4 我先把 无线网卡(TP-LINK TL-WN721N)插到了我的PC上 用 lsusb 命令打印无线网卡ID :Bus 001 Device 003: ID 148f:5370 Ralink Technology, Corp. 照着这个ID百度搜一下你的无线网卡的芯片组,…

nrf24l01+无线发送

经过dt的两天睡不好,玩不好的日子,终于把nrf24l01这个看着dt,做起来也dt的东西搞定了。幸亏有一点好的,就是资料还算是多的。看了两天的资料,调试了两天后终于在这个阳光明媚的下午实验成功。这两天可是一句dota都没有…

Nrf24l01无线模块

Nrf24l01无线模块 一,模块介绍 二,接口电路, 模块连接注意点: (1) VCC 脚接电压范围为 1.9V~3.6V 之间,不能在这个区间之外,超 过 3.6V 将会烧毁模块。推荐电压 3.3V 左右。 (2) 除电源 VCC 和接地端&…