lstm基础知识

devtools/2024/10/19 7:34:33/

lstm_0">lstm前言

LSTM(Long short-term memory)通过刻意的设计来避免长期依赖问题,是一种特殊的RNN。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!

在标准的RNN中,这个重复模块具有非常简单的结构,例如只有单个tanh层,如下图所示。


LSTM具有同样的结构,但是重复的模块拥有不同的结构,如下图所示。与RNN的不同,这里有四个网络层,并且以一种非常特殊的方式进行交互。
在这里插入图片描述

公式推导

在这里插入图片描述

三个门的作用

ft门的作用是选择性遗忘部分记忆,it门决定了新的知识有哪些需要被记住,意思就是对新知识进行取舍,g(新的记忆单元)根据当前的输入和前一个隐藏状态计算出来的一个潜在的新记忆。它本身并不决定新信息是否要存入细胞状态,而只是提供了一种可能的输入。ot门决定了输出哪些新的知识。

总结

总结:我刚考完高等数学,下一门考线性代数,首先通过遗忘门,进行选择性遗忘旧的知识,然后通过更新门,将旧的知识和已经学习的新的知识进行整合。形成目前所学到的全部知识,然后和输出门进行结合,转化成考试的能力,也就是记住线性代数所要考察的考点,最后输出考试所得的分数。


http://www.ppmy.cn/devtools/126953.html

相关文章

Django 序列化serializers

在Django中,序列化通常指的是将数据库中的模型数据转换为JSON、XML或其他格式的过程。Django提供了内置的序列化工具,可以通过django.core.serializers模块进行序列化操作。 当你使用Django的序列化功能时,可以序列化以下两种对象类型&#…

Redis是单线程为何性能还高

背景 通常来讲,提到性能优化,我们都会说提高并行度。同样我们知道,Redis是单线程执行命令,那为何还能保持如此的高性能呢? 原因 基于内存访问 Redis 将所有数据存储在内存中,内存的读写速度远远高于磁盘&a…

从数据管理到功能优化:Vue+TS 项目实用技巧分享

引言 在项目开发过程中,优化用户界面和完善数据处理逻辑是提升用户体验的重要环节。本篇文章将带你一步步实现从修改项目图标、添加数据、优化日期显示,到新增自定义字段、调整按钮样式以及自定义按钮跳转等功能。这些操作不仅提升了项目的可视化效果&am…

集成方案 | 结合 Microsoft 365 Copilot 与 Docusign,实现 AI 驱动的协议洞察!

使用 Copilot 快速解答你的 Docusign 协议问题。 在 2024 年 9 月,Docusign 宣布与 Microsoft 达成合作,成为首批集成到 Microsoft 365 Copilot 的公司。这一集成使得 Docusign 协议中的信息能够被 Copilot(Microsoft 的通用 AI 助手&#xf…

C语言复习第4章 数组

目录 一、一维数组的创建和初始化1.1数组的创建1.2 变长数组1.3 数组的初始化1.4 全局数组默认初始化为01.5 区分两种字符数组1.6 用sizeof计算数组元素个数1.7 如何访问数组元素1.8 一维数组在内存中的存储(连续存储)1.9 访问数组元素的另一种方式:指针变量1.10 数组越界是运行…

C语言从头学69——学习头文件time.h

《C语言从头学》系列文章到这一篇就算告一段落了,感谢大家的支持!过一段时间将介绍一些MFC二维绘图函数的知识,请大家继续给予支持。 在time.h头文件中定义了有关时间的数据类型、结构体、函数等,介绍如下: 1.时…

Go 语言初探

Google 公司有一个传统,允许员工利用 20% 的工作时间开发自己的实验项目。2007 年 9月,UTF-8 的设计者之一 Rob Pike(罗布.皮克)在 Google 的分布式编译平台上进行 C++ 编译时,与同事 Robert Griesemer (罗布.格里泽默)在漫长的等待中讨论了编程语言面临的主要问题。他们一…

锁定云轴科技ZStack主题演讲,10月19日中国云计算基础架构开发者大会见

随着数字化转型的不断深入,云计算技术正成为推动各行各业发展的关键力量。2024年“中国云计算基础架构开发者大会(China Cloud Computing Infrastructure Developer Conference - 简称CID)即将于10月19日在北京举行,这是一个专注于…