机器学习实战第一天:LSTM(长短时记忆网络)

ops/2025/1/23 17:18:08/

第一天是讲述LSTM大概的理论知识,知识是源自于B站李沐老师的讲解。下面我简单的总结一下LSTM的核心,因为文字不擅长表达过于细节的东西,如果有想深入了解LSTM的全部可以去B站搜索相关的视频讲解。

一、

LSTM具有很强的前后关联性,我们可以把整一个框架分成多个相同的结构通过串联组合而成,通过利用前一个结构输出的H来影响当前结构的参数的运算,F表达的是前面结构学习的东西,I 可以理解为控制当前结构学习的参数

二、

\widetilde{C} 叫做候选记忆单元,可以理解为当前结构的学习到的东西

三、

接下来是总的记忆单元组成,F是用来控制前面结构已经学习到的东西的权重,I是用来控制当前结构所学习的候选单元的权重,如果前面学习到的东西重要则F会比较大,如果当前候选单元学习到的东西有用就I比较大,反之则以,这些参数都是通过不断的迭代来更新学习。上一个的C(t-1)是前一个结构传递的记忆单元,数值会比较大,H(t-1)是前一个记忆单元经过缩放来影响当前结构的参数,两者是具有很深关联的。

四、 

H(t)是经过当前记忆单元的内容经过tanh缩放到1和-1间再点乘一个权重来进行输出,李沐老师解释了为什么要加多一个tanh,因为C(t)的计算中\widetilde{C}和C(t-1)都是已经经过tanh缩放到-1和1之间,I和F也是基于1和-1之间,所以最后的C 的取值范围是-2到2之间。需要通过tanh进行一次缩放。这个网络架构具有很深的前后记忆,但是里面又加入大量权重来防止依赖学习。

五、

LSTM通过多个相同结构组成的长短时记忆网络,C和H初始是为0,其他初始不为0

LSTM的核心内容大概就是这样了,如果博文有误还请大佬批评指正

希望这篇博文对你有帮助!!!


http://www.ppmy.cn/ops/152517.html

相关文章

Vue3初学之商品的增,删,改功能

用一个商品的后台管理进行增&#xff0c;删&#xff0c;改的实现。 案例进行学习&#xff1a; <template><div><el-button type"primary" click"handleNew">新增商品</el-button><el-table :data"goodsList" style…

实现简单的TCP服务器

首先我们先选择一个端口号用于 TCP 或 UDP 网络通信。如果你运行一个服务或应用程序&#xff0c;监听端口就是通过该端口接收来自客户端的请求。 这里我们选择2048 先在ubuntu系统中输入netstat -anop | grep 2048&#xff0c;会显示以下信息 这代表此时2048端口号没有被占用…

Spring Boot 3.4.x 和 Micrometer 2.0 的结合 案例 以及使用方法

Spring Boot 3.4.x 和 Micrometer 2.0 的结合&#xff0c;主要是为了更好地进行应用性能监控。Micrometer 是一个应用性能监控工具&#xff0c;它可以与 Spring Boot 集成&#xff0c;提供一个统一的度量系统&#xff0c;并与各种监控系统&#xff08;如 Prometheus, Graphite,…

Linux探秘坊-------4.进度条小程序

1.缓冲区 #include <stdio.h> int main() {printf("hello bite!");sleep(2);return 0; }执行此代码后&#xff0c;会 先停顿两秒&#xff0c;再打印出hello bite&#xff0c;但是明明打印在sleep前面&#xff0c;为什么会后打印呢&#xff1f; 因为&#xff…

1.移动零

LeetCode 283. 移动零 1. 题目描述 给定一个数组 nums&#xff0c;编写一个函数将所有 0 移动到数组的末尾&#xff0c;同时保持非零元素的相对顺序。 注意&#xff1a;必须在 原地 对数组进行操作&#xff0c;不得额外分配新数组。 示例 示例 1: 输入: nums [0,1,0,3,1…

试题转excel;word转excel;大风车excel(1.1更新)

更新了大风车excel1.1版本 主要优化在算法层面&#xff1a; 1.0版本试题解析的成功率为95%&#xff0c;现在1.1版本已经优化到解析成功率为99% 一、问题描述 一名教师朋友&#xff0c;偶尔会需要整理一些高质量的题目到excel中 以往都是手动复制搬运&#xff0c;几百道题几…

HippoRAG:受海马体启发的长时记忆模型,提升大语言模型的知识整合能力

论文地址&#xff1a;https://arxiv.org/pdf/2405.14831 1. 背景与挑战 1.1 哺乳动物大脑与长时记忆 进化优势: 哺乳动物的大脑进化出强大的长时记忆系统&#xff0c;能够存储大量关于世界的知识&#xff0c;并不断整合新信息&#xff0c;同时避免灾难性遗忘。知识整合能力: …

代码随想录day15

110. 知道平衡二叉树的概念即可。 /** lc appleetcode.cn id110 langcpp** [110] 平衡二叉树*/// lc codestart /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeNode() : val(0), left(nul…