机器学习实战第一天:LSTM(长短时记忆网络)

news/2025/1/24 10:04:00/

第一天是讲述LSTM大概的理论知识,知识是源自于B站李沐老师的讲解。下面我简单的总结一下LSTM的核心,因为文字不擅长表达过于细节的东西,如果有想深入了解LSTM的全部可以去B站搜索相关的视频讲解。

一、

LSTM具有很强的前后关联性,我们可以把整一个框架分成多个相同的结构通过串联组合而成,通过利用前一个结构输出的H来影响当前结构的参数的运算,F表达的是前面结构学习的东西,I 可以理解为控制当前结构学习的参数

二、

\widetilde{C} 叫做候选记忆单元,可以理解为当前结构的学习到的东西

三、

接下来是总的记忆单元组成,F是用来控制前面结构已经学习到的东西的权重,I是用来控制当前结构所学习的候选单元的权重,如果前面学习到的东西重要则F会比较大,如果当前候选单元学习到的东西有用就I比较大,反之则以,这些参数都是通过不断的迭代来更新学习。上一个的C(t-1)是前一个结构传递的记忆单元,数值会比较大,H(t-1)是前一个记忆单元经过缩放来影响当前结构的参数,两者是具有很深关联的。

四、 

H(t)是经过当前记忆单元的内容经过tanh缩放到1和-1间再点乘一个权重来进行输出,李沐老师解释了为什么要加多一个tanh,因为C(t)的计算中\widetilde{C}和C(t-1)都是已经经过tanh缩放到-1和1之间,I和F也是基于1和-1之间,所以最后的C 的取值范围是-2到2之间。需要通过tanh进行一次缩放。这个网络架构具有很深的前后记忆,但是里面又加入大量权重来防止依赖学习。

五、

LSTM通过多个相同结构组成的长短时记忆网络,C和H初始是为0,其他初始不为0

LSTM的核心内容大概就是这样了,如果博文有误还请大佬批评指正

希望这篇博文对你有帮助!!!


http://www.ppmy.cn/news/1565752.html

相关文章

Linux下 date时间应该与系统的 RTC(硬件时钟)同步

发现客户服务器时间与真实时间不同,并且服务器没有网络。 解决办法:时间应该与系统的 RTC(硬件时钟)同步 手动设置系统时间 使用 date 命令将系统时间设置为 2025年01月21日 14:12:00: sudo date --set"2025-01…

记录一次k8s起不来的排查过程

我在k8s集群,重启了一个node宿主机,竟然发现kubelet起不来了!报错如下 这个报错很模糊,怎么排查呢。这样,开两个界面,一个重启kubelet,一个看系统日志(/var/log/message:centos,/va…

【PoCL】运行 LLVM 中 pass 优化过程详解

PoCL 项目中调用 LLVM 的 Pass 对编译过程的优化至关重要。本博文以PoCL 开源项目源码为例,详细说明【PoCL】运行 LLVM 中 pass 优化过程 目录 0. 个人简介 && 授权须知1. pocl_llvm_run_pocl_passes 函数作用2. 禁止 “小网格 small grid” 工作组(workGroup)特化的…

【网络协议】RFC1350-TFTP协议

引言 TFTP(Trivial File Transfer Protocol)即简单文件传输协议,是一种轻量级的文件传输协议,它允许客户端从远程主机获取文件或将文件传输到远程主机,主要用于小文件的传输,特别是在需要简便性而非功能性和…

一分钟学习数据安全——白盒加密及安当应用

白盒加密作为一种先进的加密技术,在数据安全、通信安全和信息隐私保护等多个关键领域都有应用。这次的一分钟,让您快速了解一下白盒加密的概念,以及安当产品中的白盒加密应用。 一、什么是白盒加密 简单来说,白盒加密是一种特殊…

SVM模型(理论知识2)

目录 SVM模型函数间隔几何间隔 线性可分的SVM模型目标函数目标函数的等价转换拉格朗日乘子法基于拉格朗日乘子法的目标函数目标函数的求解 SVM模型 函数间隔 将图中五角星所代表的正例样本用1表示,将实心圆所代表的负例样本有-1表示;实体加粗直线表示某…

Git Bash 配置 zsh

博客食用更佳 博客链接 安装 zsh 安装 Zsh 安装 Oh-my-zsh github仓库 sh -c "$(curl -fsSL https://install.ohmyz.sh/)"让 zsh 成为 git bash 默认终端 vi ~/.bashrc写入: if [ -t 1 ]; thenexec zsh fisource ~/.bashrc再重启即可。 更换主题 …

数据结构实验-树和赫尔曼编码

数据结构-树和赫尔曼编码 十、树的创建和遍历 1、采用书上第 136 页定义的树的孩子兄弟存储表示,编写递归算法实现树的下列基本操作。 (1)构造树 (2)复制树 (3)销毁树 (4&#xff…