机器学习和深度学习 -- 李宏毅(笔记与个人理解)Day19

server/2024/10/21 9:58:20/

Day 19 Recurrent Neural Network (RNN 1)

md 发现我最近需要恶补一下vue的技术……服了(因为有两个项目要交单子了)

好吧导致我停更新两天的DL,我去如坐针毡啊!今天补上

  • Slot Filling
image-20240417121327293 image-20240417121444230 image-20240417121519336 image-20240417121636645

将词语用向量的形式来表示;

提问:中文如何处理?

image-20240417121734618

image-20240417121905590

检测不到 前面的那个词语;

提问: 为什么不把整句话输入进去?

这样应该可以,但是如果是一个很长的段落呢?把整篇文章进行encode 是不合理的

needs memory

(Elman ) Recurrent Neural Network(RNN)

image-20240417122101108 image-20240417123656586 image-20240417123715483 image-20240417124033836

把这个流程走通!!!! 一定记得走通哈

Then we have a model which can store the order

考量时间顺序的那个kaggle

提问: 如果我们的nlp呢? 有一些倒装句应该如何处理使得其语义相同?

image-20240417124457357 image-20240417124524798 image-20240417124619019

Elman & Jordan Network

image-20240417124914533

这两个图如果看不懂的话 说明没有弄懂上面的 流程

Bidirectional RNN

image-20240417125107244

检测范围较广,不仅上文, 还有下文;用来解决倒装句比较不错哈

Long short -term Memory (LSTM)

image-20240417125654762 image-20240417125731011

正常的输入和三个控制门讯号的输入

和RNN比较起来, 强化了对整体序列的记忆;并且可以 认为的通过lable 训练出需要记忆的重点序列

image-20240417133315865

内部逻辑图!需要重点掌握哦!

  • “h” 通常表示 LSTM(长短期记忆网络)的输出门中使用的激活函数。在 LSTM 单元中,输出门决定了有多少当前单元状态要输出到下一个时间步骤。这个 “h” 函数通常是一个 sigmoid 函数。
  • “g” 表示在计算新的单元状态时使用的激活函数。这个函数通常是一个能够输出较宽范围的函数,例如双曲正切函数(tanh),其输出范围是 -1 到 1。这允许网络调整其内部状态,通过结合之前的状态和当前的输入。

这里我也不明白为什么要弄两个激活函数? 是普通的network 也是两次激活函数吗?

需要注意的一点是 forget gate 的取值 ,应该交 remember gate 会好一些

image-20240417140915426 image-20240417142013463

来吧 ,整个LSTM 最重要的ppt ,走动这个ppt 你就懂了LSTM的工作原理

image-20240417142127371

如何理解LSTM和普通network的关系?

image-20240417142255783

图中的+ 代表我的输入; 小圈圈代表激活函数; 划线代表不同的weight

image-20240417144209833 image-20240417144526147 image-20240417144648400 image-20240417144751945 image-20240417144836761

太扯淡了! 好复杂的鬼东西
BUt
this is quite standard now

image-20240417144950158


http://www.ppmy.cn/server/6144.html

相关文章

Android USB TP方向修改

搜集的一些关于Android USB TP的方向修改的代码,X to Y , X反转 , Y反转,双触屏配置,双屏异触等。 diff --git a/kernel/drivers/hid/hid-multitouch.c b/kernel/drivers/hid/hid-multitouch.c old mode 100644new mode 100755 i…

Linux使用Libevent库实现一个网页服务器---C语言程序

Web服务器 这一个库的实现 其他的知识都是这一个专栏里面的文章 实际使用 编译的时候需要有一个libevent库 gcc httpserv.c -o httpserv -levent实际使用的时候需要指定端口以及共享的目录 ./httpserv 80 .这一个函数会吧这一个文件夹下面的所有文件共享出去 实际的效果, 这…

linux常用命令

查询此字符出现的次数 grep “开始带宽” 2024-04-17.log | wc -l 查询此字符出现的前1000行 grep “开始带宽” -C 1000 2024-04-17.log 查询日志前1000行 head -n 1000 2024-04-17.log 查询日志后1000行 tail -n 1000 2024-04-17.log 查看端口是否通 telnet 127.0.0.1 3306 查…

jmeter分布式压测

前提 调度机和执行机都要安装配置JDK和jmeter的运行环境 调度机和执行机上JDK和Jmeter的版本要保持一致 防火墙要关闭 整体思路 mac电脑当调度机,多个ubuntu虚拟机当执行机 调度机:配置执行机的ip等信息,后面会详细介绍,存放jme…

机器学习常用评价指标的公式和含义

在机器学习中,特别是在分类任务中,评价模型性能常用以下指标。这些指标主要基于混淆矩阵,该矩阵记录了实际类别与模型预测类别的对应情况。下面是这些指标的定义和计算公式: 1. TP(True Positives): - …

uniapp之消除图片的空白占用空间

我们在使用uniapp开发的过程中一定会遇到一个情况就是我们加载的图片总有一点空白出现在不该出现的地方代码如下 <view style"background:#ff0000;"><image style"width:100%;"src"https://t7.baidu.com/it/u1819248061,230866778&fm19…

OpenHarmony 网络与连接—RPC连接

介绍 本示例使用ohos.rpc 相关接口&#xff0c;实现了一个前台选择商品和数目&#xff0c;后台计算总价的功能&#xff0c;使用rpc进行前台和后台的通信。 效果预览 使用说明&#xff1a; 点击商品种类的空白方框&#xff0c;弹出商品选择列表&#xff0c;选择点击对应的商品…

【行为型模式】观察者模式

一、观察者模式概述​ 软件系统其实有点类似观察者模式&#xff0c;目的&#xff1a;一个对象的状态或行为的变化将导致其他对象的状态或行为也发生改变&#xff0c;他们之间将产生联动。 观察者模式属于对象行为型&#xff1a; 1.定义了对象之间一种一对多的依赖关系&#xff…