机器学习与深度学习 --李宏毅(笔记与个人理解)Day 20

server/2024/10/21 5:29:59/

Day 20 RNN 2 实际使用和其他应用

在实际的学习(training)过程中是如何工作的?

step 1 Loss

image-20240417145909658

step 2 training

image-20240417150009011

Graindent Descent

反向传播的进阶版 – BPTT

image-20240417150255219

image-20240417150400307

CLIpping 设置阈值~ 笑死昨天刚看完关伟说的有这玩意的就不是好东西

image-20240417150712351
Why?出现了梯度steep or flat
image-20240417151331381

这里为什么不可以用Adagrad(RMS)或者 Adam(RMSPROP + momentum)?image-20240417151902062

image-20240417155039930

LSTM 可以解决梯度平坦的问题,但是不能解决steep,所以可以放心的将学习率设置的小一点;原理如下,凑乎看

image-20240417160346983 image-20240417160542885

根据上面的思想,那么我可能需要保证我的forget gate 大多数情况下是开启的 (保留记忆)

Grated Recurrent Unit (GRU)Simpler than LSTM

联动forget 和 input gate 2选1

只有清除记忆新的Input 才能被放入

image-20240417160949716

More Application

image-20240417161127744

一到多
image-20240417161314773 image-20240417161426197

多到多(outputer is shorter) – 语音辨识 (贝叶斯)

image-20240417161710949 image-20240417161809982 image-20240417161926812

有一个好的穷举算法

image-20240417162303640

多到多(no LImitation)

翻译

image-20240417162822999 image-20240417162911722 image-20240417163021363 image-20240417163038801

????没看懂这里,这个断是在哪里加入呢;假设在训练过程中添加了这个symbol

image-20240417163305287
不仅仅 是sequence
image-20240417163703240

使用LSTM做句法解析时,如果输入句子有语法错误,如缺少括号,这种错误通常不会直接影响LSTM模型的解析过程,因为LSTM并不是基于规则的解析器,而是基于学习的模型。它通过从大量的标注数据中学习语言的统计特征,来预测句子的结构

image-20240417163954827

什么是词袋模型?

词袋模型(Bag of Words,简称BOW)是一种常见的文本表示方法,用于自然语言处理和信息检索领域。这种模型忽略了文本中词语的顺序和语法、句法元素,仅仅将文本(如一句话或一篇文章)转换为一个集合,其中包括了词汇表中每个词的出现次数。可以将其想象为一个词的“袋子”,只记录词的存在与频率,而不考虑其出现的顺序。

词袋模型的步骤通常包括:

  1. 分词:将文本分割成词语或标记。
  2. 构建词汇表:从所有文本数据中提取出不同的词语,构成一个词汇表。
  3. 计数:对于每一个文本,计算词汇表中的词语在该文本中出现的次数。

可以把一个document 变成一个 vector

image-20240417165556580

这个听不懂,让gpt试试

《A Hierarchical Neural Autoencoder for Paragraphs and Documents》探讨了如何利用长短期记忆网络(LSTM)自编码器生成长文本。核心思想是通过建立层级LSTM模型,将文本(如段落或文档)编码成向量,然后再解码重构原文本。这种层级模型能在不同层次上捕捉文本的组合性,如单词间、句子间的关系,从而在重构时保持文本的语义、句法和篇章的连贯性。实验表明,这种模型能有效重构输入文档,并且在维持原文结构顺序方面表现良好。

层级LSTM(Hierarchical LSTM)模型通过构建不同层级的LSTM结构来处理文本数据,其中每个层级对应文本的不同组成部分(如词、句子和段落)。在编码阶段,每个词首先通过词级LSTM(LSTM_word_encode)转换为词向量,这些词向量再通过句子级LSTM(LSTM_sentence_encode)组合成句子表示。同理,所有句子表示再通过一个更高层级的LSTM转换为整个文档或段落的表示。解码阶段与此类似,但过程是逆向的,从文档表示开始逐步解码出句子和词。这种层次化方法有助于模型捕捉文本数据的内在结构和复杂性。

image-20240417183436080

词语 – 句子 - 文档 反解回;

感觉这个可以拿来试试做论文翻译

image-20240417184143320 image-20240417184328594

如果能处理视频就好了,这样监控就再也不用人去看了

image-20240417184431113 image-20240417184549999 image-20240417184630864

http://www.ppmy.cn/server/10967.html

相关文章

如何在PostgreSQL中使用CTE(公共表表达式)来简化复杂的查询逻辑?

文章目录 解决方案步骤示例代码 结论 在处理复杂的SQL查询时,我们经常会遇到需要多次引用子查询或中间结果的情况。这可能会使得查询变得冗长且难以理解。为了解决这个问题,PostgreSQL(以及其他一些SQL数据库系统)引入了公共表表达…

uniapp制作多选下拉框和富文本(短信页面)

实例 多选下拉框实现 http://t.csdnimg.cn/TNmcF 富文本实现 http://t.csdnimg.cn/Ei1iV

【二】列表.1

.append(“ xixix”): 在列表后面新加入一个元素 .insert(1,”P”):在列表中插入元素,告知索引位,加上添加的元素 del : 删除语句,告知索引位置即可【del motor[1]】 .pop:删除方法,删除最后一个元素,或是任意的元素,告…

Springboot获取实时天气

获取天气方式很多&#xff0c;整理一下个人感觉最方便的一个 1.引入maven <dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>3.14.2</version></dependency> 2.代码 import c…

【C语言】数据在内存中的存储

目录 1.整数在内存中的存储 2.大小端字节序和字节序的判断 2.1什么是大小端 2.2为什么有大小端 3.浮点数在内存中的存储 3.1浮点数简介 3.2浮点数在内存中的存储 3.3浮点数存储过程 3.4浮点数取出过程 3.4.1E不全为0或者E不全为1 3.4.2E全为0 3.4.3E全为1 1.整数在内存…

C++ :设计模式实现

文章目录 原则单一职责原则开闭原则依赖倒置原则接口隔离原则里氏替换原则 设计模式单例模式观察者模式策略模式代理模式 原则 单一职责原则 定义&#xff1a; 即一个类只负责一项职责 问题&#xff1a; 类 T 负责两个不同的职责&#xff1a;职责 P1&#xff0c;职责 P2。当…

使用CSS3 + Vue3 + js-tool-big-box工具,实现炫酷五一倒计时动效

时间过得真是飞速&#xff0c;很快又要到一年一度的五一劳动节啦&#xff0c;今年五天假&#xff0c;做好准备了吗&#xff1f;今天我们用CSS3 Vue3 一个前端工具库 js-tool-big-box来实现一个炫酷的五一倒计时动效吧。 目录 1 先制作一个CSS3样式 2 Vue3功能提前准备 3…

树莓教育坚持特色引领,建设一流应用型影像培训

树莓教育&#xff0c;作为树莓集团旗下的子公司&#xff0c;自创立以来已经走过了十余个春秋。在这漫长的教育征程中&#xff0c;树莓教育始终坚守初心&#xff0c;秉持着七个坚持和十项行动的原则为数字影像产业的建设和发展做出了巨大的贡献。 七个坚持&#xff0c;是树莓教育…