【深度学习】学习笔记——批量和动量(Datawhale X 李宏毅苹果树AI夏令营)

devtools/2024/10/21 9:16:02/

批量

实际计算梯度时,并不是对所有数据的损失 L L L计算梯度,而是把所有数据分成一个一个的批量(batch)。遍历所有批量的过程称为一个回合(epoch),数据分为批量时,还会进行随机打乱(shuffle)。
在有并行计算的情况下,小的批量跟大的批量运算的时间没有太大的差距。除非大的批量非常大才会显示出差距。但是一个回合需要的时间,小的批量比较长,大的批量反而是比较快的。所以从一个回合需要的时间来看,大的批量是比较有优势的。而小的批量更新的方向比较有噪声,大的批量更新的方向比较稳定。但是有噪声的更新方向反而在优化的时候有优势,而且在测试的时候也会有优势。所以大的批量跟小的批量各有优缺点,批量大小是需要去调整的超参数。

动量

动量法是另外一个可以对抗鞍点或局部最小值的方法。
动量法是参考了真实的物理世界里一个球如果从高处滚下来,就算滚到鞍点,因为惯性的关系,他还是会继续往前走。如果球的动量足够大,其甚至翻过小坡继续往前走。


http://www.ppmy.cn/devtools/103935.html

相关文章

window下kafka3启动多个

准备工作 我们先安装好kafka,并保证启动成功,可参考文章Windows下安装Kafka3-CSDN博客 复制kafka安装文件 kafka3已经内置了zookeeper,所以直接复制就行了 修改zookeeper配置文件 这里我们修改zookeeper配置文件,主要是快照地址…

【Elasticsearch】file-beat 将文件数据导入es

1、备份 filebeat.yml 文件: 2、新 filebeat.yml 文件配置示例: ###################### Filebeat Configuration Example ########################## Filebeat inputs filebeat.inputs: - type: logenabled: true # 注意:# 文件最后必须…

Ant Design vue 多层for循环form表单自定义校验

数据结构如下&#xff1a;三维数组。 注意&#xff1a;<a-form-model>一定得写在for外面&#xff01;&#xff01;&#xff01;&#xff01; <!-- 弹出框 --> <a-modal:title"title":dialog-style"{ top: 20px }":visible"visible&quo…

系统开发压力测试高并发

目的&#xff1a; 压力测试软景见环境下的系统多能承受的最大负荷以及高访问量出现的并发带来的问题。压力测试能够帮助系统在线上稳定持续的运行&#xff0c;在一定范围内可以做到心中有数。 我们希望压力测试能够发现更多的错误。其中两种&#xff1a;并发同步问题、内存泄漏…

计算机网络: 第一章 概述_1

文章目录 1. 因特网概述1.1 网络、互联网与因特网的区别与关系1.2 因特网简介1.2.1 因特网发展的三个阶段1.2.2 因特网的组成 2. 电路交换 分组交换 报文交换2.1 电路交换2.2 分组交换2.3 报文交换2.4 三种交换方式的对比 3. 计算机网络的定义和分类3.1 计算机网络的定义3.2 计…

美国洛杉矶多ip服务器特点

美国洛杉矶多IP服务器因其丰富的IP资源、卓越的性能和灵活的配置&#xff0c;在多个行业如站群运营、SEO优化、游戏代理等方面发挥着重要作用。具体分析如下&#xff0c;rak小编为您整理发布美国洛杉矶多ip服务器的特点。 IP资源的丰富性 独立IP数量&#xff1a;美国洛杉矶多IP…

Linux C/C++ 库链接选项 --whole-archive,--no-whole-archive和--start-group, --end-group

库链接选项 一、介绍whole-archive编译选项Bstatic编译选项start-group 编译选项 示例参考链接 一、介绍 这四个都是链接器的选项&#xff0c;所以在编译的时候要用-Wl&#xff0c;[options]来传递给链接器&#xff0c;不然编译器会不认得这个选项。   在大型工程开发中&…

Nosql数据库redis集群配置详解

一、Redis的安装 环境介绍&#xff1a; 一主双从&#xff1a;10&#xff08;redis-node1&#xff09;主&#xff0c;20&#xff08;redis-node2&#xff09; 30&#xff08;redis-node3&#xff09;从——使用的是红帽9.1系统 源码安装redis [rootredis-node1 ~]# tar zxf red…