【Pytorch】model.eval()与model.train()

news/2024/11/9 2:04:35/

model.train():
        作用是启用Batch Normalization 和 Dropout
        如果模型中有BN层(Batch Normalization)和Dropout,需要在训练时添加model.train()。model.train()是保证BN层能够用到每一批数据的均值和方差。对于Dropout,model.train()是随机取一部分网络连接来训练更新参数。

model.eval():
        如果模型中有BN层(Batch Normalization)和Dropout,在测试时添加model.eval()。保证BN层能够用全部训练数据的均值和方差,即测试过程中要保证BN层的均值和方差不变。对于Dropout,model.eval()是利用到了所有网络连接,即不进行随机舍弃神经元。
        训练完train样本后,生成的模型model要用来测试样本。在测试集上进行测试之前,需要加上model.eval(),否则的话,有输入数据,即使不训练,它也会改变权值。这是model中含有BN层和Dropout所带来的的性质。


http://www.ppmy.cn/news/1545505.html

相关文章

Vue3安装、创建到使用

vue安装 npm install vuenext # 全局安装 vue-cli npm install -g vue/cli #更新插件 项目中运行 vue upgrade --nextvue create 命令 vue create [options] <app-name> options 选项可以是&#xff1a; -p, --preset <presetName>&#xff1a; 忽略提示符并使用已…

Git+Jenkins基本使用

Jenkins是一个开源的实现持续集成的软件工具 持续集成的作用 保证团队开发人员提交代码的质量&#xff0c;减轻软件发布的压力自动完成各个环节的任务&#xff0c;无需太多的人工干预&#xff0c;有利于减少重复过程&#xff0c;以节省时间、费用和工作量 持续集成的特点 是…

【ARM Linux 系统稳定性分析入门及渐进 1.1 -- Crash 工具功能概述】

文章目录 Crasg 功能概述Crash 核心功能Crash 版本独立性为什么使用 Crash 工具?Crash 工具的优势Crash 工具编译debug 信息保留Crasg 功能概述 crash 工具是一个强大的 Linux 内核调试和分析工具,最初基于 SVR4 UNIX 的 crash 命令,但经过显著增强,完全与 GNU GDB 调试器…

《重学Java设计模式》之 单例模式

单例模式主要解决的是&#xff0c;一个全局使用的类频繁的创建和消费&#xff0c;从而提升提升整体的代码的性能。 单例模式原则 私有构造。&#xff08;阻止类被常规方法实例化&#xff09;以静态方法或者枚举返回实例。&#xff08;保证实例的唯一性&#xff09;确保实例只…

streamlit run的启动参数讲解

当你运行 streamlit run 命令时&#xff0c;后面可以带一些参数&#xff0c;用来指定如何运行 Streamlit 应用。下面是 streamlit run 命令的常用参数及其含义&#xff1a; 基本命令&#xff1a; streamlit run your_script.py这个命令会启动 your_script.py 这个 Streamlit …

DNS域名详细解析详解

文章目录 DNS域名详细解析详解一、引言二、DNS域名解析过程1、DNS解析概述1.1、DNS解析的基本步骤 2、代码示例 三、DNS查询类型1、递归查询2、迭代查询 四、总结 DNS域名详细解析详解 一、引言 在互联网的世界里&#xff0c;域名和IP地址是两个不可或缺的概念。IP地址是计算…

React 入门课程 - 使用CDN编程React

1. 第一个React 注意&#xff1a;在vscode里&#xff0c;使用Live Server来运行html文件。 index.html <html><head><link rel"stylesheet" href"index.css"><script crossorigin src"https://unpkg.com/react17/umd/react.de…

【Web前端】OOP编程范式

面向对象编程&#xff08;Object-Oriented Programming&#xff0c;简称 OOP&#xff09;是一种程序设计思想&#xff0c;它通过将程序视为一组相互作用的对象来设计程序。OOP 提出了一些重要的基本概念&#xff0c;包括类与实例、继承和封装。面向对象编程将系统视为由多个对象…