PyTorch踩坑记录1

news/2024/10/18 18:13:40/

1 model.eval()无法关闭dropout

因为model.eval()控制self.training参数,只有用nn.Dropout(0.5)声明才能在调用model.eval()后关闭,用F.dropout(x, p=0.5)是没办法自动关闭的,需要手动把self.training的参数传入到F.dropout()里才行。

网上查到是因为model.eval()会影响继承nn.module类的self.方法的训练和测试,但是F.dropout更像是一个函数没继承nn,module。

另外,回归模型在后面几层应该避免使用dropout,最多在浅层使用。

2 BCEloss归一化

在tf2中BCEloss没有归一化,但是在torch中的损失函数是归一化了的。


http://www.ppmy.cn/news/1514254.html

相关文章

数据捕手:Python 爬虫在社交媒体的深度探索

标题:数据捕手:Python 爬虫在社交媒体的深度探索 在数字化时代,社交媒体数据成为了洞察用户行为、市场趋势和公共情绪的宝贵资源。Python作为一种强大的编程语言,提供了丰富的库和框架,使得从社交媒体平台抓取数据变得…

通过Qt Creator Plugin开发Qt Creator插件-【金丹篇】

1.前言 由于工作学习需要基于Qt Creator架构开发类似的插件,本人感慨网络上Qt 相关的文档真是少。我直接在官方社区查找Qt Creator Plugin愣是一点资料没有。其实想想也是自定义的三方插件到Qt的IED,主要是个社区的贡献者或官方技术人员自用,他开发布会…

Redis面试问题(牛客整理版)未完成

文章目录 参考资料出处 缓存过期时间缓存过期删除定期删除 从库处理过期 key持久化过期时间如何确定 缓存淘汰策略LRULFU 缓存模式Cache Aside删除缓存延迟双删 缓存一致性问题解决缓存穿透、击穿和雪崩问题缓存穿透回写特殊值布隆过滤器 缓存击穿Singleflight 缓存雪崩过期时间…

ARM——驱动——Linux启动流程和Linux启动

一、flash存储器 lash存储器,全称为Flash EEPROM Memory,又名闪存,是一种长寿命的非易失性存储器。它能够在断电情况下保持所存储的数据信息,因此非常适合用于存储需要持久保存的数据。Flash存储器的数据删除不是以单个的字节为单…

[Algorithm][综合训练][孩子们的游戏][大数加法][拼三角]详细讲解

目录 1.孩子们的游戏1.题目链接2.算法原理详解 && 代码实现 2.大数加法1.题目链接2.算法原理详解 && 代码实现 3.拼三角1.题目链接2.算法原理详解 && 代码实现 1.孩子们的游戏 1.题目链接 孩子们的游戏 2.算法原理详解 && 代码实现 问题抽象…

面试准备算法

找出数组的最大公约数 class Solution { public:int findGCD(vector<int>& nums) {int min_num *min_element(nums.begin(), nums.end());int max_num *max_element(nums.begin(), nums.end());return gcd(min_num, max_num);} };//gcd()函数的用法是包含头文件#in…

flv和 rtmp视频负载类型的差异

FLV中的视频类型标记 FLV文件和流中的视频类型通过"VideoTag"中的几个关键字段来标记&#xff1a; Frame Type: 表示帧的类型&#xff0c;比如关键帧或差异帧。 CodecID: 表示使用的编解码器类型。例如&#xff1a; 2代表Sorenson H.2633代表Screen Video4代表On2 …

CST软件仿真案例:圆极化平板天线仿真01

在接下来的几期中我们介绍一款圆极化Patch天线的仿真实例。读者可以完整的了解到怎么用CST微波工作室&#xff0c;完成对一款天线建模、设置到仿真分析的完整过程。 本案例最终完成的圆极化平板天线 本案例分为几期介绍&#xff0c;第一期先完成一个简单的平板天线的仿真工作流…