调参问题记录--显存下降bs调整

调参问题记录--显存下降bs调整

news/2024/11/13 18:04:33/

最近接触一个生成代码，在每个epoch的train后放入了torch.cuda.empty_cache()，然后进入eval，模型整体bs为1，lr为0.0001。
我要查看这个模型在我的数据上效果，所以需要进行简单的超参调节，以下记录了步骤：

具体操作：bs较小，调参起来周期长，修改bs和对应的lr
发现问题1：这个步骤中，bs调整为32，lr调整为0.01，此时在watch中gpu会在一个epoch的训练结尾突然降低到6%-8%浮动
解决思路：
- 是否为gpu温度过高问题，因为我发现gpu随着运行逐渐会升高到80C，通过记录发现，并不是温度导致的显存突然下降
- 是否为dataloader的num_workers=8参数导致训练一段时间后内存满了，导致显存利用率下降，调整num_workers=0，增加pin_memory=True 选项，仍不能解决
- 是否为torch.cuda.empty_cache()问题，移除之后发现并没有太大变化，因为我的显存没有完全跑满，并不担心会爆显存
- 最后发现是eval的验证过程，bs还是为1且只有前向过程，所以使用现存很少且由于数据比较多又显得很慢
发现问题2：bs调整为32，lr调整为0.01，按理说应该会比bs为1，lr为0.0001能够更快到收敛值，有一个较好的结果，但是我发现训练后期会让整个生成模型变得不稳定，甚至loss逐渐增大
解决思路2：
我觉得可能是因为针对专门的数据集，基于GAN的生成模型在大bs中学习会很困难，导致bs增大后，模型能力不足，导致模式崩溃

http://www.ppmy.cn/news/1546728.html

相关文章

软考系统架构设计师论文：论软件的可靠性评价

软考系统架构设计师论文：论软件的可靠性评价

试题四论软件的可靠性评价软件可靠性评价是软件可靠性活动的重要组成部分，既适用于软件开发过程，也可针对最终软件系统。在软件开发过程中使用软件可靠性评价，可以使用软件可靠性模型，估计软件当前的可靠性，以确认是否可以终止测试并发布软件，同时还可以预计软件要达…

阅读更多...

高校数字校园建设的数字身份管理难题

高校数字校园建设的数字身份管理难题

近年来，我国高等院校在《中国教育现代化2035》战略的要求下，在《高等学校数字校园建设规范（试行）》的指引下，掀起了数字校园建设高潮。借助教学、科研、管理、服务等种类的业务应用，高校提升了业务的数字化…

阅读更多...

Python使用PDF相关组件案例详解

Python使用PDF相关组件案例详解

主要对pdfminer.six、pdfplumber、PyMuPDF、PyPDF2、PyPDF4、pdf2image、camelot-py七个PDF相关组件分别详解，具体使用案例演示 1. pdfminer.six pdfminer.six 是一个专门用来从 PDF 中提取文本的库，能够处理复杂的文本布局，适合用于文本解析…

阅读更多...

用正则表达式检查是IP否为内网地址

用正则表达式检查是IP否为内网地址

用正则表达式检查是ip否为内网地址 PHP function isIntranet($ip) {/* IPV4内网地址A 类10.0.0.0～10.255.255.255B 类172.16.0.0～172.31.255.255C 类192.168.0.0～192.168.255.255*/// 检查是否为 IPv4 内网地址if (preg_match(/^10\./, $ip…

阅读更多...

Qt 获取当前系统中连接的所有USB设备的信息 lsusb版

Qt 获取当前系统中连接的所有USB设备的信息 lsusb版

Qt 获取当前系统中连接的所有USB设备的信息 lsusb版 flyfish 环境 Ubuntu22.04 Qt 6.2.4 实现的功能枚举USB设备：使用lsusb命令获取当前系统中连接的所有USB设备的信息。解析设备信息：将lsusb命令的输出按行分割，并提取每行中的总线号、…

阅读更多...

CentOS 安装 Python 3.11.9完整流程

CentOS 安装 Python 3.11.9完整流程

在 CentOS 上安装 Python 3.11.9 并替换系统中的默认 Python 版本，可以按照以下步骤来进行。请注意，替换默认 Python 版本可能会影响系统的其他工具和依赖，因此请谨慎操作。步骤 1：安装依赖首先，确保系统安装了编译…

阅读更多...

计算机毕业设计Python+大模型斗鱼直播可视化直播预测直播爬虫直播数据分析直播大数据大数据毕业设计机器学习深度学习

计算机毕业设计Python+大模型斗鱼直播可视化直播预测直播爬虫直播数据分析直播大数据大数据毕业设计机器学习深度学习

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…

阅读更多...

Docker：镜像构建 DockerFile

Docker：镜像构建 DockerFile

Docker：镜像构建 DockerFile 镜像构建docker build DockerfileFROMCOPYENVWORKDIRADDRUNCMDENTRYPOINTUSERARGVOLUME 镜像构建在Docker官方提供的镜像中，大部分都是基础镜像，他们只提供某个简单的功能，如果想要一个功能更加丰富…

阅读更多...

最新文章