调参问题记录--显存下降bs调整

news/2024/11/13 18:04:33/

最近接触一个生成代码,在每个epoch的train后放入了torch.cuda.empty_cache(),然后进入eval,模型整体bs为1,lr为0.0001。
我要查看这个模型在我的数据上效果,所以需要进行简单的超参调节,以下记录了步骤:

  • 具体操作:bs较小,调参起来周期长,修改bs和对应的lr

  • 发现问题1:这个步骤中,bs调整为32,lr调整为0.01,此时在watch中gpu会在一个epoch的训练结尾突然降低到6%-8%浮动

  • 解决思路

    • 是否为gpu温度过高问题,因为我发现gpu随着运行逐渐会升高到80C,通过记录发现,并不是温度导致的显存突然下降
    • 是否为dataloader的num_workers=8参数导致训练一段时间后内存满了,导致显存利用率下降,调整num_workers=0,增加pin_memory=True 选项,仍不能解决
    • 是否为torch.cuda.empty_cache()问题,移除之后发现并没有太大变化,因为我的显存没有完全跑满,并不担心会爆显存
    • 最后发现是eval的验证过程,bs还是为1且只有前向过程,所以使用现存很少且由于数据比较多又显得很慢
  • 发现问题2:bs调整为32,lr调整为0.01,按理说应该会比bs为1,lr为0.0001能够更快到收敛值,有一个较好的结果,但是我发现训练后期会让整个生成模型变得不稳定,甚至loss逐渐增大

  • 解决思路2
    我觉得可能是因为针对专门的数据集,基于GAN的生成模型在大bs中学习会很困难,导致bs增大后,模型能力不足,导致模式崩溃


http://www.ppmy.cn/news/1546728.html

相关文章

软考系统架构设计师论文:论软件的可靠性评价

试题四 论软件的可靠性评价 软件可靠性评价是软件可靠性活动的重要组成部分,既适用于软件开发过程,也可针对最 终软件系统。在软件开发过程中使用软件可靠性评价,可以使用软件可靠性模型,估计软件当前的可靠性,以确认是否可以终止测试并发布软件,同时还可以预计软件要达…

高校数字校园建设的数字身份管理难题

近年来,我国高等院校在《中国教育现代化2035》战略的要求下,在《高等学校数字校园建设规范(试行)》的指引下,掀起了数字校园建设高潮。借助教学、科研、管理、服务等种类的业务应用,高校提升了业务的数字化…

Python使用PDF相关组件案例详解

主要对pdfminer.six、pdfplumber、PyMuPDF、PyPDF2、PyPDF4、pdf2image、camelot-py七个PDF相关组件分别详解,具体使用案例演示 1. pdfminer.six pdfminer.six 是一个专门用来从 PDF 中提取文本的库,能够处理复杂的文本布局,适合用于文本解析…

用正则表达式检查是IP否为内网地址

用正则表达式检查是ip否为内网地址 PHP function isIntranet($ip) {/* IPV4内网地址A 类10.0.0.0~10.255.255.255B 类172.16.0.0~172.31.255.255C 类192.168.0.0~192.168.255.255*/// 检查是否为 IPv4 内网地址if (preg_match(/^10\./, $ip…

Qt 获取当前系统中连接的所有USB设备的信息 lsusb版

Qt 获取当前系统中连接的所有USB设备的信息 lsusb版 flyfish 环境 Ubuntu22.04 Qt 6.2.4 实现的功能 枚举USB设备:使用lsusb命令获取当前系统中连接的所有USB设备的信息。 解析设备信息:将lsusb命令的输出按行分割,并提取每行中的总线号、…

CentOS 安装 Python 3.11.9完整流程

在 CentOS 上安装 Python 3.11.9 并替换系统中的默认 Python 版本,可以按照以下步骤来进行。请注意,替换默认 Python 版本可能会影响系统的其他工具和依赖,因此请谨慎操作。 步骤 1:安装依赖 首先,确保系统安装了编译…

计算机毕业设计Python+大模型斗鱼直播可视化 直播预测 直播爬虫 直播数据分析 直播大数据 大数据毕业设计 机器学习 深度学习

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

Docker:镜像构建 DockerFile

Docker:镜像构建 DockerFile 镜像构建docker build DockerfileFROMCOPYENVWORKDIRADDRUNCMDENTRYPOINTUSERARGVOLUME 镜像构建 在Docker官方提供的镜像中,大部分都是基础镜像,他们只提供某个简单的功能,如果想要一个功能更加丰富…