【pytorch载入模型报错解决】Missing key(s) in state_dict、Unexpected key(s) in state_dict

devtools/2024/12/22 15:00:07/

当你试图加载模型参数时,爆出如下类似错误:

Missing key(s) in state_dict: "conv1.weight", "bn1.weight", "bn1.bias", "bn1.running_mean",
...
Unexpected key(s) in state_dict: "epoch", "model_state", "optim_state", "best_valid_acc".

有人可能会使用stric=False来解决,即:

python">model.load_state_dict(torch.load("model1_model_best.pth.tar"),stric=False)

但这样有一个很直观的问题:许多参数都没找到,strict=False只会导致几乎所有参数都无法加载进来。

注意到Unexpected keys里有一个model_state,大概率这个才是真正存储权重的key。也就是说,为了能把除了模型权重之外的一些参数,比如这个模型训练到的epoch,acc信息等。为了把这些一起存到pth.tar里,有时候可以额外做一个键值对来存储权重。 此时,我们加载的办法就不再是上面那样,而是:

python">        ckpt = torch.load(ckpt_path)self.models[i].load_state_dict(ckpt['model_state'])

请注意这种情况


http://www.ppmy.cn/devtools/1793.html

相关文章

基于Material Design风格开源、易用、强大的WPF UI控件库

前言 今天大姚给大家分享一款基于Material Design风格开源、免费(MIT License)、易于使用、强大的WPF UI控件库:MaterialDesignInXamlToolkit。 项目介绍 MaterialDesignInXamlToolkit 是一个开源、易于使用、强大的 WPF UI 控件库&#x…

TCP和UDP协议的区别

1、定义 TCP协议的全称是Transmission Control Protocol(传输控制协议),是一种面向连接的点对点的传输层协议。 UDP协议的全称是User Datagram Protocal(用户数据报协议),为应用程序提供一种无需建立连接…

设计模式代码实战-组合模式

1、问题描述 小明所在的公司内部有多个部门,每个部门下可能有不同的子部门或者员工。 请你设计一个组合模式来管理这些部门和员工,实现对公司组织结构的统一操作。部门和员工都具有一个通用的接口,可以获取他们的名称以及展示公司组织结构。…

通用航空机场系统架构:连接天空与大地的科技之桥

在现代航空业的背景下,通用航空机场系统架构的重要性愈发凸显。通用航空机场作为航空运输网络的重要组成部分,承担着连接各地区、支持经济发展和满足民众出行需求的重任。而其系统架构的设计与运作,直接影响着机场的安全性、效率性以及用户体…

【学习】VScode修改侧边栏大小。

侧边栏不可以直接更改,所以先缩放整体界面,再改变工作区大小。 缩放整体界面: Ctrl 或 Ctrl - 。 也可以直接使用如下代码: Ctrl Shifit p 打开搜索 settings ,选择下图第一个。 然后嵌入如下代码&#xff1a…

【视频异常检测】Learning Multimodal Violence Detection under Weak Supervision 论文阅读

Not only Look, but also Listen: Learning Multimodal Violence Detection under Weak Supervision 论文阅读 Abstract1 Introduction2 Related Work3 XD-Violence Dataset3.1 Selecting Violence Categories3.2 Collection and AnnotationVideo annotation.3.3 Dataset Stati…

如何采集opc服务器数据上传云端

为了进一步提高生产效率,生产制造的不断朝着智能化发展和升级,传统的自动化生产系统已经不能满足需求。传统的SCADA系统一般是用于现场的数据采集与控制,但是本地控制已经无法满足整个工厂系统智能化数字化的需求,智能化数字化是需…

云原生数据库海山(He3DB)PostgreSQL版核心设计理念

本期深入解析云原生数据库海山PostgreSQL版(以下简称“He3DB”)的设计理念,探讨在设计云原生数据库过程中遇到的工程挑战,并展示He3DB如何有效地解决这些问题。 He3DB是移动云受到 Amazon Aurora 论文启发而独立自主设计的云原生数…