pytorch 参数理解

news/2025/2/28 7:43:48/

model.parameters()

import torch
import torch.nn as nnclass SimpleModel(nn.Module):def __init__(self):super(SimpleModel, self).__init__()self.fc1 = nn.Linear(10, 5)  # 输入维度为10,输出维度为5self.fc2 = nn.Linear(5, 2)   # 输入维度为5,输出维度为2def forward(self, x):x = torch.relu(self.fc1(x))x = self.fc2(x)return xmodel = SimpleModel()# 获取模型的参数
for param in model.parameters():print(param.shape, param.requires_grad)

假设打印结果:

torch.Size([5, 10]) True   # 第一层的权重
torch.Size([5]) True       # 第一层的偏置
torch.Size([2, 5]) True    # 第二层的权重
torch.Size([2]) True       # 第二层的偏置

线性层Linear WX+b

model.parameters() 返回一个生成器(generator),它会逐个生成模型中所有可训练的参数(Parameter 对象)。这些参数通常是张量(torch.Tensor),并且默认情况下它们的 requires_grad=True,这意味着它们会在反向传播中自动计算梯度

model.named_parameters()

for name, param in linearModel.named_parameters():print(name, param.grad)
# linear.weight tensor([[...]])
# linear.bias   tensor([[...]])

http://www.ppmy.cn/news/1575444.html

相关文章

第 20 天:动态材质(Material),让场景更生动!

🎯 目标: ✅ 理解 UE5 材质基础 ✅ 学会在 C 中控制动态材质 ✅ 制作透明特效,提升场景表现力 1️⃣ UE5 材质基础简介 Unreal Engine 5 的材质系统极其强大,允许你为场景中的物体添加各种视觉效果。 静态材质:预先定…

深入了解 SSH 及其相关协议

深入了解 SSH 及其相关协议 在网络通信的世界里,安全始终是至关重要的话题。SSH(Secure Shell)作为一种广泛应用的网络协议,为我们在不安全的网络环境中提供了安全的远程连接和数据传输方式。今天,就让我们一起来深入…

Python—Excel全字段转json文件(极速版+GUI界面打包)

目录 专栏导读1、背景介绍2、库的安装3、核心代码4、完整代码(简易版)5、进阶版(GUI)总结专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 🏳️‍🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注 👍 该系列文章专栏:请点击——…

3DCAPP系列:开目浏览器KMVue

KMVue支持对各位三维CAD模型文件以及中间格式模型文件进行模型轻量化,保留装配结构、几 何信息、PMI、属性等关键数据,通过对三维模型进行视图管理、剖切、测量、对比等操作实现三维模 型的可视化展示,同时也支持二维工程图、PDF文件、图片等…

【论文阅读笔记】FcaNet: Frequency Channel Attention Networks(2021/7/23)

目录 1 引言 2 方法 1 DCT和通道注意力 2 多光谱通道注意力(Multi-Spectral Channel Attention) 3 频率成分的选择标准 3 实验 4 结论 论文题目:FcaNet: Frequency Channel Attention Networks(频率通道注意力网络) 论文地址:https://arxiv.org/p…

Docker数据卷操作实战

什么是数据卷 数据卷 是一个可供一个或多个容器使用的特殊目录,它绕过 UFS,可以提供很多有用的特性: 数据卷 可以在容器之间共享和享用对 数据卷 的修改立马生效对 数据卷 的更新,不会影响镜像数据卷 默认会一直存在,即时容器被…

Pytorch实现之浑浊水下图像增强

简介 简介:这也是一篇非常适合GAN小白们上手的架构文章!提出了一种基于GAN的水下图像增强网络。这种网络与其他架构类似,生成器是卷积+激活函数+归一化+残差结构的组成,鉴别器是卷积+激活函数+归一化以及全连接层。损失函数是常用的均方误差、感知损失和对抗损失三部分。 …

用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解

DeepSeek R1 的完整训练流程核心在于,在其基础模型 DeepSeek V3 之上,运用了多种强化学习策略。 本文将从一个可本地运行的基础模型起步,并参照其技术报告,完全从零开始构建 DeepSeek R1,理论结合实践,逐步…