深度学习参数管理

embedded/2024/9/22 13:05:47/

1.访问参数

我们从已有模型中访问参数。当通过`Sequential`类定义模型时,我们可以通过索引来访问模型的任意层。

· 检查第二个全连接层的参数。

print(net[2].state_dict())

print(net[2].bias)

print(net[2].bias.data)

net[2].weight

print(*[(name, param.shape) for name, param in net[0].named_parameters()])

print(*[(name, param.shape) for name, param in net.named_parameters()])

2.参数初始化

· 内置初始化

def init_normal(m):

    if type(m) == nn.Linear:

        nn.init.normal_(m.weight, mean=0, std=0.01)

        nn.init.zeros_(m.bias)

net.apply(init_normal)

net[0].weight.data[0], net[0].bias.data[0] #输出

· 不同的层采用不同的初始化

def init_xavier(m):

    if type(m) == nn.Linear:

        nn.init.xavier_uniform_(m.weight)

def init_42(m):

    if type(m) == nn.Linear:

        nn.init.constant_(m.weight, 42)    

net[0].apply(init_xavier)

net[2].apply(init_42)

print(net[0].weight.data[0])

print(net[2].weight.data)

3.共享参数

# 我们需要给共享层一个名称,以便可以引用它的参数

shared = nn.Linear(8, 8)

net = nn.Sequential(nn.Linear(4, 8), nn.ReLU(),

                    shared, nn.ReLU(),

                    shared, nn.ReLU(),

                    nn.Linear(8, 1))

net(X)

# 检查参数是否相同

print(net[2].weight.data[0] == net[4].weight.data[0])

net[2].weight.data[0, 0] = 100

# 确保它们实际上是同一个对象,而不只是有相同的值

print(net[2].weight.data[0] == net[4].weight.data[0])


http://www.ppmy.cn/embedded/115045.html

相关文章

vue part 11

vuex的模块化与namespace 115_尚硅谷Vue技术_vuex模块化namespace_1_哔哩哔哩_bilibili 116_尚硅谷Vue技术_vuex模块化namespace_2_哔哩哔哩_bilibili vue-router路由 很常见的很重要的应用:Ajax请求,将响应的数据替换掉原先的代码从而实现不跳转页面…

分布式计算技术是什么?在数据集成值得作用?

数据是现代科技技术的基础,面对爆炸性数据的增长,要求计算能力要求更高、数据整合和处理更有效,如何应对数据集成带来的挑战?本文将探讨分布式计算技术在数据集成中的优化作用。 一 分布式计算技术。 定义:分布式计算…

Qt 模型视图(三):视图类QAbstractItemView

文章目录 Qt 模型视图(三):视图类QAbstractItemView1.基本概念1.1.使用现有视图1.2.使用模型1.3.使用模型的多个视图1.4.在视图之间共享选择 Qt 模型视图(三):视图类QAbstractItemView ​ 模型/视图结构是一种将数据存储和界面展示分离的编程方法。模型存储数据,视…

系列课程:从零开始接触人工智能大模型

人工智能是计算机科学领域中最具前瞻性和影响力的技术之一。它是一种智慧型算法,能够模拟人类的思维过程,处理大量的数据和信息,从而发现隐藏在其中的规律和趋势。人工智能的应用范围非常广泛,包括语音识别、图像识别、自然语言处…

家政小程序开发/源码/上门维修/上门保洁服务平台

开发一个家政小程序是一个涉及多方面技术的项目,主要目标是为用户提供便捷的家政服务预约、查询和管理功能。以下是一个简要的开发流程和一些关键点,帮助你开始这个项目: 1.需求分析 用户调研:了解目标用户群体(如家庭…

使用LangGPT提示词让大模型比较浮点数

使用LangGPT提示词让大模型比较浮点数 背景介绍环境准备创建虚拟环境安装一些必要的库安装其他依赖部署大模型启动图形交互服务设置提示词与测试 LangGPT结构化提示词 背景介绍 LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-cha…

python爬虫初体验(一)

文章目录 1. 什么是爬虫?2. 为什么选择 Python?3. 爬虫小案例3.1 安装python3.2 安装依赖3.3 requests请求设置3.4 完整代码 4. 总结 1. 什么是爬虫? 爬虫(Web Scraping)是一种从网站自动提取数据的技术。简单来说&am…

分布式光伏发电系统如何确保电能质量达到并网要求?

随着全球对可再生能源的日益重视,光伏发电已成为推动能源转型的重要力量。特别是在应对气候变化、提升能源安全方面,光伏发电的潜力被广泛认同。然而,光伏电站的运营与维护面临许多挑战,如发电效率监测、故障诊断和数据管理等。因…