记录学习《手动学习深度学习》这本书的笔记(二)

news/2024/12/4 0:33:17/

这几天看完了第5章:深度学习计算,做个总结。

第五章:深度学习计算

5.1 层和块

介绍了神经网络的层和块。

层:①接收一组输入②生成相应输出③具有一组可调整参数

块:描述单个或多个层,或多个快,甚至整个模型。从编程角度,块由类(class)表示,其中包含前向传播函数和一些必要的参数。

from mxnet import np, npx
from mxnet.gluon import nnnpx.set_np()net = nn.Sequential()
net.add(nn.Dense(256, activation='relu'))
net.add(nn.Dense(10))
net.initialize()X = np.random.uniform(size=(2, 20))
net(X)

这样就实现了一个块,包含一个带激活函数的含256个神经元的全连接层和一个10个神经元的全连接层。

net(X)在这里相当于net.__call__(X)(默认调用函数),作用是将X前向传播得出预测的y。

Class MLP(nn.Module):def __init__(self):super().__init__()self.hidden = nn.Linear(20, 256) self.out = nn.Linnear(256, 10)# 括号里两个参数分别代表输入维度和输出维度def forward(self, X):return self.out(F.relu(self.hidden(X)))net = MLP()
net(X)

这样就手动实现了一个块。

nn.Module的默认调用函数是forward,所以net(X)运行的其实是net.forward(X)。

然后再来实现一个可以自定义的块:

class mySequential(nn.Module):def __init__(self, *args):super().__init__()for idx, module in enumerate(args):self._modules[str(idx)] = moduledef forward(self, X):for block in self._modules.values():X = block(X)return Xnet = MySequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))
net(X)

5.2 参数管理

这里介绍了一些关于神经网络参数的知识。

比如我们可以用函数访问参数:

net = nn.Sequential(nn.Linear(4, 8), nn.ReLU(), nn.Linear(8,1))print(net[2].state_dict())

state_dict()用于获取模型参数和缓冲区(如权重和偏置)的字典,访问第三层的weight和bias。

print(net[2].bias)
print(net[2].bias.data)

输出偏置和参数类的实例。

还可以一次性输出模型全部参数,还有另一种输出模型参数的方式,还可以输出嵌套块的参数。

还有参数绑定:

shared = nn.Linear(8, 8)
net = Sequential(shared, nn.ReLU(), shared)

这时改变一个,另一个也会变。

5.5 读写文件

可以将张量加载或保存,也可以将模型加载或保存。

5.6 GPU

计算机中有CPU和GPU两种处理器(设备),默认情况下变量和计算都保存在CPU中,CPU和GPU可以用torch.device('cpu')和torch.device('cuda')表示。

CPU代表所有物理CPU和内存,GPU只代表一个卡和显存。

def try_gpu(i = 0):if torch.cuda.device_count() >= i+1:return torch.device(f'cuda:{i}')return torch.device('cpu')

可以自行设置将张量存储在gpu中,比如:

X = torch.ones(2, 3, device = try_gpu(0))

不同gpu上张量无法互通,需要进行运算可以将张量复制到另一个gpu上。

Z = X.cuda(1)

深度学习框架要求计算的输入数据都在同一设备上,无论是cpu还是gpu。


http://www.ppmy.cn/news/1552135.html

相关文章

AI与ArcGIS Pro的地理空间分析和可视化

AI思维已经成为一种必备的能力,ArcGIS Pro3的卓越性能与ChatGPT的智能交互相结合,将会为您打造了一个全新的工作流程! 那么如何将火热的ChatGPT与ArcGIS Pro3相结合,使我们无需自己进行复杂的编程,通过强大的ChatGPT辅助我们完成地…

Git命令大全(超详细)

Git 是一个分布式版本控制系统,用于跟踪计算机文件的更改,并协调多个用户之间的工作。下面是一份较为详细的 Git 命令大全,涵盖了从初始化仓库到日常使用中常见的操作。 1. 初始化与配置 设置用户信息: git config --global user.name &quo…

704. 二分查找 C++

文章目录 一、题目链接二、参考代码三、所思所悟 一、题目链接 链接: 704. 二分查找 二、参考代码 int search(const vector<int>& nums, int target) {int left 0; int right nums.size() - 1;//左闭右闭[]while (left < right){int mid (left right) / 2;…

开发一个基于MACOS M1/2芯片的Android 12的模拟器

产品需求&#xff1a;MuMu模拟器Pro_率先适配Apple M系列芯片的安卓模拟器 苹果M芯片专属&#xff1a;产品专为苹果M系列芯片设计&#xff0c;意味着它需要能够充分利用M系列芯片的性能优势。 安卓模拟器&#xff1a;产品是一个安卓模拟器&#xff0c;允许用户在Mac设备上运行…

Python 自动化办公的 10 大脚本

大家好&#xff0c;我是你们的 Python 讲师&#xff01;今天我们将讨论 10 个实用的 Python 自动化办公脚本。这些脚本可以帮助你简化日常工作&#xff0c;提高效率。无论是处理 Excel 文件、发送邮件&#xff0c;还是自动化网页操作&#xff0c;Python 都能派上用场。 1. 批量…

XML 查看器:深入理解与高效使用

XML 查看器:深入理解与高效使用 XML(可扩展标记语言)是一种用于存储和传输数据的标记语言。它通过使用标签来定义数据结构,使得数据既易于人类阅读,也易于机器解析。在本文中,我们将探讨 XML 查看器的功能、重要性以及如何高效使用它们。 什么是 XML 查看器? XML 查看…

Java-15 深入浅出 MyBatis - 插件机制 PageHelper 与 通用 Mapper

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 大数据篇正在更新&#xff01;https://blog.csdn.net/w776341482/category_12713819.html 目前已经更新到了&#xff1a; MyBatis&#xff…

Java 基础之 List 深度探秘

List 是什么&#xff1f; List 集合是 Java 集合框架中的一种有序、可重复的数据结构&#xff0c;它继承自 Collection 接口&#xff0c;允许存储多个元素。与数组不同&#xff0c;List 集合的大小是动态可变的&#xff0c;可以根据需要动态地添加或删除元素。 List 集合中的…