数据集与数据加载器(Datasets & DataLoaders)
在 PyTorch 中,torch.utils.data.Dataset
和 torch.utils.data.DataLoader
是数据处理的两种核心工具。它们通过模块化的方式,将数据加载与模型训练分离,提高代码的可读性和可维护性。
1. 加载数据集
以 Fashion-MNIST 为例,该数据集包含 60,000 个训练样本和 10,000 个测试样本,每个样本是一个 28×28 的灰度图像及其对应的类别标签。使用 PyTorch 内置工具加载:
python">from torchvision import datasets
from torchvision.transforms import ToTensortraining_data