使用Pytorch完成图像分类任务

news/2025/1/23 11:13:21/

使用 PyTorch 完成图像分类任务是一个常见的机器学习任务,通常包括数据准备、模型设计、训练和测试等步骤。以下是一个完整的流程示例,帮助你快速入门:
1. 环境准备
确保你已经安装了 PyTorch 和其他必要的库。如果没有安装,可以通过以下命令安装:
pip install torch torchvision

2. 数据准备
使用 torchvision 提供的 datasets 和 transforms 模块来加载和预处理数据集。以 CIFAR-10 数据集为例:
import torch
import torchvision
import torchvision.transforms as transforms

# 数据预处理
transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),  # 随机水平翻转
    transforms.ToTensor(),              # 转换为张量
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))  # 归一化
])

# 加载数据集
train_dataset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
test_dataset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)

train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=64, shuffle=False)

3. 定义模型
定义一个简单的卷积神经网络(CNN)用于图像分类:
import torch.nn as nn
import torch.nn.functional as F

class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 8 * 8, 128)  # CIFAR-10 图像大小为 32x32
        self.fc2 = nn.Linear(128, 10)  # 输出 10 类

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2(x), 2))
        x = x.view(-1, 64 * 8 * 8)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

model = SimpleCNN()

4. 定义损失函数和优化器
使用交叉熵损失函数和随机梯度下降(SGD)优化器:
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

5. 训练模型
训练模型并记录训练过程中的损失:
num_epochs = 10

for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for i, (inputs, labels) in enumerate(train_loader):
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if i % 100 == 99:
            print(f"[{epoch + 1}, {i + 1}] loss: {running_loss / 100:.3f}")
            running_loss = 0.0

print("Training finished.")

6. 测试模型
在测试集上评估模型的性能:
model.eval()
correct = 0
total = 0

with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f"Accuracy: {100 * correct / total:.2f}%")

7. 保存和加载模型
保存训练好的模型:
torch.save(model.state_dict(), "simple_cnn.pth")

加载模型:
model = SimpleCNN()
model.load_state_dict(torch.load("simple_cnn.pth"))
model.eval()

总结
以上是一个完整的使用 PyTorch 进行图像分类的流程。你可以根据需要调整模型结构、数据预处理方式和超参数,以获得更好的性能。如果需要处理更复杂的数据集(如 ImageNet),可以考虑使用预训练模型(如 ResNet、VGG 等)来提高效率和性能。


http://www.ppmy.cn/news/1565467.html

相关文章

一文学会记录Controller请求信息

背景 日常开发中,Controller作为对外暴露的接口,承担者业务请求入口的角色。但请求出现问题时,我们经常需要查看请求的参数信息,因此统一记录一下Controller的请求信息,对于后续排查问题,还是很方便的。 基…

Spark/Kafka

文章目录 项目地址一、Spark1. RDD1.1 五大核心属性1.2 执行原理1.3 四种创建方式二、Kafka2.1 生产者(1)分区器(2)生产者提高吞吐量(3) 生产者数据可靠性数据传递语义幂等性和事务数据有序2.2 Broker(1)Broker工作流程(2)节点服役和退役2.3 副本(1)Follower故障细…

无序向量唯一化算法

最坏情况下需要 Ω ( n 2 ) \Omega(n^2) Ω(n2) 时间&#xff0c;最好情况下仅需 O ( n ) O(n) O(n) 时间。 删除无序向量中的重复元素 template <typename T> Rank Vector<T>::dedup(){Rank oldSize_size;//原来的规模for(Rank i1;i<_size;)//从前往后枚举…

十三、数据的的输入与输出(3)

数据的输出 writeClipboard&#xff08;&#xff09;函数 writeClipboard&#xff08;&#xff09;函数可以将数据输出至剪贴板。 例如&#xff0c;将R的内置数据集iris输出到剪贴板&#xff0c;在进入Excel中点击"粘贴"。 head(iris) #查看数据集Sepal.L…

最新-CentOS 7安装1 Panel Linux 服务器运维管理面板

CentOS 7安装1 Panel Linux 服务器运维管理面板 一、前言二、环境要求三、在线安装四、离线安装1.点击下面1 Panel官网链接访问下载&#xff0c;如未登录或注册&#xff0c;请登录/注册后下载2.使用将离线安装包上传至目标终端/tem目录下3.进入到/tem目录下解压离线安装包4.执行…

vscode的字体图标库-icomoon

icomoon官网下载地址&#xff1a;SVG Icon Libraries and Custom Icon Font Organizer ❍ IcoMoon Easily mange your icons and integrate them in your projects. Browse free icons or import your own SVG icons to export as icon font, SVG, PNG, sprite and more.https:…

RV1126+FFMPEG推流项目源码

源码在我的gitee上面&#xff0c;感兴趣的可以自行了解 nullhttps://gitee.com/x-lan/rv126-ffmpeg-streaming-project

c#配置config文件

1&#xff0c;引用命名空间 Configuration 及配置信息