代码讲解系列-CV(二)——卷积神经网络

server/2025/2/7 0:43:12/

文章目录

  • 一、系列大纲
  • 二、卷积神经网络(图像分类为例)
    • 2.1 pytorch简介
      • 训练框架
      • 张量
      • 自动微分
      • 动态计算图
      • 更深入学习
    • 2.2 数据输入和增强
      • Dataset—— torch.utils.data.Dataset
      • DataLoader——torch.utils.data.Dataloader
      • 数据增强
    • 2.3 CNN设计与训练
      • nn.Module
      • 卷积层
      • 池化层和归一化层
      • 模块
      • 训练
    • 2.4 指标评估和可视化
      • 指标评估
      • Tensorboard
      • Timm库

一、系列大纲

第1讲CV基础框架
·环境配置
anaconda,cuda
IDE:vscode,pycharm
·linux常用命令,Git管理
·Coding流程与常用工具
第2讲卷积神经网络
pytorch入门
·数据输入和数据增强
CNN网络设计与模型训练
·指标评估和可视化
Timm库的使用
第3讲Transformer系列
ViT结构解析
使用ViT进行图像分类
·注意力的可视化
第4讲目标检测初探
·标注检测数据
·数据解析与输入
YOLOV8的使用
·指标评估
第5讲语义分割基础
·数据的标注与解析
·U-Net网络设计
网络输出与指标
第6讲视觉生成模型
·生成原理简介
·Stable Diffusion代码框架
·AP-adapter介绍
第7讲前沿论文复现
Readme与环境配置
模型的增删改查
代码Debug方法
第8讲模型的修改与设计
自定义输入数据
为模型添加Refine模块
为模型添加注意力

二、卷积神经网络(图像分类为例)

2.1 pytorch简介

训练框架

在这里插入图片描述

张量

在这里插入图片描述
在这里插入图片描述
对运算符进行重载,主要是形状变换
cat就是结合,split就是拆分

自动微分

在这里插入图片描述

动态计算图

在这里插入图片描述

更深入学习

熟悉API:

  • 数据输入(Dataset和Dataloader)
  • 模型搭建和训练(nn.Module)
  • 损失函数和反向传播
  • 模型保存

进阶功能:

  • 并行训练,混合精度训练
  • 冻结参数,复杂训练模式
  • 自定义前向和反向算子
  • 梯度裁剪
    新特性:
    Torch.Compile()
    FlashAttention

https://space.bilibili.com/478674499

2.2 数据输入和增强

Dataset—— torch.utils.data.Dataset

在这里插入图片描述
init就是把所有的数据都加载进来
getitem就是逐个读出

DataLoader——torch.utils.data.Dataloader

在这里插入图片描述

数据增强

在这里插入图片描述

2.3 CNN设计与训练

nn.Module

在这里插入图片描述
init把组件和模块定义好
forward就是调用模型的时候使用的

卷积层

2维卷积为例
输入和输出通道、尺寸、步长、填充、偏置(如果后面有归一化层,需要打开)、分组卷积。
在这里插入图片描述

池化层和归一化层

在这里插入图片描述
归一化中(BatchNorm2d用的最多)

模块

了解层之后,组成模块
在这里插入图片描述
在这里插入图片描述
一个列表一个字典,两个方式。这几个方法之间可以相互嵌套
列表:
在这里插入图片描述
字典最灵活,而且可读性很好
在这里插入图片描述

训练

优化器:决定优化方向
在这里插入图片描述
parameters就是参数的意思
train_loop就是训练循环

优化器清零、loss反向传播、更新参数

2.4 指标评估和可视化

指标评估

在这里插入图片描述
每个batch的loss进行相加、再除以长度(data_size)

Tensorboard

在这里插入图片描述
嗯,就是显示

Timm库

在这里插入图片描述


http://www.ppmy.cn/server/165542.html

相关文章

Rust 数据类型详解:Scalar 与 Compound 类型

Rust 数据类型详解:Scalar 与 Compound 类型 Rust 是一门强类型语言,其类型系统设计严谨且功能强大。Rust 的数据类型可以分为两大类:Scalar(标量)类型 和 Compound(复合)类型。本文将详细介绍…

Spring Boot Actuator与JMX集成实战

在微服务架构中,监控和管理应用的运行状态是至关重要的。Spring Boot Actuator 提供了一种便捷的方式来监控和管理 Spring Boot 应用,而 JMX(Java Management Extensions)则是一种用于管理 Java 应用的标准技术。本文将通过一个实…

【数据结构】_C语言实现带头双向循环链表

目录 1. 单链表与双链表 1.1 单链表的结构及结点属性 1.2 双链表的结构及结点属性 2. 单链表与双链表的区别 3. 双链表的实现 3.1 List.h 3.2 List.c 3.3 Test_List.c 注:部分方法的实现细节注释 1. 双链表结点前驱、后继指针域的初始化 2. 各种增、删结…

[STM32 标准库]EXTI应用场景 功能框图 寄存器

一、EXTI 外部中断在嵌入式系统中有广泛的应用场景,如按钮开关控制,传感器触发,通信接口中断等。其原理都差不多,STM32会对外部中断引脚的边沿进行检测,若检测到相应的边沿会触发中断,在中断中做出相应的处…

机器学习,深度学习,神经网络,深度神经网络

人工智能包含机器学习,机器学习包含深度学习(是其中比较重要的分支)。深度学习源自于人工神经网络的研究,但是并不完全等于传统神经网络。 神经网络与深度神经网络的区别在于隐藏层级,通常两层或两层以上隐藏层的网络叫…

初识Cargo:Rust的强大构建工具与包管理器

初识Cargo:Rust的强大构建工具与包管理器 如果你刚刚开始学习Rust,一定会遇到一个名字:Cargo。Cargo是Rust的官方构建工具和包管理器,它让Rust项目的创建、编译、测试和依赖管理变得非常简单。本文将带你快速了解Cargo的基本用法…

arkui-x跨平台与android java联合开发

华为鸿蒙系统采用的是arkts,支持跨平台crossplatform 即前端为arkts,arkui-x框架,后端为其他的语言框架。 本篇示例后端采用的是java,android studio工程。 主要方式是前端鸿蒙完成界面元素、布局等效果,后面androi…

微服务知识——微服务拆分规范

文章目录 一、微服务拆分规范1、高内聚、低耦合2、服务拆分正交性原则3、服务拆分层级最多三层4、服务粒度适中、演进式拆分5、避免环形依赖、双向依赖6、通用化接口设计,减少定制化设计7、接口设计需要严格保证兼容性8、将串行调用改为并行调用,或者异步…