【YOLO11改进trick】Pinwheel-shaped Conv风车状卷积引入YOLO11,含创新点代码,方便发论文

news/2025/2/23 5:51:31/

目录

🍋🍋1.即插即用的 PConv风车状卷积

🍇1.1风车状卷积结构

🍇1.2PConv的参数量

🍭🍭2.PConv适用场景

🍉🍉3.风车状卷积PConv的优点

🏆3.1. 高效的感受野扩展

🏆3.2. 即插即用的模块化设计

🏆3.3. 卓越的准确性和鲁棒性

🏆3.4. 强大的泛化能力

🏆3.5. 参数效率高

YOLO11-toc" name="tableOfContents" style="margin-left:0px">🔔🔔4.如何将PConv引入YOLO11

🌷4.1直接替换普通卷积模块

🌷4.2作为C3K2模块的优化模块

🍌🍌5.创新点Python代码

YOLO11%E5%B7%A5%E7%A8%8B%E4%BB%A3%E7%A0%81%E4%BF%AE%E6%94%B9%E5%A4%84-toc" name="tableOfContents" style="margin-left:0px">💖💖6.YOLO11工程代码修改处

整理不易,欢迎一键三连!!!

送你们一条美丽的--分割线--


需要全套改进代码请私信留言。

🍋🍋1.即插即用的 PConv风车状卷积

🍇1.1风车状卷积结构

风车状PConv卷积模块的网络结构示意图如下:

        与标准卷积不同,它使用非对称填充为图像的不同区域创建水平和垂直卷积核,卷积核向外扩散。设输入张量X(h1,w1,c1),其中h1、w1、c1分别表示其高度、宽度和通道大小。为增强训练稳定性和速度,在每次卷积后应用批归一化(BN)和sigmoid线性单元(SiLU)。

        PConv的第一层进行并行卷积,计算公式如下:

        其中,⊗是卷积运算符,W1(1,3,c′)是一个1×3的卷积核,输出通道为c′。填充参数P(1,0,0,3)分别表示在左、右、上、下方向的填充像素数。

        第一层交错卷积后输出特征图的高度(h′)、宽度(w′)和通道数(c′)与输入特征图的关系为:

        其中c2是PConv模块最终输出特征图的通道数,s是卷积步长。

        第一层交错卷积的结果进行拼接(Cat(.,.)),输出计算为:

        最后,拼接后的张量通过卷积核W(2,2,c2)进行归一化,不进行填充。输出特征图的高度和宽度调整为预设值h2和w2,使PConv可与Conv层互换,并作为一种通道注意力机制分析不同卷积方向的贡献。最终输出Y(h2,w2,c2)计算如下:

        PConv的感受野的有效性向外逐渐减弱,类似于高斯分布,且目标越小,其特征越集中,突出了中心特征的重要性。

🍇1.2PConv的参数量

        PConv(k=3)的感受野为25,卷积次数从中心向外减少,类似高斯分布。PConv利用分组卷积,在显著增加感受野的同时最小化参数数量。标准卷积(Conv)的参数数量计算公式为:

        若输出通道数(c2)等于输入通道数(c1),3×3的Conv参数为9c12。PConv的参数计算如下:

        与{9_{c1}}^{2}的3×3 Conv相比,PConv参数减少了22.2%,感受野增加了177%。在用于提取IRST底层特征时,PConv替换YOLO系列等网络的前两个Conv层,此时c2=4c1,Conv需要{36_{c1}}^{2}参数,而PConv需要{72_{c1}}^{2}。因此,PConv(k=3)相比3×3 Conv,感受野增


http://www.ppmy.cn/news/1574356.html

相关文章

37、深度学习-自学之路-自己搭建深度学习框架-2、自动梯度计算

import numpy as npclass Tensor(object):import numpy as np:导入 numpy 库,用于处理数组相关操作。class Tensor(object):定义了一个名为 Tensor 的类,继承自 object。__init__ 方法是类的构造函数,用于初始化 Tenso…

哈希表(C语言版)

文章目录 哈希表原理实现(无自动扩容功能)代码运行结果 分析应用 哈希表 如何统计一段文本中,小写字母出现的次数? 显然,我们可以用数组 int table[26] 来存储每个小写字母出现的次数,而且这样处理,效率奇高。假如我们想知道字…

遗传算法(GA)是一种基于自然选择和遗传学原理的搜索和优化技术,可以用于调整条件生成对抗网络(cGAN)的参数。

遗传算法(GA)是一种基于自然选择和遗传学原理的搜索和优化技术,可以用于调整条件生成对抗网络(cGAN)的参数。以下是使用遗传算法为cGAN调参的步骤: 1. 定义适应度函数 适应度函数是遗传算法的核心&#x…

MySQL登录问题总结

不管何种数据库,使用的第一步都是先登录。 MySQL命令行登录语句:mysql -u username -P port -p -D database_name 登录MySQL的报错一般从报错信息都能得到反馈,常见报错原因分析如下,实例中的以test用户为例,登录环境为…

Flask flash() 消息示例

目录 安装 Flask 入门:Flask flash() 基本示例 进阶:使用 Flask-WTF Flash 登录结果消息 详解:get_flashed_messages() 详解:flash() 消息的完整生命周期 Flask 提供 flash() 用于向 用户传递临时消息,通常用于: • 表单提交成功或失败 • 用户登录、注册、退出提…

23种设计模式之《组合模式(Composite)》在c#中的应用及理解

程序设计中的主要设计模式通常分为三大类,共23种: 1. 创建型模式(Creational Patterns) 单例模式(Singleton):确保一个类只有一个实例,并提供全局访问点。 工厂方法模式&#xff0…

TIP: Flex-DLD

Article: Flex-DLD: Deep Low-Rank Decomposition Model With Flexible Priors for Hyperspectral Image Denoising and Restoration, 2024 TIP. 文章的主要思想是用network来学low-rank decomposition的两个matrix(input是random input). 文章的framew…

Perl 面向对象编程指南

Perl 面向对象编程指南 引言 Perl 是一种强大的编程语言,以其灵活性和强大的文本处理能力而闻名。随着软件工程的发展,面向对象编程(OOP)已经成为现代编程的主流。本文将深入探讨 Perl 的面向对象编程,包括其基本概念…