RepVGG:使VGG样式的ConvNets再次出色

news/2025/1/31 6:30:37/

重振VGG雄风!主体仅使用3×3卷积和ReLU!据作者称,在ImageNet上,RepVGG的top-1准确性达到80%以上,这是基础模型的首次实现!综合性能超越ResNet、EfficientNet等,部分代码刚刚开源!

注1:文末附【计算机视觉细分垂直方向】交流群(含检测、分割、跟踪、医疗、GAN、Transformer等)
注2:欢迎点赞,支持分享!
在这里插入图片描述

RepVGG

RepVGG: Making VGG-style ConvNets Great Again
在这里插入图片描述

  • 作者单位:清华大学(丁贵广团队), 旷视科技(孙剑等人), 港科大, 阿伯里斯特威斯大学
  • 代码1:https://github.com/megvii-model/RepVGG
  • 代码2(基于PyTorch):https://github.com/DingXiaoH/RepVGG
  • 论文下载链接:https://arxiv.org/abs/2101.03697

我们提出了一个简单但强大的卷积神经网络架构,该架构具有类似于VGG的推理时间主体,该主体仅由3x3卷积和ReLU的堆栈组成,而训练时间模型具有多分支拓扑。

训练时间和推理时间架构的这种解耦是通过结构重新参数化(re-parameterization)技术实现的,因此该模型称为RepVGG。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

主要贡献

在这里插入图片描述
在这里插入图片描述

实验结果

在ImageNet上,据我们所知,RepVGG的top-1准确性达到80%以上,这是纯模型首次实现。 在NVIDIA 1080Ti GPU上,RepVGG模型的运行速度比ResNet-50快83%,比ResNet-101快101%,具有更高的精度,并且与诸如EfficientNet和RegNet的最新模型相比,显示出良好的精度-速度折衷。

在这里插入图片描述
在这里插入图片描述

CVer-细分垂直交流群成立

扫码添加CVer助手微信,可申请加入CVer-细分垂直方向 微信交流群,也可申请加入CVer大群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。

在这里插入图片描述

CVer小助手微信号:CVer6666。一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,才能通过且邀请进群

强烈推荐大家关注和CVer微信公众号,可以快速了解到最新优质的CV论文。

在这里插入图片描述


http://www.ppmy.cn/news/480949.html

相关文章

详解VGG网络

详解VGG网络 1、介绍 VGG全称是Visual Geometry Group,属于牛津大学科学工程系,其发布了一些列以VGG开头的卷积网络模型,可以应用在人脸识别、图像分类等方面,分别从VGG16-VGG19。 VGG研究卷积网络深度的初衷是想搞清楚卷积网络深度是如何影响大规模图像分类与识别的精度…

Vgg16 + Unet 介绍

VGG-16: 这个数字16,就是指在这个网络中包含 16个卷积层和全连接层,随着网络的加深,图像的高度和宽度都在以一定的规律不断缩小,每次池化后刚好缩小一半,而通道数量在不断增加,而且刚好也是在每…

RepVGG: Making VGG-style ConvNets Great Again

论文地址:https://arxiv.org/pdf/2101.03697.pdf。 GitHub地址:https://github.com/megvii-model/RepVGG。 目录 0、摘要 1、引言 2、相关技术 3、利用结构重参数化构造RepVGG 3.1、 简单就是快速、内存高效、灵活 3.2、训练阶段的多分支结构 3.3…

VQA + GNN

Graph-Structured Representations for Visual Question Answering(GraphVQA) Abstract 通过structured representations of both scene contents and questions提升VQA性能。VQA的主要挑战在于对visual和text两个领域都需要理解。传统的模型中常常忽略场景中的结构和问题中的…

VGG和NIN网络

本文主要是学习了Dive-into-DL-PyTorch这本书。因此这篇博客的大部分内容来源于此书。框架使用的是pytorch,开发工具是pycharm 参考 动手学深度学习Dive-into-DL-Pytorch 参考链接 https://github.com/ShusenTang/Dive-into-DL-PyTorch https://github.com/zergtant…

VGG16模型

VGG16模型很好的适用于分类和定位任务 其名称来源于作者所在的牛津大学视觉几何组(Visual Geometry Group)的缩写。 1、结构简洁 VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用max-pooling(最大化池)分开,所有…

vgg理解

Vgg16这个名词对于要做神经网络深度学习的人来说一定不陌生,当我们在看相关的教程或者案例的时候,都会出现Vgg16。那么它到底是什么? Vgg16是一个卷积神经网络的模型,它是一个被预训练好的模型。 Vgg模型(网上配图&am…

VGG入门

转载自深度学习之基础模型-VGG VGG论文给出了一个非常振奋人心的结论:卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用。记得在AlexNet论文中,也做了最后指出了网络深度的对最终的分类结果有很大的作用。这篇论文则更加直…