(arxiv2411) TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba

(arxiv2411) TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba

news/2025/2/21 16:46:20/

论文：https://arxiv.org/abs/2411.17473

代码：https://github.com/xwmaxwma/TinyViM

作者提出了一种 Convolution-Mamba 的混合架构TinyViM，架构如下图所示。可以看出方法的核心是 Laplace Mixer。

Laplace mixer: 作者首先通过实验，发现Mamba主要在对低频特征进行建模。比如下图中，Mamba处理后，高频特征被抑制了。为了解决这个问题，即保留高频特征，作者使用拉普拉斯金字塔的方法来分解特征的高频和低频，低频部分使用Mamba处理，高频部分使用卷积处理。这样分离高低频的思路在很多论文中有应用。

Frequency Ramp Inception： 众所周知，深度神经网络的浅层主要是提取细节信息，深层主要是提取全局信息。因此有必要在网络不同阶段调节高低频的比例。因此，作者使用 Frequency Ramp Inception，就是随网络加深，逐渐增加低频成分的比例，提高性能。作者有一个消融实验，表明低频比例在四个阶段分别取 [0.25, 0.50, 0.50, 0.75]时性能较好。

其它部分可以参考作者论文，这里不过多介绍。

http://www.ppmy.cn/news/1572783.html

相关文章

算法学习笔记之贪心算法

算法学习笔记之贪心算法

导引（硕鼠的交易） 硕鼠准备了M磅猫粮与看守仓库的猫交易奶酪。仓库有N个房间，第i个房间有 J[i] 磅奶酪并需要 F[i] 磅猫粮交换，硕鼠可以按比例来交换，不必交换所有的奶酪计算硕鼠最多能得到多少磅奶酪。输入M和…

阅读更多...

高效构建与配置高可用负载均衡集群：从理论到实践的全面实施

高效构建与配置高可用负载均衡集群：从理论到实践的全面实施

1. 主机配置主机IPVIP角色本机客户端OpenEuler-1172.25.254.10172.25.254.100虚拟服务器 (VS)OpenEuler-2172.25.254.12172.25.254.100真实服务器 (RS1)OpenEuler-3172.25.254.13172.25.254.100真实服务器 (RS2) 2. 真实服务器 (RS) 配置与优化 # 安装与配置 Nginx [rootOpe…

阅读更多...

网络安全——网络安全基础、常用网络命令

网络安全——网络安全基础、常用网络命令

网络安全基础什么是网络分层？ 张老板送王老板十箱啤酒张老板秘书收到指示，联系王老板秘书要来对方地址张老板秘书交代给张老板秘书的实习生，给这个地址发货张老板秘书的实习生联系王老板秘书的实习生要来收件人联系方式 …

阅读更多...

Task03:Ollama API 的使用

Task03:Ollama API 的使用

Ollama API 使用指南简介 Ollama 提供了强大的 REST API，使开发者能够方便地与大语言模型进行交互。通过 Ollama API，用户可以发送请求并接收模型生成的响应，应用于自然语言处理、文本生成等任务。本文将详细介绍生成补全、对话生成的基本…

阅读更多...

Vue 实现主题切换（明暗）

Vue 实现主题切换（明暗）

项目地址：https://gitee.com/abcdfdewrw/vue3_xiaohongshu_project 效果展示： 步骤1：定义明暗scss样式 // 浅色模式 html[data-theme"light"]:root {--header-height: 72px;--color-border-bottom: #eef2f9;--color-primary-lab…

阅读更多...

登录弹窗效果

登录弹窗效果

1，要求点击登录按钮，弹出登录窗口提示1：登录窗口 display:none 隐藏状态； 提示2：登录按钮点击后，触发事件，修改 display:block 显示状态提示3：登录窗口中点击关闭按钮&#xff0…

阅读更多...

[免费]Springboot+Vue医疗(医院)挂号管理系统【论文+源码+SQL脚本】

[免费]Springboot+Vue医疗(医院)挂号管理系统【论文+源码+SQL脚本】

大家好，我是java1234_小锋老师，看到一个不错的SpringbootVue医疗(医院)挂号管理系统，分享下哈。项目视频演示【免费】SpringBootVue医疗(医院)挂号管理系统 Java毕业设计_哔哩哔哩_bilibili 项目介绍在如今社会上，关于信息上…

阅读更多...

Python 自然语言处理（NLP）和文本挖掘的常规操作过程

Python 自然语言处理（NLP）和文本挖掘的常规操作过程

Python 自然语言处理（NLP）和文本挖掘自然语言处理（NLP）和文本挖掘是数据科学中的重要领域，涉及对文本数据的分析和处理。Python 提供了丰富的库和工具，用于执行各种 NLP 和文本挖掘任务。以下是一些常见的…

阅读更多...

最新文章