(arxiv2411) TinyViM: Frequency Decoupling for Tiny Hybrid Vision Mamba

news/2025/2/21 16:46:20/

image-20250216215313513

论文:https://arxiv.org/abs/2411.17473

代码:https://github.com/xwmaxwma/TinyViM

作者提出了一种 Convolution-Mamba 的混合架构TinyViM,架构如下图所示。可以看出方法的核心是 Laplace Mixer。

image-20250216225004247

Laplace mixer: 作者首先通过实验,发现Mamba主要在对低频特征进行建模。比如下图中,Mamba处理后,高频特征被抑制了。为了解决这个问题,即保留高频特征,作者使用拉普拉斯金字塔的方法来分解特征的高频和低频,低频部分使用Mamba处理,高频部分使用卷积处理。这样分离高低频的思路在很多论文中有应用。

image-20250216222622405

Frequency Ramp Inception: 众所周知,深度神经网络的浅层主要是提取细节信息,深层主要是提取全局信息。因此有必要在网络不同阶段调节高低频的比例。因此,作者使用 Frequency Ramp Inception,就是随网络加深,逐渐增加低频成分的比例,提高性能。作者有一个消融实验,表明低频比例在四个阶段分别取 [0.25, 0.50, 0.50, 0.75]时性能较好。

其它部分可以参考作者论文,这里不过多介绍。


http://www.ppmy.cn/news/1572783.html

相关文章

算法学习笔记之贪心算法

导引(硕鼠的交易) 硕鼠准备了M磅猫粮与看守仓库的猫交易奶酪。 仓库有N个房间,第i个房间有 J[i] 磅奶酪并需要 F[i] 磅猫粮交换,硕鼠可以按比例来交换,不必交换所有的奶酪 计算硕鼠最多能得到多少磅奶酪。 输入M和…

高效构建与配置高可用负载均衡集群:从理论到实践的全面实施

1. 主机配置 主机IPVIP角色本机客户端OpenEuler-1172.25.254.10172.25.254.100虚拟服务器 (VS)OpenEuler-2172.25.254.12172.25.254.100真实服务器 (RS1)OpenEuler-3172.25.254.13172.25.254.100真实服务器 (RS2) 2. 真实服务器 (RS) 配置与优化 # 安装与配置 Nginx [rootOpe…

网络安全——网络安全基础、常用网络命令

网络安全基础 什么是网络分层? 张老板送王老板十箱啤酒 ​ 张老板秘书收到指示,联系王老板秘书要来对方地址 ​ 张老板秘书交代给张老板秘书的实习生,给这个地址发货 ​ 张老板秘书的实习生联系王老板秘书的实习生要来收件人 联系方式 …

Task03:Ollama API 的使用

Ollama API 使用指南 简介 Ollama 提供了强大的 REST API,使开发者能够方便地与大语言模型进行交互。通过 Ollama API,用户可以发送请求并接收模型生成的响应,应用于自然语言处理、文本生成等任务。本文将详细介绍生成补全、对话生成的基本…

Vue 实现主题切换(明暗)

项目地址:https://gitee.com/abcdfdewrw/vue3_xiaohongshu_project 效果展示: 步骤1:定义明暗scss样式 // 浅色模式 html[data-theme"light"]:root {--header-height: 72px;--color-border-bottom: #eef2f9;--color-primary-lab…

登录弹窗效果

1,要求 点击登录按钮,弹出登录窗口 提示1:登录窗口 display:none 隐藏状态; 提示2:登录按钮点击后,触发事件,修改 display:block 显示状态 提示3:登录窗口中点击关闭按钮&#xff0…

[免费]Springboot+Vue医疗(医院)挂号管理系统【论文+源码+SQL脚本】

大家好,我是java1234_小锋老师,看到一个不错的SpringbootVue医疗(医院)挂号管理系统,分享下哈。 项目视频演示 【免费】SpringBootVue医疗(医院)挂号管理系统 Java毕业设计_哔哩哔哩_bilibili 项目介绍 在如今社会上,关于信息上…

Python 自然语言处理(NLP)和文本挖掘的常规操作过程

Python 自然语言处理(NLP)和文本挖掘 自然语言处理(NLP)和文本挖掘是数据科学中的重要领域,涉及对文本数据的分析和处理。Python 提供了丰富的库和工具,用于执行各种 NLP 和文本挖掘任务。以下是一些常见的…