42. MAE(Masked Autoencoders Are Scalable Vision Learners)

devtools/2025/3/15 13:02:32/

文章目录

  • 1. MAE说明
  • 2. MAE笔记

1. MAE说明

MAE 是何凯明大神的基于随机自掩码机制的新神经网络,主要分为Encoder编码器结构+Assemble部分+Decoder解码器结构三个部分,

  • Encoder 部分
    encoder部分是先将输入图像patch化后,将75%的patch块进行掩码遮掩,分成25%原图patch和75%的掩码patch
    • 25%的patch块A-- 隐性表征
      将块A重新堆叠形成新的矩阵A1后,通过神经网络映射成新的隐性表征A2
    • 75%的patch块B-- 隐性表征
      用同一个相同的向量表示每个被掩码的patch块,就有75%的patch通过神经网络映射成新的表征B2
  • Assemble部分
    • 将25%的隐性表征A2和75%的隐性表征B2按照原图像的位置编码重新组合成新的矩阵C
  • Decoder部分
    decoder部分是将隐性表征矩阵C通过decoder解码器映射成新的表征矩阵D,最后通过神经网络恢复成新的预测图像

2. MAE笔记

MAE 编码器自掩码扩展网络

  1. step1: 将输入图像进行patch分块处理,并通过均匀分布来将75%的Patch块进行掩码遮掉处理

  2. step2: 将剩下的25%未被掩码块组成新的矩阵后,拉成一个矩阵A后进行映射成新的隐藏表征

  3. step3: 将被掩码的75%的块映射后用同一个可学习的向量进行表征

  4. step4: 将25%未被掩码的表征向量和 75%可学习的相同的表征向量一起,根据原来的位置编码来组合成新的表征矩阵进入decoder解码器

  5. step5: 将decoder 生成新的解码特征向量通过逆块unpatch的方式重新生成新的图像
    在这里插入图片描述


http://www.ppmy.cn/devtools/167294.html

相关文章

高级java每日一道面试题-2025年2月18日-数据库篇-MySQL 如何做到高可用方案?

如果有遗漏,评论区告诉我进行补充 面试官: MySQL 如何做到高可用方案? 我回答: 在Java高级面试中,讨论MySQL如何实现高可用性方案是一个重要话题。这不仅涉及到数据库的稳定性和可靠性,还关系到系统的整体性能和用户体验。以下是结合提供的信息进行综…

17.使用读写包操作Excel文件:pyxlsb 包

一 pyxlsb 的介绍 如果你要读取二进制的 xlsb 格式的 Excel 文件,那么 pyxlsb 就成了唯一选择。 .xlsb 是 Excel 的二进制文件格式,专为高效存储和快速读取设计。 pyxlsb 是一个专门用于读取 .xlsb 文件的 Python 库,但不支持写入。 二 如何使…

SpringCloud带你走进微服务的世界

认识微服务 随着互联网行业的发展,对服务的要求也越来越高,服务架构也从单体架构逐渐演变为现在流行的微服务架构。这些架构之间有怎样的差别呢? 单体架构 单体架构:将业务的所有功能集中在一个项目中开发,打成一个…

前端性能优化指南

一、快速启动项目 1.1基础Webpack配置 // webpack.config.js module.exports {mode: production, // 生产模式自动压缩代码devtool: source-map, // 生成源码映射方便调试optimization: {splitChunks: {chunks: all, // 自动拆分第三方库代码minSize: 20000 /…

ASL集睿致远 CS5265AN typec转hdmi4k60hz方案

CS5265 是ASL集睿致远推出的一款高性能 Type-C/DP1.4 至 HDMI2.0b 转换器 IC,可将 USB Type-C 源或 DP1.4 源连接至 HDMI2.0b 接收器,实现 USB TYPE-C 转 HDMI 数据的音视频转换234。 特点及优势 高集成度:单芯片集成了 DP1.4 兼容接收机、…

QT编程之JSON处理

一、核心类库及功能 Qt 提供了一套完整的 JSON 处理类库(位于 QtCore 模块),支持解析和生成 JSON 数据: ‌QJsonDocument‌:表示完整的 JSON 文档,支持从 QJsonObject 或 QJsonArray 初始化‌。‌QJsonOb…

虚拟展览馆小程序:数字艺术与文化展示的新形式探索

虚拟展览馆小程序:数字艺术与文化展示的新形式探索 一、传统展览的痛点:物理空间的局限与数字化的必然 在传统的艺术与文化展览中,观众往往需要跨越地理距离、排队数小时才能进入展馆,而许多珍贵展品因保护需求无法长期展出。数据显示,全球90%以上的博物馆藏品常年沉睡于…

39. HarmonyOS NEXT Layout布局组件系统详解(六):偏移功能实现

温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! HarmonyOS NEXT Layout布局组件系统详解(六):偏移功能实现 文章目录 HarmonyOS NEXT Layout布局组件系统详解&a…