“草图转移”从细节不变性中汲取理解

news/2025/2/5 6:42:06/

来自Mila和Google Brain的一组研究人员认为,简单的铅笔草图可以帮助AI模型更好地理解看不见的图像。

深度神经网络在实际的感知任务中表现出色,并且它们会变得越来越强大。正如斯坦福大学 2019 年人工智能指数所指出的那样:“在云基础设施上训练大型图像分类系统所需的时间已从 2017 年 10 月的大约 3 小时下降到 2019 年 7 月的大约 88 秒。

然而,智能机器能够泛化到模型训练中看不到的变化,这仍然远远不能达到人类的能力。 人类很快就学会了发现突出的品质,而不是看小事。例如,即使没有许多视觉细节,我们也可以识别和理解卡通人物。机器学习算法无法以这种方式泛化,除非它们经过明确的训练。
在这里插入图片描述
在一篇新论文中,Mila和Google Brain的研究人员引入了一个“SketchTransfer”数据集和任务,其中神经网络根据它们能够在没有明确监督的情况下学习的抽象质量进行评估。
在这里插入图片描述
SketchTransfer 训练数据集包括来自 CIFAR-10 数据集的标记真实图像和来自快速绘制的未标记草图图像!青蛙、鸟、猫、狗、汽车、飞机等类别中的数据集。

SOTA模型的任务是识别和分类草图中的对象,同时仅提供真实图像的标签。这项任务具有挑战性,例如,狗和猫之间唯一可用的明显差异可能是鼻子或耳朵的形状。但是,神经网络不会像人类那样对图像进行分类,而是可能不会立即找到这种明显而独特的特征。
在这里插入图片描述
研究人员观察到,在MNIST到SVHN传输中得分超过95%的SOTA技术只能在SketchTransfer任务中管理59%。虽然这比随机要好得多,但它没有达到直接在标记草图上训练的分类器的87%准确率。
在这里插入图片描述
当人类看世界时,我们忽略了大部分视觉信息,并将注意力集中在代表不变抽象的相关细节上。研究人员得出结论,用当代方法,教机器以这种基本和人性化的方式看待和理解世界是平易近人的,但“有很大的改进空间”。

SketchTransfer 为社区提供了一种新工具,用于检查深度网络及其概括抽象的能力。

论文《SketchTransfer: A Challenge New Task for Exploring Detail-Invariance and the Abstractions Learned by Deep Networks》可在arXiv上找到。


http://www.ppmy.cn/news/894771.html

相关文章

STM32F103系类芯片型号说明

STM32F103系类芯片型号说明 STM32型号的说明:以STM32F103RBT6这个型号的芯片为例,该型号的组成为7个部分,其命名规则如下: 为了便于介绍STM32F103系列芯片,将芯片名字分为两个部分:前缀STM32F103和后缀信息RCT6. ST…

STC单片机DS1307+ssd1306 oled时钟显示

STC单片机DS1307+ssd1306 oled时钟显示 📌相关篇《STC单片机DS1302+ssd1306 oled时钟显示》📍《STC单片机对DS1307读写操作》✨效果演示: 🌿实验对象:STC12C5A60S2🌿屏幕型号:I2C ssd1306 0.96“ oled🌿晶振频率:11.059MHz🌿串口波特率:9600📜串口打印读取信…

STM32F103RCT6——MPU6050使用

目录 一、MPU6050简介 1. 引脚介绍 2. 寻找SCL、SDA接口 3. 工作原理 ​编辑 二、MPU6050实现 1. STM32开发板接线 2. DMP移植 A. 新建STM32CubeMX工程 B. 移植DMP C. 调用API D. 修改报错 3. 实现结果 一、MPU6050简介 1. 引脚介绍 只需要接4个引脚,…

DS1302/GC1302/1302系列时钟芯片驱动程序注意事项解析数据手册

DS1302/GC1302/1302系列时钟芯片驱动程序&注意事项&解析数据手册 一、简介 概述 工作原理 二、硬件连接三、驱动程序 1、引脚配置&初始化 2、命令&寄存器 3、写入一个字节 4、读出一个字节 5、其他应用函数 BCD转换 写入默认时间 读出时间 main.c 结…

STM32F103硬件I2C

I2C通信协议是比较常见且常用的一种串行同步半双工通信协议;在单片机开发中,很多独立的功能模块采用I2C通信协议,其通信原理及过程这里就不过多的介绍。 在学习I2C的过程中,通常都会根据其时序图,编写代码通过软件方式…

使用stm32f103驱动lcd1602

1. 项目需求 使用上位机发送ASCII字符,在LCD1602上能够实时显示 2. 使用到的软件和硬件 野火指南者开发板 - LCD1602液晶屏 杜邦线DAP仿真器KEIL5 3. 连线说明 4. 代码 LCD驱动代码 头文件:#ifndef __LCD_H #define __LCD_H#include "stm32f10x.h"t…

Arduino—— SSD1306 OLED IIC

Zimo3InstallFULL.zip-电信其他资源-CSDN下载https://download.csdn.net/download/u012308586/12476953 这是下载链接,上传时CSDN自动设置5个积分,没有积分的话请私信我并留下邮箱,同时把这个地址也发给我 https://download.csdn.net/downloa…

STM32f103 驱动之I2C

目录 一、简介。 (1)数据有效性 (2)开始信号和结束信号 (3)应答信号 (4)传输时序 (5)字节写模式时序 (6)页写模式时序 &#xff…