Google FixMatch:SOTA 在半监督学习基准测试中的性能

news/2025/2/15 22:20:16/

作为当前计算机视觉应用的首选,深度网络通常通过监督学习(一种需要标记数据集的方法)来实现其强大的性能。尽管人工智能多年来取得了许多成就和进步,但标记数据的关键任务仍然落在人类专家身上。他们很难满足那些数据饥渴的深度网络的需求。

2023-08-12T08:58:09.png

专家短缺的一个解决方案是减少模型对标记数据的依赖。半监督学习(SSL)旨在通过在模型训练期间提出使用未标记数据的方法来实现这一目标。而且由于未标记的数据通常可以用最少的人力获得,因此SSL的性能提升成本相对较低。

谷歌研究院的一个团队本周推出了FixMatch,这是一种结合了两种常见深度网络SSL方法的算法:伪标签(又名自我训练)和一致性正则化。伪标记有效地使用模型的类预测作为要训练的标签。同时,一致性正则化假设模型在馈送同一图像的扰动版本时应输出类似的预测。

虽然 FixMatch 看起来只是现有技术的简单组合,但它在各种标准的半监督学习基准测试中实现了 SOTA 性能,包括在 CIFAR-94 上具有 93 个标签的准确率为 10.250%,在 88 个标签(每个类只有四个标签)上达到 61.40% 的准确率。

FixMatch 首先使用模型对弱增强的未标记图像的预测生成伪标签。对于给定图像,仅当模型生成高置信度预测时,才会保留伪标签。然后训练模型以在馈送同一图像的强增强版本时预测伪标签。

“我们还展示了FixMatch如何开始弥合低标签半监督学习和少镜头学习甚至聚类之间的差距:我们在每个类只有一个标签的情况下获得了惊人的高准确性,”论文合著者解释说。

由于FixMatch的简单性,研究人员能够调查该算法的几乎所有方面,以探索它如何以及为什么如此有效。他们发现,为了获得良好的结果,特别是在有限标签设置中,某些以前被低估的设计选择——比如权重衰减或优化器的选择——实际上对提高模型性能非常有帮助。

论文FixMatch: Compplizing Semi-Supervised Learning with Consistency and Confidence发表在arXiv上。该代码可在项目 GitHub 上找到。


http://www.ppmy.cn/news/1036148.html

相关文章

第二十三章 参考 - HL7业务服务的设置- DocTypeResolution

文章目录 第二十三章 参考 - HL7业务服务的设置- DocTypeResolutionDocTypeResolutionOverride Segment TerminatorFraming 第二十三章 参考 - HL7业务服务的设置- DocTypeResolution DocTypeResolution 指定如何根据 MSH:9 中的消息类型解析 DocType。选择以下选项之一&…

MySQL数据库——SQL(1)-SQL通用语法、SQL分类、DDL(数据库操作、表操作)

目录 SQL通用语法 SQL分类 DDL 数据库操作 表操作-查询 1.查询当前数据库所有表 2.查询表结构 3.查询指定表的建表语句 表操作-创建 表操作-数据类型 数值类型 字符串类型 日期类型 DDL小案例 表操作-修改&删除 1.添加字段 2. 修改数据类型 3.修改字段名和…

系统学习Linux-MongoDB

概述 mongodb是一个nosql数据库,它有高性能、无模式、文档型的特点。是nosql数据库中功能最丰富,最像关系数据库的。数据库格式为BSON 相关概念实例:系统上运行的mongodb的进程,类似于mysql实例;库:每个数…

windows11下配置vscode中c/c++环境

本文默认已经下载且安装好vscode,主要是解决环境变量配置以及编译task、launch文件的问题。 自己尝试过许多博客,最后还是通过这种方法配置成功了。 Linux(ubuntu 20.04)配置vscode可以直接跳转到配置task、launch文件,不需要下载mingw与配…

HTTP协议详细介绍

HTTP协议详细介绍 1. 一.概述 HTTP(HyperText Transfer Protocol):超文本传输协议,是一种允许通讯双方的一端获取资源 (如 HTML 文档)的协议。它是互联网上任何数据交换的基础,属于 C/S(客户端/服务器)协议, 这意味着请求是由接收…

JavaScript实现在线Excel的附件上传与下载

摘要:本文由葡萄城技术团队于CSDN原创并首发。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 前言 在本地使用Excel时,经常会有需要在Excel中添加一些附件文件的需求&am…

计蒜客T1126——单词倒排

超级水的一道题&#xff0c;和T1122类似但更简单&#xff0c;分割后逆序输出即可~ 题干&#xff1a; #include <iostream> #include <string> #include <vector> using namespace std;int main(int argc, char** argv) {string S;vector<string> V;get…

Linux文件权限一共10位长度,分成四段

Linux文件权限一共10位长度,分成四段 Linux文件权限 1、 文件aaa的访问权限为rw-r--r--,现要增加所有用户的执行权限和同组用户的写权限&#xff0c;下列哪些命令是正确的&#xff1f; a) chmod ax gw aaa √ b) chmod 764 aaa c) chmod 775 aaa √ d)…