[论文分享] VOS: Learning What You Don‘t Know by Virtual Outlier Synthesis

news/2024/11/28 21:42:40/

这篇文章是ICLR‘ 2022的一篇文章。

No.content
PAPER{ICLR’ 2022} VOS: Learning What You Don’t Know by Virtual Outlier Synthesis
URL论文地址
CODE代码地址

Motivation

· 现有OOD Detection方法大多依赖于真实的离群点数据集进行模型正则化,实际应用中过于昂贵,有时不可行。

· 作者认为导致OOD data效果差,主要是因为训练过程中缺少未知的知识,只在ID data上训练产生的决策边界对OOD Detection来说可能很糟糕。如图1-b所示,只用ID训练出来的分类器overconfident于远离ID data的区域(红色阴影部分),增加了OOD Detection的难度。作者认为模型应该学习一个更紧凑的决策边界,对于ID data应该有更低的不确定性,对OOD data有高的不确定性,如图1-c所示。
Figure 1

Contribution

· 提出了新的框架VOS,实现了SOTA

· VOS在feature space生成outliers的方式要比其他方法直接在高维像素空间生成的效果要好(e.g., using GAN (Lee et al., 2018a)),也优于直接使用噪声作为outliers的方法。

· 在常见的OOD Detection的benchmarks上测试了方法,还测试了一些目标检测任务。

Method

Figure 2

· 1. virtual outliers generation
假设特征表示满足多元类条件高斯分布:
p θ ( h ( x , b ) ∣ y = k ) = N ( μ k , ∑ ) p_{\theta}(h(x,\mathbb{b})|y=k)=\mathcal{N}(\mu_{k},\sum) pθ(h(x,b)y=k)=N(μk,)
提取倒数第二层网络的特征,计算当前训练样本的 μ ^ k \hat{\mu}_k μ^k ∑ ^ \hat{\sum} ^
μ ^ k = 1 N k ∑ i : y i = k h ( x I , b I ) \hat{\mu}_k=\frac{1}{N_k}\sum_{i:y_i=k}h(x_I,b_I) μ^k=Nk1i:yi=kh(xI,bI)
∑ ^ = 1 N ∑ k ∑ i : y i = k ( h ( x i , b i ) − μ ^ k ) ( h ( x i , b i ) − μ ^ k ) T \hat{\sum}=\frac{1}{N}\sum_{k}\sum_{i:y_i=k}(h(x_i,b_i)-\hat{\mu}_k)(h(x_i,b_i)-\hat{\mu}_k)^{T} ^=N1ki:yi=k(h(xi,bi)μ^k)(h(xi,bi)μ^k)T

得到高斯分布后,从特征空间采样outliers,
在这里插入图片描述
其中, ϵ \epsilon ϵ应该足够小,保证采样的点很靠近类边界。
 
· 2. uncertainty Loss
Follow Liu et al., 2020a的思路,作者基于Energy-based model在OOD Detection uncertainty measurement优秀效果的启发,设计了uncertainty Loss。思路其实就是让ID data有更低的energy,outliers有更高的能量,作者这里直接让其分别为正值和负值了。
在这里插入图片描述
进一步,得到平滑近似版本
在这里插入图片描述
相比于Liu et al., 2020a的方法,作者认为他的方法不用再设置in- and out- of distribution data的超参阈值,效果更好。

最后总的training objective如下,
在这里插入图片描述

 
· 3. virtual outliers generation
在inference过程中,使用逻辑回归不确定性分支的输出进行OOD Detection。给定输入 x ∗ x^{*} x,object detector产生 b ∗ b^{*} b。OOD Detection的不确定性分数为
在这里插入图片描述
设置阈值区分ID和OOD目标
在这里插入图片描述
VOS整体framework:
在这里插入图片描述

 
 
Reference
Weitang Liu, Xiaoyun Wang, John Owens, and Yixuan Li. Energy-based out-of-distribution detection. Advances in Neural Information Processing Systems, 2020a.
Du X, Wang Z, Cai M, et al. VOS: Learning What You Don’t Know by Virtual Outlier Synthesis[C]//International Conference on Learning Representations.


http://www.ppmy.cn/news/62993.html

相关文章

qiankun微应用之间、主微应用之间相互跳转方式总结与实践

一、子应用互相访问 1、背景 (1)未来可能需要做不同子应用菜单的合并,如在bi应用下的侧边栏或者别的地方,需要跳转到数据治理的数仓主题里,或者涉及到子应用值改变,其他应用也需要使用; &…

electron打包运行白屏、Can not find modules ‘xxx‘,Dynamic Linking Error

Can not find modules 原因:应该写在dependencies里的写在了devDependencies,或者相反。有些依赖写反了是可以运行的,但是打包不行 在Electron项目中的package.json文件中,dependencies和devDependencies都是用来声明应用程序所…

Design principle: Immutability不可变性与对mutable变量的Synchronization方法

不可变性(Immutability)在设计模式中是指一个对象在创建后其状态就不能改变。这是一种编程思想和设计原则。在某些情况下,使用不变对象可以带来许多好处: 简化代码 make things very simple:不可变对象在创建后状态不会…

linux和window下svn版本控制可视化工具

之前一直用命令行来拉取代码建立分支,推送代码等等 也不是不行,但是用久了,感觉很麻烦,后面就用了svn的版本可视化工具 linux和window下svn版本控制可视化工具 Linux环境下使用图形化界面的SVN客户端软件,那么RabbitVC…

「SQL面试题库」 No_58 游戏玩法分析 V

🍅 1、专栏介绍 「SQL面试题库」是由 不是西红柿 发起,全员免费参与的SQL学习活动。我每天发布1道SQL面试真题,从简单到困难,涵盖所有SQL知识点,我敢保证只要做完这100道题,不仅能轻松搞定面试&#xff0…

文鼎创智能物联云原生容器化平台实践

作者:sekfung,深圳市文鼎创数据科技有限公司研发工程师,负责公司物联网终端平台的开发,稳定性建设,容器化上云工作,擅长使用 GO、Java 开发分布式系统,持续关注分布式,云原生等前沿技…

@EnableFeignClients的由来

1.注解EnableFeignClients:扫描和注册feign客户端bean定义: 在Spring cloud应用中,当我们要使用feign客户端时,使用注解EnableFeignClients启用feign客户端;注解EnableFeignClients告诉框架扫描所有使用注解FeignClient定义的feig…

家里小孩要去学网络安全,网络安全行业前景到底怎么样?

最近接待了很多学生家长来咨询网络安全学习的问题。 家长们最主要关注三点:什么是网络安全?网络安全行业前景好吗?工资能拿多少?哪些专业什么学历可以学习网络安全? 那么盾叔就来综合解答一下。 什么是网络安全&…