论文阅读 SimpleNet: A Simple Network for Image Anomaly Detection and Localization

devtools/2024/11/26 1:21:34/

SimpleNet: A Simple Network for Image Anomaly Detection and Localization

在这里插入图片描述
摘要:
该论文提出了一个简单且应用友好的网络(称为 SimpleNet)来检测和定位异常。SimpleNet 由四个组件组成:(1)一个预先训练的特征提取器,用于生成局部特征;(2)一个浅层特征适配器,用于将局部特征传输到目标域;(3)一个简单的异常特征生成器,通过向正常特征添加高斯噪声来伪造异常特征;(4)一个二元异常鉴别器,用于区分异常特征和正常特征。在推理过程中,异常特征生成器将被丢弃。我们的方法基于三个原则。首先,将预训练的特征转换为面向目标的特征有助于避免领域偏差。其次,在特征空间中生成合成异常更有效,因为缺陷在图像空间中可能没有太多的共性。第三,简单的鉴别器更高效、更实用。尽管 SimpleNet 很简单,但它在数量和质量上都优于以前的方法。在 MVTec AD 基准测试中,SimpleNet 实现了 99.6% 的异常检测 AUROC,与下一个最佳性能模型相比,错误率降低了 55.5%。此外,SimpleNet 比现有方法更快,在 3080ti GPU 上具有 77 FPS 的高帧率。此外,SimpleNet 在单类新颖性检测任务上表现出显着的性能改进。

在这里插入图片描述

Feature Extractor

  1. 首先使用Feature Extractor 提取图像的多级特征
  2. 产生的多级特征缩放到相同的尺度如 H 0 , W 0 H_0,W_0 H0,W0,然后将所有的特征进行合并

Feature Adaptor

We experimentally find that a single fully-connected layer yields good performance.
作者发现使用一个全连接层对获得的多级特征进行映射会更好

Anomalous Feature Generator

对上一步的Feature Adaptorj进行高斯噪声叠加,产生异常特征

Discriminator

对正常的特征和合成的特征进行判别,Discriminator就是一个两层的全连接层。

Loss

在这里插入图片描述
正常特征被判别为0.5,而异常特征被判别为-0.5,其中使用了max函数,使得模型不对对数值过度优化,即优化到0.5或者-0.5时就不会优化了。
在这里插入图片描述

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/devtools/136988.html

相关文章

Spring Boot与MyBatis-Plus的高效集成

Spring Boot与MyBatis-Plus的高效集成 引言 在现代 Java 开发中,MyBatis-Plus 作为 MyBatis 的增强工具,以其简化 CRUD 操作和无需编写 XML 映射文件的特点,受到了开发者的青睐。本篇文章将带你一步步整合 Spring Boot 与 MyBatis-Plus&…

ubuntu增加swap交换空间

论坛_开发者_技术论坛_鲲鹏_昇腾_华为 先关闭 ,否则报错 fallocate: fallocate 失败: 文本文件忙 sudo swapoff /swapfile sudo fallocate -l 8G /swapfile sudo chmod 600 /swapfile sudo mkswap /swapfile sudo swapon /swapfile sudo vim /etc/fstab 添加…

城电科技|太阳能折叠灯:点亮你的便捷之光

朋友们,今天要给你们介绍一款能让生活变得更加美好的神器 —— 太阳能折叠灯! 【超便捷折叠设计】 它就像一个百变精灵,轻松折叠起来后小巧玲珑。可以随意塞进背包的缝隙,或者放在车载储物箱里,完全不占地方&#xff…

Elasticsearch面试内容整理-安全与权限管理

在 Elasticsearch 中,安全与权限管理至关重要,特别是当系统处理敏感数据时。Elasticsearch 提供了一套全面的安全机制来确保数据的机密性、完整性和可用性。以下是 Elasticsearch 安全与权限管理的详细介绍。 安全组件概述 Elasticsearch 的安全功能由 Elastic Stack 提供的一…

【视觉SLAM】4b-特征点法估计相机运动之PnP 3D-2D

文章目录 0. 前言1. PnP求解1.1 直接线性变换DLT1.2 P3P1.3 光束平差法BA2. 实现0. 前言 透视n点(Perspective-n-Point,PnP)问题是计算机视觉领域的经典问题,用于求解3D-2D的点运动。换句话说,当知道 N N N个世界坐标系中3D空间点的坐标以及它们在图像上的投影点像素坐标…

什么是Sass,有什么特点

Sass 概述 什么是 Sass? Sass(Syntactically Awesome Style Sheets)是一种 CSS 预处理器,它扩展了 CSS 的功能,使其更加强大和灵活。Sass 允许开发者使用变量、嵌套规则、混合宏、继承等高级特性,从而编写…

输入三个整数x,y,z,请把这三个数由小到大输出。-多语言实现

目录 C 语言实现 Python 实现 Java 实现 Js 实现 题目:输入三个整数x,y,z,请把这三个数由小到大输出。 程序分析:我们想办法把最小的数放到x上,先将x与y进行比较,如果x>y则将x与y的值进行交换,然后…

10大核心应用场景,解锁AI检测系统的智能安全之道

随着工业化和自动化的快速推进,高风险作业场景的安全管理需求日益增加。思通数科AI检测系统以深度学习、计算机视觉和多模态数据融合技术为基础,通过智能化监控和实时反馈,为企业提供全面的作业安全和流程管理解决方案。本文将详细解读该系统…