Edge论文的创新点

server/2024/10/17 22:06:03/

创新点及其来源

1. 从灰度边缘重建RGB图像的方法(EdgRec)

  • 基于的方法:传统的重建方法,如使用自动编码器或生成模型来重建正常样本的图像,并通过对原始图像和重建图像的比较来检测异常。

    • 重建过程:
    • 训练阶段:
      使用正常图像训练一个重建模型,如自动编码器。
      模型学习如何捕捉正常图像的特征,并尝试在没有任何异常的情况下重建这些图像。
    • 重建目标:
      在理想情况下,模型应该能够准确地重建训练时使用的正常图像。
      这意味着,如果输入的是正常图像,模型输出的重建图像应该与输入图像非常相似。
    • 异常检测
      当模型被训练好之后,我们使用它来处理两种类型的图像:
      正常图像:
      如果输入的是正常图像,模型应该能够重建出与输入图像非常相似的图像,因为模型已经学习了正常图像的特征。
      异常图像:
      如果输入的是包含异常的图像,模型通常无法准确地重建这些图像,因为异常区域的特征与模型训练时学习的正常特征不同。
      因此,重建的图像与原始异常图像之间的差异可以用来检测和定位异常区域。
      使用像素级的距离度量(如L2距离或结构相似性SSIM)来评估重建误差。
  • 存在的问题:传统重建方法难以控制模型泛化能力的边界。模型泛化能力过强可能导致异常区域也被很好地重建,而泛化能力不足则无法重建正常区域中的高频变化部分,导致误报。
    在这里插入图片描述

  • 创新点:提出从灰度边缘重建RGB图像的方法。通过UNet型去噪自编码器和跳跃连接来重建图像,这样可以保留原始图像中的高频信息,并迫使网络记忆正常区域的低频和颜色信息。去噪设计可以防止模型直接复制原始的高频组件。


对照图像详细说明

训练阶段(Training)
Encoder
  • 功能:将原始图像转换成灰度边缘表示。
  • 创新点:不是直接使用原始图像的全部信息,而是转换成一种更简化的表示形式,即灰度边缘图像。这一步骤迫使网络必须学习如何从较少的信息中恢复出丰富的细节。
Decoder
  • 功能:从灰度边缘表示中重建出原始的RGB图像。
  • 创新点:网络需要学习如何从简化的边缘信息中恢复出完整的图像细节,这要求网络必须学习到正常图像的深层次特征。
Loss
  • 功能:衡量重建图像与原始图像之间的差异。
  • 创新点:损失函数不仅包括传统的像素级误差(如L2损失),还可能包括结构相似性(SSIM)损失,以确保重建图像在结构上与原始图像保持一致。
Back propagation
  • 功能:基于损失函数的结果,通过网络的反向传播来更新模型的权重。
  • 目的:使得模型在后续的训练中能够更好地重建图像。
测试阶段(Testing)
Encoder
  • 功能:在测试阶段,编码器同样将输入图像转换成灰度边缘表示。
  • 一致性:表明模型在测试时也依赖于从灰度边缘信息中提取特征。
Decoder
  • 功能:尝试从灰度边缘表示中重建出RGB图像。
  • 检测原理:如果输入图像包含异常,解码器将无法准确地重建出原始图像,因为异常区域的灰度边缘与模型在训练阶段学到的正常边缘不同。
Comparing Function
  • 功能:评估原始图像和重建图像之间的差异,从而检测出异常区域。
  • 创新点:这个比较函数不仅考虑了像素级的差异,还结合了颜色和梯度差异,以更准确地检测异常区域。
图解创新点

从图中的“Encoder”和“Decoder”部分,我们可以看到从灰度边缘重建RGB图像的过程。这一过程体现了EdgRec方法的核心创新,即利用简化的灰度边缘信息来迫使网络学习如何重建出完整的RGB图像,从而在异常检测任务中实现更高的准确性和鲁棒性。

  • 效果:在MVTec AD基准测试中达到了97.8%的检测率和97.7%的定位率(AUROC)。

2. 结合颜色和梯度差异的异常评估函数

  • 基于的方法:像素级的L2距离或结构相似性(SSIM)比较原始和重建的图像。

    • 过程:
      1. 使用像素级的L2距离或SSIM来比较原始和重建的图像。
      2. 通过比较结果来生成异常图。
  • 存在的问题:直接使用像素级的L2距离比较可能会在重建过程中造成正常区域的退化,导致误报。

  • 创新点:提出结合颜色和梯度差异的异常评估函数。新的颜色评估函数在CIELAB颜色空间中评估颜色差异,而结构差异评估则利用多尺度梯度幅度相似性(MSGMS)。这种结合可以有效检测颜色异常,并且对光照变化不敏感。

  • 效果:在MVTec AD和MVTec 3D-AD数据集上都取得了有说服力的结果,并且使用RGB图像仅用于2D检测问题。

总结

本文提出的创新点在于从灰度边缘重建RGB图像的方法和结合颜色与梯度差异的异常评估函数,这些创新使得模型在工业表面异常检测任务中取得了显著的性能提升,同时保持了方法的可解释性和可调整性。


http://www.ppmy.cn/server/132591.html

相关文章

大数据面试题整理——Zookeeper

系列文章目录 大数据面试题专栏点击进入 文章目录 系列文章目录大数据面试题专栏点击进入 1. 什么是 Zookeeper?2. Zookeeper 的特点有哪些?3. Zookeeper 的数据模型是怎样的?4. Zookeeper 的工作流程是怎样的?5. Zookeeper 如何…

ROS理论与实践学习笔记——6 ROS机器人导航(仿真)之导航实现

准备工作&#xff1a;请先安装相关的ROS功能包 安装 gmapping 包(用于构建地图):sudo apt install ros-<ROS版本>-gmapping 安装地图服务包(用于保存与读取地图):sudo apt install ros-<ROS版本>-map-server 安装 navigation 包(用于定位以及路径规划):sudo apt in…

第十四章 RabbitMQ延迟消息之延迟队列

目录 一、引言 二、死信队列 三、核心代码实现 四、运行效果 五、总结 一、引言 什么是延迟消息&#xff1f; 发送者发送消息时指定一个时间&#xff0c;消费者不会立刻收到消息&#xff0c;而是在指定时间后收到消息。 什么是延迟任务&#xff1f; 设置在一定时间之后才…

大数据-174 Elasticsearch Query DSL - 全文检索 full-text query 匹配、短语、多字段 详细操作

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff08;已更完&#xff09;HDFS&#xff08;已更完&#xff09;MapReduce&#xff08;已更完&am…

JIT详解

文章目录 JIT为什么说 Java 语言“编译与解释并存”&#xff1f; JIT原理JVM 架构简览JIT 编译流程JIT 编译器的实现优化策略方法内联逃逸分析 JIT 在Java中&#xff0c;JIT&#xff08;Just-In-Time&#xff09;编译器是Java虚拟机&#xff08;JVM&#xff09;的一个重要组成…

LeetCode第239题:滑动窗口k内求最大值

来源&#xff1a;LeetCode第239题 难度&#xff1a;困难 给你一个整数数组 nums&#xff0c;有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 这段代码实现了 滑动窗口最大值 的问题&#xff…

Android常用界面控件——ImageView

目录 1 ImageView 1.1在XML 中定义ImageView&#xff1a; 1.1.1 ImageView常用XML属性 1.1.2 ImageView ScaleType用法 1.2 在Java代码中控制ProgressBar&#xff1a; 1.3 区别总结 1.3.1 应用场景选择建议 1 ImageView ImageView&#xff0c;图像视图&#xff0c;直接…

群晖前面加了雷池社区版,安装失败,然后无法识别出用户真实访问IP

有nas的相信对公网都不模式&#xff0c;在现在基础上传带宽能有100兆的时代&#xff0c;有公网代表着家里有一个小服务器&#xff0c;像百度网盘&#xff0c;优酷这种在线服务都能部署为私有化服务。但现在运营商几乎不可能提供公网ip&#xff0c;要么自己买个云服务器做内网穿…